Węzeł Model Coxa

Regresja Coxa tworzy model predykcyjny dla danych w czasie do zdarzenia. Model generuje funkcję przeżycia przewidującą prawdopodobieństwo, że zdarzenie będące przedmiotem zainteresowania wystąpiło w określonym czasie (t) dla danych wartości zmiennych predyktora. Kształt funkcji przeżycia i współczynniki regresji dla predyktorów są szacowane na podstawie obserwowanych obiektów; model może być następnie zastosowany do nowych obserwacji, które zawierają pomiary dla zmiennych predyktora. Należy zauważyć, że informacje z ocenzurowanych obiektów, czyli takich, które nie są przedmiotem zainteresowania podczas obserwacji, są przydatne podczas szacowania modelu.

Przykład. W ramach strategii zapobiegania odejściom klientów, operator telekomunikacyjny jest zainteresowany modelowaniem „czasu do odejścia” w celu określenia czynników charakterystycznych dla klientów, którzy szybko zmieniają operatora. W tym celu wybierana jest losowa próba klientów i z bazy danych pobierane są informacje o czasie współpracy (od jak dawna są lub jak długo byli klientami — w przypadku klientów już nieaktywnych) oraz różne dane demograficzne.

Wymagania. W węźle Model Coxa potrzebna jest dokładnie jedna zmienna przewidywana oraz zmienna czasu przeżycia. Zmienna przewidywana powinna być zakodowana w taki sposób, aby wartość „fałsz” oznaczała przeżycia, a wartość „prawda” oznaczała wystąpienie interesującego nas zdarzenia; zmienna ta musi mieć poziom pomiaru Flaga i być składowana jako łańcuch lub liczba całkowita. (W razie potrzeby sposób składowania można przekształcić za pomocą węzła wypełniania lub węzła wyliczeń ). Zmienne o roli Łącznie lub Brak są ignorowane. Typy zmiennych używanych w modelu muszą być w pełni zrealizowane jako instancje. Czas przeżycia może być dowolnym polem liczbowym.
Uwaga: Jeśli puste łańcuchy w zmiennych jakościowych służą jako dane wejściowe do budowy modelu, podczas oceniania modelu regresji Coxa zostaje zgłoszony błąd. Nie należy używać pustych łańcuchów jako danych wejściowych.

Data i czas. Pola typu Data i czas nie mogą być używane bezpośrednio do określenia czasu przeżycia. Jeśli dostępne są zmienne Data i czas, należy wykorzystać je do utworzenia zmiennej zawierającej czasy przeżycia jako różnicę między datą wprowadzenia do badania a datą obserwacji.

Analiza Kaplana-Meiera. Regresję Coxa można stosować bez zmiennych wejściowych. Jest ona wówczas równoważna analizie Kaplana-Meiera.