Ogólne równania estymujące

Procedura ogólnych równań estymujących rozszerza ogólny model liniowy w taki sposób, że pozwala na analizę powtarzanych pomiarów lub innych skorelowanych obserwacji, takich jak dane zgrupowane.

Przykład. Instytucja zdrowia publicznego może użyć ogólnych równań estymujących w celu dopasowania regresji logistycznej z powtarzanymi pomiarami w ramach badania wpływu zanieczyszczenia atmosfery na zdrowie dzieci.

Uogólnione równania estymujące: Zagadnienia dotyczące danych

Dane. Odpowiedź może być zmienną ilościową, liczebnościową, binarną lub określającą zdarzenia w próbach. Zakłada się, że czynniki są jakościowe. Przyjmuje się, że współzmienne, waga parametru skali i przesunięcie są ilościowe. Zmiennych definiujących obiekty lub pomiary powtarzane w ramach jednego obiektu nie można używać do definiowania odpowiedzi, ale mogą one pełnić inne role w modelu.

Założenia. Zakłada się, że obserwacje są zależne w ramach obiektów i niezależne między obiektami. Jako część modelu szacowana jest macierz korelacji odzwierciedlająca zależności w ramach obiektów.

Uzyskiwanie uogólnionych równań estymujących

Ta funkcja wymaga Custom Tables and Advanced Statistics.

Z menu wybierz:

Analiza > Uogólnione modele liniowe > Generalized Szacowanie równań ...

  1. Wybierz jedną lub więcej zmiennych obiektowych (dodatkowe opcje opisano poniżej).

    Kombinacja wartości wybranych zmiennych powinna jednoznacznie definiować obiekty w zbiorze danych. Na przykład jedna zmienna ID pacjenta powinna wystarczyć do definicji obiektów w jednym szpitalu. Jednak jeśli w różnych szpitalach pacjenci nie mają nadawanych różnych identyfikatorów, konieczne może być połączenie zmiennych ID szpitala i ID pacjenta. Przy wielokrotnych pomiarach dla każdego obiektu zapisywane są wielokrotne obserwacje. Z tego powodu jeden obiekt może być w zbiorze danych przedstawiany w wielu obserwacjach.

  2. Na karcie Typ modelu określ funkcję dystrybucji i łączenia.
  3. Na karcie Odpowiedź wybierz zmienną zależną.
  4. Na karcie Predyktory wybierz czynniki i współzmienne, które mają być używane w predykatach zmiennej zależnej.
  5. Na karcie Model określ efekty modelu, korzystając z wybranych czynników i współzmiennych.

Opcjonalnie na karcie Powtórzone można określić:

Zmienne wewnątrzobiektowe. Kombinacja wartości zmiennych wewnątrzobiektowych definiuje kolejność pomiarów w obiektach. Zatem połączenie zmiennych obiektu i wewnątrzobiektowych stanowi unikatową definicję każdego pomiaru. Na przykład połączenie zmiennych Okres, ID szpitala i ID pacjenta definiuje dla każdego przypadku określoną wizytę w gabinecie, złożoną przez określonego pacjenta w określonym szpitalu.

Nie jest konieczne określanie zmiennej wewnątrzobiektowej, jeśli zbiór danych jest już posortowany i pomiary dotyczące każdego obiektu stanowią jeden ciągły, prawidłowo ułożony zbiór obserwacji; w takim przypadku można anulować wybór opcji Sortuj obserwacje wg zmiennych obiektowych i wewnątrzobiektowych i zaoszczędzić czas, eliminując konieczność (tymczasowego) sortowania. Z reguły wskazane jest wykorzystanie zmiennych wewnątrzobiektowych do zapewnienia prawidłowego uporządkowania pomiarów.

Obiektów w zmiennych wewnątrzobiektowych nie można używać do definiowania odpowiedzi, ale mogą one pełnić inne funkcje w modelu. Na przykład zmiennej ID szpitala można użyć jako czynnika w modelu.

Macierz kowariancji. Estymator na podstawie modelu jest uogólnioną odwrotnością macierzy Hessego ze zmienionym znakiem. Estymator odporny (nazwany także estymatorem Hubera/White/typu sandwich) jest „skorygowanym" estymatorem na podstawie modelu, który zapewnia spójne oszacowanie kowariancji nawet w sytuacji, gdy robocza macierz korelacji jest nieprawidłowo określona. Ta specyfikacja ma zastosowanie do parametrów w części modelu liniowego uogólnionych równań szacowania, natomiast specyfikacja na karcie Szacowanie dotyczy tylko początkowego uogólnionego modelu liniowego.

Robocza macierz korelacji. Ta macierz korelacji przedstawia zależności wewnątrzobiektowe. Jej rozmiar jest określany przez liczbę pomiarów, czyli przez liczbę połączeń wartości zmiennych wewnątrzobiektowych. Można wybrać jedną z poniższych struktur:

  • Niezależne. Powtarzane pomiary są nieskorelowane.
  • AR (1). Powtarzane pomiary wykazują relację autoregresyjną pierwszego rzędu. Korelacja między dwoma elementami odpowiada rho dla sąsiednich elementów, rho2 dla elementów oddzielonych jednym elementem itd. jest ograniczone, tak że –1<<1.
  • Wymienne. Struktura ma jednorodne korelacje między elementami. Znana również jako struktura symetrii złożonej.
  • M-zależna. Kolejno następujące po sobie pomiary mają wspólny współczynnik korelacji, pary pomiarów oddzielone trzecim pomiarem mają wspólny współczynnik korelacji itd., dla wszystkich par pomiarów oddzielonych m-1 innymi pomiarami. Załóżmy na przykład, że co roku uczniowie w klasach od 3. do 7. piszą zestandaryzowany test. W takiej strukturze zakłada się, że oceny klasy 3. i 4., 4. i 5., 5. i 6. oraz 6. i 7. będą miały tę samą korelację; podobnie oceny klasy 3. i 5, 4. i 6. oraz 5. i 7. będą miały tę samą korelację; jak również oceny klasy 3. i 6. oraz 4. i 7. będą miały tę samą korelację. Zakłada się, że pomiary oddzielone więcej niż m innymi pomiarami są nieskorelowane. Wybierając tę strukturę, należy określić wartość m mniejszą od rzędu roboczej macierzy korelacji.
  • Nieustrukturyzowane. Jest to w pełni ogólna macierz kowariancji.

Domyślnie procedura skoryguje oszacowania korelacji o liczbę nienadmiarowych parametrów. Usunięcie tej korekty może być pożądane, jeśli chcemy, by oszacowania były niezmienne względem zmian replikacji na poziomie obiektów.

  • Maksymalna liczba Iteracji. Maksymalna liczba iteracji, jakie wykona algorytm ogólnych równań estymujących. Podaj nieujemną liczbę całkowitą. Ta specyfikacja ma zastosowanie do parametrów w części modelu liniowego uogólnionych równań szacowania, natomiast specyfikacja na karcie Szacowanie dotyczy tylko początkowego uogólnionego modelu liniowego.
  • Aktualizuj macierz. Elementy w roboczej macierzy korelacji są szacowane na podstawie oszacowań parametrów, które są aktualizowane w każdej iteracji algorytmu. Jeśli robocza macierz korelacji w ogóle nie zostanie zaktualizowana, to w całym procesie estymacji używana jest początkowa robocza macierz korelacji. Jeśli macierz jest aktualizowana, można określić interwał iteracji, od którego będzie zależeć częstotliwość aktualizacji elementów roboczej macierzy korelacji. Określenie wartości większej od 1 może przyspieszyć przetwarzanie.

Regresja logistyczna: Kryteria zbieżności. Specyfikacje te mają zastosowanie do parametrów w części modelu liniowego uogólnionych równań estymacyjnych, natomiast specyfikacja na karcie Szacowanie dotyczy tylko początkowego uogólnionego modelu liniowego.

  • Zbieżność parametru. Po zaznaczeniu tej opcji algorytm zatrzymuje się, gdy bezwzględna lub względna zmiana oszacowania parametru jest mniejsza od określonej wartości, która musi być dodatnia.
  • Zbieżność Hessego. Zakłada się istnienie zbieżności, jeśli statystyka oparta na macierzy Hessego jest mniejsza niż określona wartość, która musi być dodatnia.

Ta procedura służy do wkleiania składni komendy GENLIN .