Uogólnione liniowe modele mieszane

Uogólnione liniowe modele mieszane rozszerzają model liniowy w następujący sposób:

  • Zmienna przewidywana jest związana liniowo z czynnikami i współzmiennymi za pomocą określonej funkcji łączenia.
  • Zmienna przewidywana może mieć rozkład inny niż normalny.
  • Obserwacje mogą być skorelowane.

Uogólnione liniowe modele mieszane obejmują szeroki wachlarz modeli, począwszy od prostych modeli regresji liniowej, aż po złożone wielopoziomowe modele dla danych z obserwacji długofalowych nieposiadających rozkładu normalnego.

Przykłady. Rada szkoły dzielnicowej może używać uogólnionego liniowego modelu mieszanego w celu ustalenia, czy eksperymentalna metoda nauczania skutecznie poprawia wyniki z matematyki. Uczniowie z tej samej klasy powinni zostać skorelowani, ponieważ są nauczani przez tego samego nauczyciela, a klasy w tej samej szkole również mogą być skorelowane, co umożliwia nam uwzględnienie efektów losowych na poziomie szkoły i klasy w celu uwzględnienia różnych źródeł zmienności.

Badacze pracujący w dziedzinach medycznych mogą używać uogólnionego liniowego modelu mieszanego w celu ustalenia, czy nowy lek przeciwdrgawkowy może zmniejszać częstotliwość ataków padaczkowych u pacjentów. Powtarzalne pomiary dla tego samego pacjenta są zwykle skorelowane pozytywnie, dlatego odpowiedni powinien być model mieszany z pewnymi efektami losowymi. Zmienna przewidywana — liczba ataków — przyjmuje dodatnie wartości całkowite, dlatego odpowiedni może być uogólniony liniowy model mieszany o rozkładzie Poissona i logarytmiczna funkcja łączenia.

Dostawcy telewizji kablowej, telefonii przewodowej i internetu przewodowego mogą używać uogólnionego liniowego modelu mieszanego w celu uzyskania dodatkowych informacji na temat potencjalnych klientów. Możliwe odpowiedzi charakteryzują się nominalnymi poziomami pomiaru, dlatego analityk firmowy stosuje uogólniony liniowy mieszany model logit z losowym wyrazem wolnym w celu przechwytywania korelacji między odpowiedziami na pytania o korzystanie z usług różnych typów (telewizja, telefon, internet) w odpowiedziach konkretnego respondenta uczestniczącego w ankiecie.

Karta struktury danych umożliwia określenie zależności strukturalnych między rekordami w bazie danych po skorelowaniu obserwacji. Jeśli rekordy w zestawie danych reprezentują niezależne obserwacje, nie ma potrzeby określać niczego na tej karcie.

Obiekty. Połączenie wartości wybranych zmiennych jakościowych powinno w sposób jednoznaczny definiować obiekty w zbiorze danych. Na przykład jedna zmienna ID pacjenta powinna wystarczyć do zdefiniowania obiektów w jednym szpitalu. Jeśli jednak numery identyfikacyjne pacjenta nie identyfikują jednoznacznie pacjentów w różnych szpitalach, wówczas konieczna może być kombinacja ID szpitala i ID pacjenta. Przy wielokrotnych pomiarach dla każdego obiektu zapisywane są wielokrotne obserwacje. Z tego powodu jeden obiekt może być w zbiorze danych przedstawiany w wielu rekordach.

Obiekt jest jednostka obserwacyjną, która może być rozważana niezależnie od innych obiektów. Na przykład odczyty ciśnienia krwi pacjenta w badaniu medycznym mogą być traktowane jako niezależne od odczytów innych pacjentów. Definiowanie obiektów staje się szczególnie istotne, gdy istnieją wielokrotne pomiary na każdy obiekt i gdy wymagane jest modelowanie korelacji między tymi obserwacjami. Na przykład można oczekiwać, że pomiary ciśnienia krwi u jednego pacjenta podczas kolejnych wizyt u lekarza będą skorelowane.

Wszystkie zmienne określone jako obiekty na karcie struktury danych są używane do definiowania obiektów dla struktury kowariancji rezydualnej i udostępniają listę możliwych zmiennych do definiowania obiektów dla struktur kowariancji efektów losowych w bloku efektów losowych.

Powtarzane pomiary. Zmienne określone w tym miejscu służą do identyfikowania obserwacji powtórzonych. Na przykład pojedyncza zmienna Tydzień może identyfikować 10 tygodni obserwacji w badaniu medycznym, a w celu identyfikacji obserwacji codziennych w ciągu roku można używać razem zmiennych Miesiąc i Dzień.

Definiuj grupy kowariancji według. Zmienne jakościowe określone w tym miejscu definiują niezależne zestawy parametrów kowariancji efektów powtarzanych ; po jednej dla każdej kategorii zdefiniowanej przez klasyfikację krzyżową zmiennych grupujących. Wszystkie obiekty mają ten sam typ kowariancji; obiekty w tej samej grupie kowariancji będą miały te same wartości dla parametrów.

Współrzędne kowariancji przestrzennej. Gdy jeden z typów kowariancji przestrzennej wybrano jako typ struktury kowariancji, zmienne na tej liście określają współrzędne powtarzanych obserwacji.

Typ kowariancji powtórzonej. Określa strukturę kowariancji dla reszt. Dostępne są następujące struktury:

  • Autoregresja pierwszego rzędu (AR1)
  • Autoregresyjna średnia ruchoma (1,1) (ARMA11)
  • Symetria złożona
  • Przekątna
  • Tożsamość skalowana
  • Przestrzenna: potęgowa
  • Przestrzenna: wykładnicza
  • Przestrzenna: Gaussa
  • Przestrzenna: liniowa
  • Przestrzenna: liniowo-logarytmiczna
  • Przestrzenna: sferyczna
  • Toeplitz
  • Nieustrukturalizowana
  • Składowe wariancji