Обобщенные линейные смешанные модели

Обобщенные линейные смешанные модели обобщают линейные модели таким образом, что:

  • Целевая переменная линейно связана с факторами и ковариатами посредством заданной функции связи.
  • Распределение целевой переменной может отличаться от нормального.
  • Наблюдения могут быть скоррелированы.

Обобщенные линейные смешанные модели включают широкий набор моделей, начиная от простой линейной регрессии и кончая сложными многоуровневыми моделями для не нормально распределенных данных с повторными измерениями.

Примеры. Районный школьный отдел может использовать обобщенную линейную смешанную модель, чтобы оценить влияние экспериментального метода преподавания на успеваемость по математике. Учащиеся из одного класса могут обнаруживать корреляцию по успеваемости, поскольку занимаются у одного преподавателя, показатели классов одной школы также могут коррелировать, поэтому мы можем включить в модель случайные эффекты на уровне школы и класса, отражающие различные источники вариации.

В медицинских исследованиях с помощью обобщенной линейной смешанной модели можно установить, например, может ли новый противосудорожный препарат снизить частоту эпилептических припадков. Повторные измерения на одном и том же пациенте обычно обнаруживают высокую положительную корреляцию, поэтому в данном случае подходит смешанная модель со случайными эффектами. Поле назначения (число припадков) принимает целые положительные значения, поэтому здесь можно использовать обобщенную линейную смешанную модель с распределением Пуассона и логарифмической зависимостью.

Администраторы служб провайдеров кабельного телевидения, телефонии и услуг интернета могут использовать обобщенную линейную смешанную модель для получения дополнительной информации о потенциальных заказчиках. Поскольку возможные ответы имеют номинальные уровни измерения, аналитики компании используют обобщенную смешанную логит-модель со случайным свободным членом для отражения корреляции между ответами на вопросы о пользовании услугами разных типов (телевидение, телефон, интернет) для конкретного респондента, заполнившего опросный лист.

На вкладке Структура данных можно задать структурные взаимосвязи между записями в наборе данных, если наблюдения скоррелированы. Если записи в наборе данных представляют независимые наблюдения, ничего задавать на этой вкладке не требуется.

Субъекты. Сочетание значений заданных категориальных полей должна уникальным образом определять субъекты в наборе данных. К примеру, единственного поля ID пациента должно быть достаточно для определения субъектов в одной больнице, но может потребоваться сочетание ID больницы и ID пациента в случае, если ID пациентов не являются уникальными в рамках всех больниц. При выборе режима повторных измерений для каждого субъекта фиксируются несколько наблюдений, поэтому каждый субъект может присутствовать в нескольких записях одного набора данных.

Субъект - это единица наблюдения, которую можно считать независимой от других субъектов. Например, результаты измерения кровяного давления у пациента в медицинском исследовании можно считать независимыми от таких же показателей у других пациентов. Определить субъекты бывает особенно важно, когда для субъектов выполняются повторные измерения, и между этими наблюдениями нужно смоделировать взаимосвязь. Например, можно ожидать, что показания кровяного давления для одного пациента при последовательных посещениях врача будут скоррелированы между собой.

Все поля, указанные как Субъекты на вкладке Структура данных, используются для определения субъектов для ковариационной структуры остатков и содержат список возможных полей для определения субъектов для ковариационных структур случайных эффектов в блоке случайных эффектов.

ОЛМ-повторные измерения. Заданные здесь поля служат для идентификации повторных наблюдений. Например, одна переменная Неделя может обозначать 10 недель наблюдений в медицинском исследовании, а Месяц и День могут использоваться совместно для идентификации ежедневных наблюдений в течение года.

Задать группы ковариаций с помощью. Заданные здесь категорийные поля определяют независимые наборы параметров ковариации повторяющихся эффектов, по одному для каждой категории, определяемой перекрестной классификацией полей группировки. У всех субъектов - один тип ковариации, у субъектов внутри одной ковариационной группировки значения параметров совпадают.

Координаты пространственной ковариации. Переменные в этом списке задают координаты повторных наблюдений, когда для типа ковариационной матрицы для повторных измерений выбран один из типа пространственной ковариации.

Тип ковариационной матрицы для повторных измерений. Задает ковариационную структуру для остатков. Доступные структуры:

  • Авторегрессия первого порядка AR(1)
  • Авторегрессивное скользящее среднее ARMA(1,1)
  • Составная симметрия (CS)
  • Диагональная
  • Масштабированная единичная
  • Пространственная: Степенная
  • Пространственная: Экспоненциальная
  • Пространственная: Нормальная
  • Пространственная: Линейная
  • Пространственная: Логлинейная
  • Пространственная: Сферическая
  • Теплицева
  • Неструктурированная
  • Компоненты дисперсии (VC)