广义线性混合模型

广义线性混合模型扩展了线性模型,使得:

  • 目标通过指定的关联函数与因子和协变量线性相关。
  • 目标可以有非正态分布。
  • 观测值可能相关。

广义线性混合模型涵盖了从简单线性回归到复杂的非正态纵向数据多变量模型的各种模型。

示例。地区教育委员会可以使用广义线性混合模型来判定一个实验教学方法对于提高数学成绩的有效性。由于来自同一班级的学生由同一个老师教导,因此这些学生是相关的,而且同一学校的各班级之间也是相关的,因此我们可以在学校和班级级别添加随机效应,以说明不同来源的变异性。

医学研究者可以用广义线性混合模型来判定一种新型抗惊厥药能否降低患者癫痫发作的比率。对同一患者重复测量通常是正相关的,因此适合使用具有随机效应的混合模型。目标字段为发作次数,其值为正整数,因此可能适合使用具有泊松分布和对数链接的广义线性混合模型。

电视、电话和网络服务的电缆供应商可以使用广义线性混合模型了解潜在的客户。由于可能的回答具有名义测量级别,因此公司分析员使用加入随机截距的广义分对数混合模型来捕获在指定的调查响应者回答中服务类型(电视、电话、网络)的服务利用率与回答之间的相关性。

当观察数据具相关性时,数据结构选项卡可以指定数据集内各纪录的结构关系。如果数据集内的纪录代表独立观察,那么无需在此选项卡指定任何选项。

主体。指定分类字段值的组合应唯一定义数据集内的主体。例如,单个病人标识 字段应足以定义一个医院内的主体,但如果病人标识号在各医院间不是唯一,那么需要使用医院标识病人标识的组合。在重复度量设置中,将为每个主体记录多个观察数据,因此每个主体可能在数据集中占用多个纪录。

主体是可视为独立于其他主体的观测单元。例如,在医学研究中,一位患者的血压读数可视为独立于其他患者的读数。当每个主体都有重复测量,而您希望对这些观测值的相关性建立模型时,定义主体就变得尤为重要。例如,您可能希望将医生为单一病人连续几次测得的血压读数关联。

所有在“数据结构”选项卡上指定为主体的字段都用于定义残差协方差结构的主体,并提供可能的字段列表,用于在随机效应块上定义随机效应协方差结构的主体。

重复测量。此处指定的字段用于识别重复观察。例如,单个变量可以识别医学研究中 10 周的观测值,可以共同用来识别一整年中每一天的观测值。

定义协方差分组依据。此处指定的分类字段用于定义独立的重复效应协方差参数集;每个由分组字段的交叉分类定义的类别都具有此字段。所有主体具有相同协方差类型;相同协方差分组内的主体具有相同的参数值。

空间协方差坐标。如果选择其中一种空间协方差类型来作为重复协方差类型,那么此列表中的变量指定重复观测值的坐标。

重复协方差类型。此类型指定残差的协方差结构。可用结构如下:

  • 一阶自回归 (AR1)
  • 自回归移动平均值 (1,1) (ARMA11)
  • 复合对称
  • 对角线
  • 尺度化恒等
  • 空间:幂
  • 空间:指数
  • 空间:高斯
  • 空间:线性
  • 空间:线性对数
  • 空间:球形
  • Toeplitz
  • 非结构化
  • 方差成分