廣義線性混合模型

廣義線性混合模型會延伸線性模型,這麼一來:

  • 目標即可透過指定的鏈結函數與因素和共變數成線性相關。
  • 目標可具有非常態分佈。
  • 觀察值可以具有相關性。

廣義線性混合模型涵蓋多種模型,從非常態縱向資料的簡單線性迴歸,到複雜的多層級模型。

範例。地區教育局可使用廣義線性混合模型以判斷實驗性教學方式是否能有效提升數學分數。相同教室的學生應該具有相關性,因為他們都是由同一位教師授課,且相同學校中的教室也具有相關性,所以我們可以在學校和教室層級包含隨機效應以說明變異性的不同來源。

醫療研究員可以使用廣義線性混合模型,以判斷新的抗癲癇藥物是否能減少病患癲癇發作的機率。相同病患的重複測量結果通常會是正相關,所以加入一些隨機效應的混合模型應較為合適。目標欄位和發作次數採用正整數值,因此使用卜瓦松 (Poisson) 分佈和對數鏈結的廣義線性混合模型可能較為合適。

電視、電話及網際網路服務之纜線提供者的高階監督者可以使用廣義線性混合模型,來進一步了解潛在客戶。因為可能的答案具有名義測量層級,所以公司分析師會透過使用隨機截距的概化 logit 混合模型,以擷取特定問卷回答者答案中跨服務類型(電視、電話、網際網路)之服務使用問題答案間的相關性。

「資料結構」標籤可以讓您在觀察值具有相關性時,指定資料集中記錄之間的結構關係。如果資料集中的記錄代表獨立的觀察值,則無需在此標籤中指定任何值。

受試者。 特定類別欄位的值組合應該唯一定義資料集內的受試者。例如,單一的病患 ID 欄位必須足以定義單一醫院中的受試者,但如果病患的 ID 號碼不是所有醫院中的唯一 ID,就可能會需要醫院 ID病患 ID 的組合。在重複測量設定中,會為每個受試者記錄多個觀察值,因此每個受試者可能會佔用資料集內的多個記錄。

受試者是一個觀察單位,並且可以視為與其他受試者無關。例如,某個醫療研究中的病患,其血壓讀數可以視為與其他病患的血壓讀數無關。當每個受試者有重複測量,並且您想要為這些觀察值之間的相關性建模時,定義受試者便變得非常重要。例如,您可能會預期某個病患在連續看病期間的血壓讀數是相關的。

在「資料結構」標籤上指定為受試者的所有欄位,都會用來定義殘差共變異結構的受試者,並提供可能的欄位清單來定義隨機效應區塊上隨機效應共變異結構的受試者。

重複測量。 在此指定的欄位會用來識別重複觀察值。例如,單一變數可識別醫療研究中 10 週的觀察值,或可以合併使用來識別一年中某個時期每天的觀察值。

定義共變異群組依據。在此指定的類別欄位定義獨立的重複效應共變異參數集;每一個欄位適用於一種由分組欄位交叉分類定義的類別。所有受試者都具有相同的共變異類型;同一個共變異分組中的受試者將具有相同的參數值。

空間共變異座標。選取其中一個空間共變異類型作為重複的共變異類型時,此清單中的變數指定重複觀察值的座標。

重複共變異類型。這可指定殘差的共變異結構。可用的結構包括:

  • 第一階自身迴歸 (AR1)
  • 自身迴歸移動平均 (1,1) (ARMA11)
  • 複合對稱
  • 對角線
  • 尺度單位
  • 空間:冪次
  • 空間:指數
  • 空間:高斯
  • 空間:線性
  • 空間:線性對數
  • 空間:球面
  • Toeplitz
  • 非結構化
  • 變異成分