廣義線性模型
廣義線性模型會延伸廣義線性模型,因此應變數可透過指定的鏈結函數與因數和共變數成線性相關。 此外,此模式允許」變數具有非常態分配。 它包含廣泛使用的統計模型,例如一般分佈回應的線性迴歸、二進位資料的邏輯模型、計數資料的對數線性模型、區間受限存活資料的互補對數存活函數的對數模型,以及透過其極其常見的模型規劃的許多其他統計模型。
範例。 航運公司可以使用廣義線性模型將卜瓦松 (Poisson) 迴歸調整到符合數種在不同時期建造的船隻損壞個數,而結果模式可以協助判斷何種船隻類型最容易損壞。
汽車保險公司可以使用廣義線性模型將 gamma 迴歸調整到符合汽車損壞理賠,而結果模式可以協助判斷影響理賠金額最鉅的因素。
醫療研究員可以使用廣義線性模型將「互補對數存活函數的對數」迴歸調整到符合區間受限存活資料,以預測某種疾病復發的時間。
廣義線性模型的資料考量
資料。 回應可以是尺度、個數、二元或試驗事件。 因素假設為類別的。 共變數、尺度加權和偏移假設為尺度。
假設。 觀察值假設為獨立觀察值。
若要取得廣義線性模型
此功能需要 自訂表格及進階統計量。
從功能表中選擇:
- 指定分佈和鏈結函數 (請參閱以下內容,了解各種選項的詳細資訊)。
- 在 回應 標籤上,選取應變數。
- 在 預測值 標籤上,選取用於預測應變數的因素和共變數。
- 在 模型 標籤上,使用選取的因素和共變數指定模型效應。
「模式類型」標籤可讓您指定模型的分佈和鏈結函數,為依回應類型分類的數種常見模式提供捷徑。
模式類型
尺度回應。 您可以使用的選項如下:
- 線性。 指定「一般」作為分佈,並指定「識別」作為鏈結函數。
- 含有對數鏈結的 Gamma。 指定 Gamma 作為分佈,並指定「對數」作為鏈結函數。
序數回應。 您可以使用的選項如下:
- 序數邏輯。 指定「多項式(序數)」作為分佈,並指定「累積對數勝算」作為鏈結函數。
- 序數機率單位值。 指定「多項式(序數)」作為分佈,並指定「累積機率單位值」作為鏈結函數。
計數頻率更高的概念。 您可以使用的選項如下:
- 卜瓦松對數線性。 指定卜瓦松作為分佈,並指定「對數」作為鏈結函數。
- 含有對數鏈結的負二項式。 指定「負二項式」(針對輔助參數,具有值 1)作為分佈,並指定「對數」作為鏈結函數。 若要讓程序預估輔助參數的值,請指定含「負二項式」分佈的自訂模型,並在「參數」群組中選取預估值。
二進位回應或事件/試驗資料。 您可以使用的選項如下:
- 二元邏輯。 指定「二項式」作為分佈,並指定對數勝算作為鏈結函數。
- 二元機率值。 指定「二項式」作為分佈,並指定「機率單位值」作為鏈結函數。
- 區間受限存活。 指定「二項式」作為分佈,並指定「互補對數存活函數的對數」作為鏈結函數。
混合。 您可以使用的選項如下:
- 含有對數鏈結的 Tweedie。 指定 Tweedie 作為分佈,並指定「對數」作為鏈結函數。
- 含有識別鏈結的 Tweedie。 指定 Tweedie 作為分佈,並指定「識別」作為鏈結函數。
自訂。 指定您自己的分佈與鏈結函數組合。
分佈
本節說明應變數的分佈。 指定非常態分佈與非識別鏈結函數的能力,對於在廣義線性模型改善廣義線性模型而言是必備的。 可能的分佈鏈結函數組合有很多,且其中有好幾個都適用於指定的任何資料集,因此您的選擇可遵循先期提出的理論考量,或看起來最適合的組合。
- 二項式。 此分佈唯有變數代表二元回應或事件個數時才合適。
- Gamma 參數。 此分佈適用於具有正值尺度的變數且偏向較大正數值的變數。 若資料值小於或等於零或遺漏,則不會在分析中使用對應觀察值。
- 反向高斯 (Gaussian)。 此分佈適用於具有正值尺度的變數且偏向較大正數值的變數。 若資料值小於或等於零或遺漏,則不會在分析中使用對應觀察值。
- 負二項式。 此分佈可視為觀察 k 成功所需的試驗次數,且適用於具有非負整數值的變數。 若資料值為非整數、小於零或遺漏,則不會在分析中使用對應觀察值。 負二項式分佈的輔助參數的值可以為大於或等於 0 的任意數字;您可以將其設為固定值,或者讓程序估計它的值。 輔助參數設為 0 時,使用此分佈等同於使用卜瓦松 (Poisson) 分佈。
- 正常。 此分佈適用於值呈對稱、約於中央 (平均數) 值呈鐘型分佈的尺度變數。 應變數必須為數值。
- Poisson。 此分佈可視為在固定時段內相關事件的出現次數,且適用於具有非負整數值的變數。 若資料值為非整數、小於零或遺漏,則不會在分析中使用對應觀察值。
- Tweedie。 此分佈適用於可以伽瑪分佈的卜瓦松混合表示的變數;此分佈「混合」的意思是說,其結合了連續(如非負實值)與離散分佈(單一值上的正機率量,0)的特性。 應變數必須為數值,且資料值大於或等於零。 若資料值小於零或遺漏,則不會在分析中使用對應觀察值。 Tweedie 分佈的固定值可以是任何大於 1 且小於 2 的數字。
- 多項式。 此分佈適用於表示序數回應值的變數。 應變數可以是數值或字串,且必須至少具備兩個相異的有效資料值。
鏈結函數
鏈結函數是允許模式估計的應變數轉換。 您可以使用的函數如下:
- 身分。 f(x) =x。 應變數不會進行轉換。 此鏈結可以和任何分佈一起使用。
- 互補對數存活函數的對數。 f(x)=log(−log(1−x))。 這僅適用於二項式分佈。
- 累積 Cauchit。 f(x) = tan(π (x – 0.5)),套用至每一種回應的累積機率。 這僅適用於多項式分佈。
- 累積互補對數存活函數的對數。 f(x)=ln(−ln(1−x)),套用至每一種回應的累積機率。 這僅適用於多項式分佈。
- 累積對數勝算。 f(x)=ln(x / (1−x)),套用至每一種回應的累積機率。 這僅適用於多項式分佈。
- 累積負對數存活函數的對數。 f(x)=−ln(−ln(x)),套用至每一種回應的累積機率。 這僅適用於多項式分佈。
- 累積機率。 f(x)=Φ−1(x),套用到每一種回應的累積機率,其中 Φ−1 是反向標準常態累積分佈函數。 這僅適用於多項式分佈。
- 日誌。 f(x)=log(x)。 此鏈結可以和任何分佈一起使用。
- 對數互補。 f(x)=log(1−x)。 這僅適用於二項式分佈。
- Logit。 f(x)=log(x / (1−x))。 這僅適用於二項式分佈。
- 負二項式。 f(x)=log(x / (x+k −1)),其中 k 是負二項式分配的輔助參數。 這僅適用於負值二項式分佈。
- 負對數存活函數的對數。 f(x)=−log(−log(x))。 這僅適用於二項式分佈。
- 勝算檢定力次。 f(x) = [(x/(1−x)))α− 1 ]/α ,如果 α ≠ 0。 f(x) = log (x) ,如果 α = 0。 α 是必要的數字規格,且必須是實數。 這僅適用於二項式分佈。
- 機率值。 f(x)=Φ−1(x),其中 Φ−1 是反向標準正態累積分佈函數。 這僅適用於二項式分佈。
- Power. f(x)=x α, if α ≠ 0. f(x)=log(x), if α=0. α 是所需的數字規格,且必須是實數。 此鏈結可以和任何分佈一起使用。
此程序會貼上 GENLIN 指令語法。