二元邏輯迴歸

當您希望能夠根據預測值變數集的數值來預測特性或結果的出現或缺席時,邏輯迴歸分析就很有用。它和線性迴歸模型很相似,但是適合二分應變數的模型。邏輯迴歸係數可以用來估計模型中每一個自變數的勝算比。邏輯迴歸分析適用在較廣範圍的研究情況,而不是區別分析。

範例
對冠狀動脈心臟疾病 (CHD) 而言,什麼樣的生活型態特性是風險因素?假定以病人樣本來測量抽煙狀況、飲食、運動、酒精使用情形 以及 CHD 狀況,您可以利用這四種生活型態變數來建置模型,並預測在病人樣本中 CHD 的出現或缺席。之後可以用這個模型得到每個因素的勝算比的預估,舉例來說,告訴您吸煙者比不吸煙者更容易得到 CHD 的可能性。
統計資料
對於每一個分析:總觀察值、選取的觀察值、有效觀察值。對每一個類別變數:參數編碼。對於每一個步驟:輸入或移除的變數、疊代歷程、2 對數概似、適合度、Hosmer-Lemeshow 適合度統計量、模型卡方分配、改良卡方分配、分類表、相關變數、觀察組和預測機率圖、殘差卡方。對於方程式中的每一個變數:係數 (B)、B 的標準誤、Wald 統計、預估勝算比 (exp(B))、exp(B) 的信賴區間、若從模型移除項的對數概似。對每一個不在方程式中的每個變數:統計量評分。對於每一個觀察值:觀察組、預測機率、預測組、殘差、標準化殘差。
方法
您可以使用變數的區塊進入點,或使用任何下列的逐步迴歸分析法來預測模型:向前條件、向前 LR、 向前 Wald、向後條件、向後 LR、向後 Wald。

資料考量

資料
應變數應該是分成兩個的。自變數可以是區間等級或是類別的。如果它是類別的,那麼就應該是虛擬或是編碼過的指標(程序中有個選項可以自動將類別變數重新編碼)。
假設
邏輯迴歸分析依靠分配假設的方法與區別分析不太相同。但是,如果預測值是多變數常態分配,那麼您的解答可能會更穩定。另外,如同其他的迴歸形式,預測值中的多重共線性會導致偏差估計及誇大的標準誤。當群組成員為真的類別變數時,此程序將可發揮最高效能;但如果群組成員是以連續變數的值為基礎(例如高 IQ 對 低 IQ),那麼您應該考慮使用線性迴歸,以便利用連續變數本身所提供的豐富資訊。
相關程序
使用「散佈圖」程序來審查資料的多重共線性。當多變數常態和相同變異數-共變數矩陣的假設相符合時,使用區別分析程序也許可以更快得到解答。如果所有的預測值變數都是類別變數的話,您也可以使用「對數線性」程序。如果您的應變數是連續的,請考慮使用「線性迴歸」程序。您可以使用 ROC 曲線程序來繪製「邏輯迴歸」程序所儲存的機率。

取得二元邏輯迴歸分析

此功能需要自訂表格及進階統計量

  1. 從功能表中選擇:

    分析 > 關聯及預測 > 二元邏輯迴歸

  2. 按一下「應變數」區段下的選取變數,並選取單一的二分應變數。該變數可以是數值或字串。在選取變數之後,按一下確定
  3. 按一下「共變量變數」區段下的選取變數,並選取一個以上可能對應變數產生影響的變數。 在選取變數之後,按一下確定
  4. 選擇性地按一下「因素變數」區段下的選取變數,並選取一個以上代表應變數中變異之潛在原因的變數。在選取變數之後,按一下確定
  5. 選擇性地按一下觀察值選取變數,並選取單一變數,以將分析限制為所選變數具有特定值的一部分觀察值。按一下變數旁邊的規則鏈結(例如,淘汰 = ?)來定義選擇規則。如需相關資訊,請參閱二元邏輯迴歸:定義選擇規則。在選取變數之後,按一下確定
  6. 您可以選擇從其他設定功能表中選取下列選項:
    • 按一下模型以指定要分析的效應
    • 按一下對比以檢定因素變數之間的差異。
    • 按一下統計量,以選取要包含在程序中的統計量。
    • 按一下圖形,以啟用二分應變數之實際/預測值的分類圖顯示。
    • 按一下選項,以指定常數、逐步機率、分類、疊代、記憶體及遺漏值設定。
    • 按一下儲存至資料集,以將模型所預測的值、殘差及相關量數新增至資料集作為新變數。
    • 按一下模型匯出,以將參數估計值及其共變異數匯出至指定的 XML 檔案。模型檔資訊可套用至其他資料檔以進行評分。
    • 按一下自我重複取樣,以獲得穩健性標準誤估計值和如下列各種估計值的信賴區間:平均數、中位數、比例、勝算比、相關係數或迴歸係數。
  7. 按一下執行分析

此程序會貼上邏輯迴歸分析指令語法。