邏輯迴歸

當您希望能夠根據預測值變數集的數值來預測特性或結果的出現或缺席時,邏輯迴歸分析就很有用。 它和線性迴歸模型很相似,但是適合二分應變數的模型。 邏輯迴歸係數可以用來估計模式中每一個自變數的勝算比。 邏輯迴歸分析適用在較廣範圍的研究情況,而不是區別分析。

範例。 對冠狀動脈心臟疾病 (CHD) 而言,什麼樣的生活型態特性是風險因素? 假定以病人樣本來測量抽煙狀況、飲食、運動、酒精使用情形 以及 CHD 狀況,您可以利用這四種生活型態變數來建置模型,並預測在病人樣本中 CHD 的出現或缺席。 之後可以用這個模式得到每個因素的勝算比的預估,舉例來說,告訴您吸煙者比不吸煙者更容易得到 CHD 的可能性。

統計資料。 對於每一個分析:總觀察值、選取的觀察值、有效觀察值。 對每一個類別變數:參數編碼。 對於每一個步驟:輸入或移除的變數、疊代歷程、2 對數概似、適合度、Hosmer-Lemeshow 適合度統計量、模式卡方分佈、改良卡方分佈、分類表、相關變數、觀察組和預測機率圖、殘差卡方。 對於方程式中的每一個變數:係數 (B)、B 的標準誤、Wald 統計、預估勝算比 (exp(B))、exp(B) 的信賴區間、若從模式移除項的對數概似。 對每一個不在方程式中的每個變數:統計量評分。 對於每一個觀察值:觀察組、預測機率、預測組、殘差、標準化殘差。

方法。 您可以使用變數的區塊進入點,或使用任何下列的逐步迴歸分析法來預測模型:向前條件、向前 LR、向前 Wald、向後條件、向後 LR、向後 Wald。

邏輯迴歸資料考量

資料。 應變數應該是分成兩個的。 自變數可以是區間等級或是類別的。如果它是類別的,那麼就應該是虛擬或是編碼過的指標(程序中有個選項可以自動將類別變數重新編碼)。

假設。 邏輯迴歸分析依靠分佈假設的方法與區別分析不太相同。 但是,如果預測值是多變量常態分佈,那麼您的解答可能會更穩定。 另外,如同其他的迴歸形式,預測值中的多重共線性會導致偏差估計及誇大的標準誤。 當組別成員為真的類別變數時,此程序將可發揮最高效能;但如果組別成員是以連續變數的值為基礎(例如高 IQ 對 低 IQ),那麼您應該考慮使用線性迴歸,以便利用連續變數本身所提供的豐富資訊。

相關程序。 使用「散佈圖」程序來審查資料的多重共線性。 當多變量常態和相同變異數-共變異數矩陣的假設相符合時,使用區別分析程序也許可以更快得到解答。 如果所有的預測值變數都是類別變數的話,您也可以使用「對數線性」程序。 如果您的應變數是連續的,請考慮使用「線性迴歸」程序。 您可以使用 ROC 曲線程序來繪製「邏輯迴歸」程序所儲存的機率。

取得邏輯迴歸分析

此功能需要 自訂表格及進階統計量

  1. 從功能表中選擇:

    分析 > 迴歸方法 > 二元邏輯 ...

  2. 選取一個二分應變數。 這個變數可以為數值或字串。
  3. 選取一個或多個共變數。 若要包括交互作用項,請選取所有和交互作用有關的變數,然後選取 >a*b>

要在群組(區塊)中輸入變數,請為區塊選取共變數,然後按下一步以指定新區塊。 一直重複到指定完所有的區塊。

或者您可以選取觀察值進行分析。 選取一個選擇變數,然後輸入規則準則。

此程序會貼上 LOGISTIC REGRESSION 指令語法。