Logistic 回归

如果希望根据一组预测变量的值预测某种特征或结果是否存在,Logistic 回归可以提供帮助。 Logistic 回归类似于线性回归模型,但更适用于因变量为二分变量的模型。 Logistic 回归系数可用于估计模型中每个自变量的几率比。 与判别分析相比,Logistic 回归适用于更为广泛的研究场合。

示例。 什么样的生活方式特征是引发冠心病 (CHD) 的危险因素? 给定具有吸烟状态、饮食、锻炼、饮酒和 CHD 状态度量的患者样本,可以使用这四个生活方式变量建立一个模型,用于预测患者样本中 CHD 的存在性。 然后可使用此模型为每个因子推导几率比估计值,从而获知某些信息,例如吸烟者比非吸烟者在何种程度上更易患 CHD。

统计。 对于每项分析,统计个案总数、选定个案数和有效个案数。 对于每个分类变量,统计参数编码。 对于每个步骤,统计输入或移除的变量、迭代历史记录、- 2 对数似然、拟合优度、Hosmer-Lemeshow 拟合优度统计、模型卡方、改进卡方、分类表、变量间的相关性、观察组和预测概率图表以及残差卡方。 对于公式中的每个变量,统计系数 (B)、B 的标准误差、Wald 统计、估计的几率比 (exp(B))、exp(B) 的置信区间和对数似然(如果从模型中移除了项)。 对于公式以外的每个变量,统计得分统计。 对于每个个案,统计观察组、预测概率、预测组、残差和标准化残差。

:NONE. 可以使用变量块输入或下列任一步进法来估算模型:向前条件、向前 LR、向前 Wald、向后条件、向后 LR 或向后 Wald。

Logistic 回归数据注意事项

数据。 因变量应为二分变量。 自变量可以是区间级别变量或分类变量;如果是分类变量,则它们应经过哑元变量或指示符编码(过程中有一个选项可自动对分类变量进行重新编码)。

假设。 与判别分析一样,Logistic 回归不依赖于分布假设。 但是,如果预测变量呈多变量正态分布,则解会更稳定。 此外,与其他形式的回归相同,预测变量中的多重共线性会导致有偏差的估计和夸大的标准误差。 当组成员为真正的分类变量时,该过程最为有效;如果组成员基于连续变量的值(例如,“高智商”与“低智商”),则应考虑使用线性回归以利用由连续变量本身提供的更为丰富的信息。

相关过程。 使用“散点图”过程过滤数据以获得多重共线性。 如果符合多变量正态性和相等方差-协方差矩阵的假设,则使用“判别分析”过程可以更快获得解。 如果所有预测变量都是分类变量,则还可以使用“对数线性”过程。 如果因变量是连续的,请使用“线性回归”过程。 可以使用“ROC 曲线”过程绘制通过“Logistic 分析”过程保存的概率。

获取 Logistic 回归分析

此功能需要 定制表和高级统计信息

  1. 从菜单中选择:

    分析 > 回归 > 二元 Logistic ...

    注意: 红色标记的字段为必填项。 在所有必填字段中输入有效值后," 粘贴 "和 "确定 "按钮将被启用。
  2. 选择一个二分因变量。 该变量可以是数值或字符串。
  3. 请选择一个或多个协变量。 要包含交互项,请选择交互中所涉及的所有变量,然后选择 >a*b>

要在组()中输入变量,请为块选择协变量,然后单击下一步以指定新块。 重复此步骤,直到指定了所有的块。

或者,可以选择分析的个案。 选择一个选择变量,然后输入规则条件。

此过程将粘贴 LOGISTIC REGRESSION 命令语法。