因子分析
因子分析尝试识别出基础变量(或称因子)来解释在一组观察到的变量中体现的相关模式。 因子分析通常用于数据降维,其目的是识别出少数几个因子来解释大多数在众多显性变量中所观测到的方差。 因子分析也可用于生成关于因果机制的假设或过滤变量以用于随后的分析(例如:在执行线性回归分析之前识别共线性)。
因子分析过程提供了高度的灵活性:
- 有 7 种因子抽取的方法。
- 有 5 种旋转方法,包括直接 Oblimin 方法和非正交旋转的最优斜交。
- 有 3 种计算因子得分的方法,并且得分可以另存为变量以进行进一步分析。
示例。 什么基础态度使人们回答政治调查上的问题? 检查调查项中的相关性显示,项的各种子组有显著的交迭 - 关于税的问题显得彼此相关,关于军事的问题显得彼此相关,等等。 使用因子分析,您可以调查基础因子的数量,并且,在许多情况下,还可以识别这些因子在概念上所代表的含义。 此外,您可以计算每个响应者的因子得分,然后这些得分可以用于以后的分析。 例如,您可以建立 logistic 回归模型以根据因子得分预测投票行为。
统计。 对于每个变量:有效个案数、平均值和标准差。 对于每项因子分析:变量的相关性矩阵,包括显著性水平、行列式和逆;再生相关性矩阵,包括反映像;初始解(公因子方差、特征值以及解释的方差所占的百分比);对取样充分性的 Kaiser-Meyer-Olkin 度量以及 Bartlett 球形度检验;未旋转的解,包括因子载荷、公因子方差和特征值;以及旋转解,包括旋转的模式矩阵和转换矩阵。 对于斜交旋转:旋转的模式和结构矩阵;因子得分系数矩阵和因子协方差矩阵。 图:特征值的碎石图以及前两个或前三个因子的载荷图。
因子分析数据注意事项
数据。 变量在区间或比率级别应该是定量变量。 分类数据(例如:宗教或原产国家/地区)不适合因子分析。 可计算 Pearson 相关性系数的数据应该适合于因子分析。
假设。 对于每对变量,数据应具有二元正态分布,且观测值应是独立的。 因子分析模型指定变量是由公共因子(模型估计的因子)和特殊因子(不在观察到的变量之间交迭)确定的;计算的估计值所基于的假设是所有唯一因子相互之间不相关并与公共因子不相关。
获取因子分析
此功能需要 Statistics Base 选项。
- 从菜单中选择:
- 选择用于因子分析的变量。
此过程将粘贴 FACTOR 命令语法。