主成分分析/因子节点
因子/主成分分析节点提供了用于降低数据复杂程度的强大数据缩减技术。该技术提供以下两种相似但不同的方法。
- 主成分分析 (PCA) 可以找出输入字段的线性组合,这些组合能够出色地捕获整个字段集合中的方差,且组合中的各个成分相互正交(相互垂直)。主成分分析集中关注所有方差,包括共享方差和独有方差。
- 因子分析尝试确定可以解释一组观测字段中的相关性模式的基本概念(即因子)。因子分析只集中关注共享方差。估计模型时不考虑特定字段独有的方差。因子/主成分分析节点提供几种因子分析方法。
这两种方式的目标都是找到有效概括原始字段集中的信息的一小部分导出字段。
需求。主成分分析因子模型中只能使用数值字段。要估计因子分析或主成分分析,需要一个或多个角色设置为输入字段的字段。角色设置为目标、双向或无的字段将被忽略,就像对待非数值字段一样。
优势。因子分析和 PCA 可以在不牺牲太多信息内容的情况下有效地降低数据的复杂性。这些技术可帮助您构建更稳健的模型,并实现比原始输入字段更高的执行速度。