特征(最近邻元素分析)

如果在“变量”选项卡中指定了目标,使用“特征”选项卡可以为特征选择请求或指定选项。 缺省情况下,特征选择会考虑所有特征,但可以选择特征子集以强制纳入模型。

停止标准。 在每一步上,如果添加特征可以使误差最小(计算为分类目标的误差率和刻度目标的平方和误差),那么考虑将其纳入模型中。 继续向前选择,直到满足指定的条件。

  • 指定的特征数。 除了那些强制纳入模型的特征外,算法还会添加固定数目的特征。 指定一个正整数。 减少所选择的数目值可以创建更简约的模型,但存在缺失重要特征的风险。 增加所选择的数目值可以涵盖所有重要特征,但又存在因特征添加而增加模型误差的风险。
  • 绝对误差率的最小变化。 当绝对误差比率变化表明无法通过添加更多特征来进一步改进模型时,算法会停止。 指定一个正数。 减小最小变化值将倾向于包括更多特征,但存在包括对模型价值不大的特征这一风险。 增加最小变化值将倾向于排除更多特征,但存在丢失对模型较重要的特征的风险。 “最佳”的最小变化值取决于数据和具体应用。 请参阅输出中的“特征选择误差日志”,以帮助您评估哪些特征最重要。 请参阅主题 特征选择错误日志 (最近邻元素分析) 以获取更多信息。