分析输出浏览器

分析输出浏览器显示了“分析”节点的执行结果。“文件”菜单中提供了常用的保存、导出和打印选项。有关更多信息,请参阅查看输出主题。

首次浏览分析输出时,结果会展开。要在查看结果后将其隐藏,请使用项目左侧的扩展器控件将要隐藏的特定结果折叠,或单击全部折叠按钮以折叠所有结果。要在折叠结果后再次对其进行查看,请使用项目左侧的展开器控件显示结果,或单击全部展开按钮以显示所有结果。

输出字段的结果。对于具有所生成的模型创建的相应预测字段的每个输出字段,分析输出都包含一个相应部分。

比较。在输出字段部分中,这是与该输出字段关联的每个预测字段的子部分。对于分类输出字段,此部分的顶级位置包含一张表,其中显示正确预测和不正确预测的数目和百分比以及流中的记录总数。对于数字输出字段,此部分显示以下信息:

  • 最小误差。显示最小误差(观测值和预测值之间的差值)。
  • 最大误差。显示最大误差。
  • 均数误差。显示所有记录的误差的平均值(均数)。这指示模型中是否有系统偏差(过高估计的趋势强于过低估计的趋势,或相反)。
  • 平均绝对误差。显示所有记录的误差绝对值的平均值。指出误差的平均量级(不考虑方向)。
  • 标准差。显示误差的标准差。
  • 线性相关。显示预测值和实际值之间的线性相关。此统计量介于 –1.0 和 1.0 之间。值接近于 +1.0 表示强正相关,因此,高预测值与高实际值相关,而低预测值与低实际值相关。值接近于 –1.0 表示强负相关,因此,高预测值与低实际值相关,而低预测值与高实际值相关。值接近于 0.0 表示弱相关,因此,预测值或多或少地独立于实际值。:此处的空白条目表示由于实际或预测值为常量,因此在该案例中无法计算线性相关。
  • 出现次数。显示分析中使用的记录数。

符合矩阵。对于分类输出字段,如果在分析选项中请求了符合矩阵,那么此处会显示一个包含该矩阵的子部分。行表示实际观测值,而列表示预测值。表中的单元格表示每个预测值和实际值组合的记录数。

性能评估。对于分类输出字段,如果在分析选项中请求了性能评估统计量,那么此处会显示性能评估结果。每个输出类别均与其性能评估统计量一起列出。

置信度值报告。对于分类输出字段,如果在分析选项中请求了置信度值,那么此处会显示这些值。对于模型置信度值,将报告下列统计量:

  • 范围。显示流数据中记录的置信度值的范围(最小值和最大值)。
  • 正确分类的平均置信度。显示正确分类的记录的平均置信度。
  • 未正确分类的平均置信度。显示未正确分类的记录的平均置信度。
  • 始终正确的置信度下限。显示预测始终正确的置信度阈值的下限,并显示符合此条件的案例所占百分比。
  • 始终不正确的置信度上限。显示预测始终错误的置信度阈值的上限,并显示符合此条件的案例所占百分比。
  • 准确度 X% 以上。显示准确度为 X% 时的置信度级别。X 是分析选项中为阈值指定的近似值。对于某些模型和数据集,无法选择提供精确阈值(在选项中指定的)的置信度值(通常是具有接近阈值的相同置信度值的类似观测值的聚类所致)。所报告的阈值是最接近于指定准确性条件的值,该值可以通过单个置信度值阈值获取。
  • 比整体准确性好 X 倍。显示比整个数据集的准确性好 X 倍时相应的置信度值。X 是在分析选项中为改进准确性指定的值。

之间的一致性。如果流中包括两个或两个以上对同一输出字段进行预测的已生成模型,那么您还将看到与模型所生成的预测之间的一致性相关的统计量。这包括预测一致的记录数和百分比(对于分类输出字段)或误差汇总统计量的数目和百分比(对于连续输出字段)。对于分类字段,它包括分析与模型一致(生成相同预测值)的记录子集的实际值相比的预测值。

评估度量。对于二元分类器,如果您已请求分析选项中的评估度量,那么 AUC 和 Gini 系数评估度量的值将显示在表的此部分中。对于每个二元分类器模型,表都包含与之对应的一行。评估度量表针对每个输出字段而不是每个模型显示。