最优分级

如果要分箱的字段与另一个分类字段强关联,则可选择分类字段作为“主管”字段以便以类似于保留两个字段间的原始关联强度的方式创建分箱。

例如,假定已采用聚类分析根据家庭贷款的拖欠率对状态进行分组,那么最高拖欠率将位于第一个聚类中。在这种情况下,可以选择 过期百分比 取消赎取权百分比 作为分级字段和模型生成的作为主管字段的聚类成员资格字段。

名称扩展 指定要用于所生成字段的扩展名,以及是将其添加到字段名开头(前缀)还是末尾(后缀)。例如,可以生成名为 pastdue_OPTIMAL 的新字段以及名为 inforeclosure_OPTIMAL 的另一个字段。

主管字段 这是用于构造分箱的分类字段。

预分级字段以提高大型数据集的性能 指示应在最优分级的流程化中使用预处理。该方法会采用简单的非监督式分级方法将尺度值分组为大量分级,以均值表示每个分级中的值,并在继续监督式分级之前对观测值权重进行相应调整。在实际应用中,此方法会牺牲一定的精度以换取速度,建议用于大型数据集。使用此选项时,也可以指定任意变量预处理后的最大分级数。

将观测值计数相对较小的分级与较大的相邻分级进行合并。如果启用,则指示当该分级大小(观测值的个数)与相邻分级大小的比值小于指定的阈值时,将合并分级;请注意阈值越大合并的分级越多。