OPTIMAL BINNING

OPTIMAL BINNING 在 Statistics Base Edition 中可用。

OPTIMAL BINNING 过程通过将每个变量的值分布到分箱来离散化一个或多个刻度变量。 然后,可以使用分箱来代替分箱输入变量的原始数据值以进行进一步分析。 OPTIMAL BINNING 对于减少给定分箱输入变量中不同值的数目很有用。

OPTIMAL BINNING

/VARIABLES [GUIDE = variable] BIN = varlist [SAVE = {NO**                       }]
                                                    {YES [(INTO = new varlist)]}

[/CRITERIA

    [PREPROCESS = {EQUALFREQ**[(BINS = {1000**})]}]
                                      {n     }
                  {NONE                          }

    [METHOD = {MDLP**                     }]
              {EQUALFREQ [(BINS = {10**})]}
                                  {n   }

    [LOWEREND = {UNBOUNDED**}]     [UPPEREND = {UNBOUNDED**}]
                {OBSERVED   }                  {OBSERVED   }


    [LOWERLIMIT = {INCLUSIVE**}]
                  {EXCLUSIVE  }

    [FORCEMERGE = {0**  }]]
                  {value}

[/MISSING  [SCOPE = {PAIRWISE**}]]
                    {LISTWISE  }

[/OUTFILE  RULES = filespec]

[/PRINT  [ENDPOINTS**] [DESCRIPTIVES] [ENTROPY] [NONE]]

** 如果省略子命令或关键字,则为缺省。

此命令读取活动数据集并导致执行任何暂挂命令。 请参阅主题 命令顺序 以获取更多信息。

可以从 优化分箱 对话框生成 OPTIMAL BINNING 命令的语法。

发布历史

发行版 15.0

  • 已引入命令。

示例

OPTIMAL BINNING
  /VARIABLES GUIDE = guide-variable BIN = binning-input-variable