KRR

KRR 在 定制表和高级统计信息中可用。

KRR 使用 Python sklearn.kernel_ridge.KernelRidge 类在一个或多个自变量上估计因变量的内核岭回归。 自变量包括模型超参数,或包括在指定的值网格上选择的超参数值。 通过使用 sklearn.model_selection.GridSearchCV 类来实现交叉验证。

注: 内核回归算法需要使用 N x N 矩阵,其中 N 是个案数。 内存需求随个案数快速增长,算法无法很好地扩展至大型数据集。 具体情况限制取决于操作系统和特定硬件。 当数据集包含 50,000 (或更少) 个案例时,可能会超出内存需求。
KRR dependent WITH covariate list
   [/KERNEL [ADDITIVE_CHI2(ALPHA={1}
                                 {[values] [value1 TO value2 BY value3]})] 
   [/KERNEL [CHI2(ALPHA={1}
                        {[values] [value1 TO value2 BY value3]})] 
                  GAMMA={1}
                        {[values] [value1 TO value2 BY value3]})]
   [/KERNEL COSINE(ALPHA={1}
                         {[values] [value1 TO value2 BY value3]})]
   [/KERNEL LAPLACIAN(ALPHA={1}
                            {[values] [value1 TO value2 BY value3]})]
                      GAMMA={1/p}
                            {[values] [value1 TO value2 BY value3]})]
   [/KERNEL LINEAR(ALPHA={1**}
                         {[values] [value1 TO value2 BY value3]})]
   [/KERNEL POLYNOMIAL(ALPHA={1}
                             {[values] [value1 TO value2 BY value3]})] 
                       GAMMA={1/p}
                             {[values] [value1 TO value2 BY value3]})]
                       COEF0={1}
                             {[values] [value1 TO value2 BY value3]})]
                       DEGREE={3} 
                              {[values] [value1 TO value2 BY value3]})]
   [/KERNEL RBF(ALPHA={1}
                      {[values] [value1 TO value2 BY value3]})]
                GAMMA={1/p}
                      {[values] [value1 TO value2 BY value3]})]
   [/KERNEL SIGMOID(ALPHA={1}
                          {[values] [value1 TO value2 BY value3]})]
                    GAMMA={1/p}
                          {[values] [value1 TO value2 BY value3]})]
                    COEF0={1}
                          {[values] [value1 TO value2 BY value3]})]
   [/CROSSVALID [NFOLDS={5**  }
                        {value}]
   [/CRITERIA TIMER={5**  }
                    {value}
   [/PRINT {BEST** }
           {COMPARE}
           {VERBOSE}]
   [/PLOT {OBSERVED} {RESIDUAL}]
   [/SAVE {PRED(varname)} {RESID(varname)} {DUAL(varname)}]

** 如果省略子命令或关键字,则为缺省。

/p 是预测变量或协变量的数目。

此命令读取活动数据集并导致执行任何暂挂命令。 请参阅主题 命令顺序 以获取更多信息。

可以从 内核岭回归 对话框生成 KRR 命令的语法。

示例

KRR y WITH x
   /KERNEL POLYNOMIAL(DEGREE=2 COEF0=1)
   /PLOT RESIDUALS_VS_PREDICTED
   /SAVE PRED RESID DUAL.
  • 扩展在 x上执行 y 的内核岭回归。
  • 使用多项式内核。
  • 多项式的程度为 2,表示二次函数。
  • 多项式内核的 0 系数设置为其缺省值 1
  • 内核中的伽玛值保留为缺省值 1/p
  • alpha 规则化参数保留为缺省值 1
  • 显示残差与预测值的散点图。
  • 使用缺省名称保存预测值,残差和对偶空间系数权重。