示例 (LINEAR_LASSO 扩展命令)

LINEAR_LASSO y WITH x1 TO x5
  /ALPHA=.75.
  • 在标准化版本的协变量列表 x1 TO x5上拟合了套索回归,其中包含变量 x1, x5以及活动数据集中 x1 和 x5之间的任何变量。
  • 规则化强度参数 ALPHA 设置为 .75 ,这意味着规则化小于缺省值 1。
  • 输入数据使用伪随机 70-30 分割进行分区。
LINEAR_LASSO y WITH x1 x2 z1 z2
  /PLOT RESIDUALS
  /SAVE PRED RESID.
  • 在 x1, x2, z1和 z2的标准化版本上拟合了套索回归 y。
  • alpha 规则化参数保留为缺省值 1。
  • 将显示残差与预测值的散点图。
  • 使用缺省名称保存预测值和残差。
  • 输入数据使用伪随机 70-30 分割进行分区。
LINEAR_LASSO y WITH x1 x2 x3
  /MODE = TRACE
  /ALPHA VALUES = -3 TO 2 BY .25 METRIC = LG10
  /PARTITION TRAINING = 3 HOLDOUT = 1.
  • 在标准化版本的 x1, x2和 x3上拟合了一系列套索回归模型。
  • 将显示回归系数,均方误差 (MSE) 和 R2 相对于训练数据的 alpha 的图,而不是表格输出。
  • Alpha 从 10-3 开始,到 102结束,中间值每 10.25 个单位在这些值之间 (例如, 10-2.75, 10-2.5, ... , 101.5, 101.75)。
  • 训练数据包含大约 75% 的输入数据的伪随机选择。
  • 由于未拟合单个模型或最终模型,因此未使用保留数据。
LINEAR_LASSO y BY group WITH x1 x2
  /MODE = CROSSVALID
  /ALPHA = .01 TO 2 BY .01
  /CRITERIA NFOLDS = 10 TIMER = 15
  /PARTITION TRAINING = 70 HOLDOUT = 30
  /PRINT COMPARE
  /SAVE PRED RESID.
  • 拟合一系列套索回归模型,在表示观察到的组类别以及 x1 和 x2的指标的标准化版本上回归 y。
  • 使用 200 个 alpha 值和 10 个交叉验证折,在选择 alpha 值时总共执行 2000 个拟合和评分循环。
  • CRITERIA 子命令中的 TIMER 指定项允许整个过程使用 15 分钟。
  • 大约 70% 的输入数据用于 alpha 选择过程,其余 30% 在 alpha 选择后,根据拟合到整个训练子集的模型进行评分。
  • 每个模型估算 10 次,平均交叉验证 R2 用于评估模型准确性。
  • 表格输出包含所有拟合模型的汇总结果,按交叉验证折上的平均 R2 降序排序,以及保留测试数据的评分结果。
  • 将为所有个案 (训练和坚持) 保存基于所选 alpha 值的预测值和残差。