线性弹性网络回归
Linear Elastic Net 使用 Python sklearn.linear_model.ElasticNet 类在一个或多个自变量上估算因变量的正规化线性回归模型。 规则化组合了 L1 (套索) 和 L2 (岭) 惩罚。 该扩展包括可选方式,用于显示给定 L1 比率的不同 alpha 值的跟踪图,以及根据交叉验证选择 L1 比率和 alpha 超参数值。 当拟合单个模型或使用交叉验证来选择惩罚比率和/或 alpha 时,可使用保留数据分区来估算样本外性能。
除了将模型与 L1 惩罚比率和 alpha 规则化参数的指定值拟合之外,线性弹性网络还可以显示给定比率的 alpha 值范围的系数值的跟踪图,或者通过在指定的值网格上进行 k 倍交叉验证来促进超参数值的选择。 如果拟合单个模型,或者通过交叉验证执行比率和/或 alpha 选择,那么可以将最终模型应用于由输入数据分区创建的保留数据,以获取模型的样本外性能的有效估计。
获取线性弹性网络回归分析
- 从菜单中选择:
变量 对话框允许您指定一个变量,该变量将活动数据集中的每个个案分配给训练样本或坚持样本。
- 选择数字目标变量。 仅需要一个目标变量仅可运行分析。
- 指定依赖于数字的值。
- 至少指定一个分类因子变量或数字协变量。
(可选) 分区 提供一种方法来创建输入数据的暂挂或测试子集,以估算指定或所选模型的样本外性能。 在对过程所使用的任何变量具有无效数据的任何个案进行成列删除之后,将执行所有分区。 请注意,对于交叉验证,将在 Python中创建训练数据的折叠或分区。 无论有效方式如何,都不会在估算中使用分区创建的保留数据。
可以通过指定随机分配给每个样本的个案比率 (在 Training and Holdout partitions下) 来定义分区,也可以通过将每个个案分配给 training 或 holdout 样本的变量来定义分区。 不能同时指定训练和变量。 如果未指定分区,那么将创建大约 30% 的输入数据的保留样本。
训练% 指定活动数据集中要随机分配给训练样本的观测值的相对数量。 缺省训练为 70%。
此过程将粘贴 LINEAR_ELASTIC_NET 命令语法。