Regresión de cresta lineal: Opciones
La pestaña Opciones proporciona opciones para:
Modo
Esta selección proporciona opciones para especificar una de las modalidades siguientes:
- Ajustar con alfa especificado
- Cuando selecciona esta opción, se ajusta un único modelo a los datos de entrenamiento que utiliza sólo un valor de regularización alfa. Esto se establece de forma predeterminada. Si se especifica una partición, el modelo único o final que se ajusta se aplica a los datos de prueba retenidos para estimar el rendimiento fuera de muestra.
En Gráfico, se pueden seleccionar gráficos de los valores observados y/o de los residuos frente a los valores pronosticados.
En Guardar, puede especificar los valores pronosticados y los residuos que desea guardar.
- Gráfico de rastreo
- Cuando selecciona esta opción, se muestran tres gráficos para los datos de entrenamiento como una función de alfa para el conjunto especificado de valores de alfa:
- Un gráfico de trazado de cresta de coeficientes de regresión.
- Un gráfico de R2.
- Gráfico de error cuadrático medio (MSE).
Aunque se respeta la partición, no se proporcionan resultados para los datos de prueba retenidos porque no hay resultados de modelo finales de esta modalidad.
- Selección alfa mediante validación cruzada
Cuando selecciona esta opción, se realiza una búsqueda de cuadrícula con validación cruzada para evaluar modelos, y se elige el mejor alfa basándose en el mejor promedio de R2 sobre los pliegues de validación. El campo Número de pliegues de validación cruzada se puede utilizar para cambiar el valor predeterminado de cinco divisiones o pliegues para la validación cruzada. Si se especifica una partición, el modelo único o final que se ajusta se aplica a los datos de prueba retenidos para estimar el rendimiento fuera de muestra.
En Visualizar, puede seleccionar mostrar información básica sólo sobre el modelo con el valor elegido de alfa (Mejor), información básica sobre todos los modelos comparados (Comparar modelos) o información completa sobre todas las divisiones o pliegues para todos los modelos (Comparar modelos y pliegues). Mejor es el valor predeterminado.
En Gráfico, se pueden seleccionar gráficos de la media R2 y/o MSE sobre pliegues de validación. También se pueden seleccionar los gráficos de los valores observados y/o los residuos frente a los valores pronosticados.
En Guardar, puede especificar los valores pronosticados y los residuos que desea guardar.
- Especificar valores alfa individuales
- Cuando selecciona la modalidad Ajustar con alfa especificado , puede especificar un único valor de regularización de alfa. Cuando selecciona el modo Rastrear gráfico o Selección alfa mediante validación cruzada , puede especificar varios valores.
- Valores
- Especifique uno o varios valores de regularización alfa positivos. Puede especificar varios valores individualmente o como rangos. El valor predeterminado es 1.
- Especificar cuadrícula de valores alfa
- Cuando selecciona la modalidad Trazar gráfico o Selección alfa mediante validación cruzada , se puede especificar una cuadrícula de valores alfa exclusivos desde un valor de Inicio (
value1) a un valor de Fin (value2) con el incremento de Por (value3). Si se especifica, sólo se permite un conjunto válido de [value1 TO value2 BY value3]. Debe satisfacer ese0 ≤ value1 ≤ value2 ≤ 1. En los casos en los quevalue1 = value2, es equivalente a especificar un únicovalue1, independientemente devalue3.La métrica Alfa para rangos de valores puede ser Lineal o Base 10 logarítmica (10 se eleva a la potencia de los valores especificados).
Los gráficos se muestran utilizando la métrica especificada para los ejes X horizontales de los valores alfa variables.
Criterios
Controla los análisis.
- Incluir intersección
- Este criterio incluye una interceptación en uno o más modelos ajustados. Tenga en cuenta que el procedimiento de extensión no centra ni estandariza la variable dependiente, y la intersección no se penaliza durante la estimación.
- Estandarizar predictores
- Este criterio estandariza todas las variables independientes.
- Número de pliegues de validación cruzada
- Utilice este criterio para establecer el número de divisiones o pliegues para la evaluación de validación cruzada de modelos. El número debe ser un valor entero positivo mayor que 1. El valor predeterminado es 5.
- Estado aleatorio de Python
- El valor de random_state en Python se utiliza al realizar la evaluación de validación cruzada de modelos. Permite la réplica de resultados que implican números pseudoaleatorios. Debe ser un entero en el rango de 0 a 232-1. El valor predeterminado es 0.
- Límite de tiempo (minutos)
- El número de minutos permitidos para que se ejecuten los cálculos del modelo. Si especifica 0, el temporizador se desactiva. El valor predeterminado es 5.
Visualización
Esta sección especifica la cantidad de salida que se debe visualizar para la modalidad Selección alfa mediante validación cruzada .
- El mejor
- Sólo muestra los resultados básicos para el mejor modelo elegido. Esto se establece de forma predeterminada.
- Comparar modelos
- También muestra resultados básicos para todos los modelos evaluados.
- Comparar modelos y pliegues
- Por último, muestra resultados detallados completos para cada división o plegado para cada modelo evaluado.
Gráfico
Especifica gráficos de valores observados o residuales frente a valores pronosticados, con validación cruzada, especificación de gráficos de promedio de error cuadrático promedio (MSE) y/o promedio R2 sobre pliegues de validación cruzada frente a valores alfa.
- Promedio de error cuadrático promedio de validación cruzada (MSE) frente a alfa
- La modalidad Selección alfa mediante validación cruzada muestra un gráfico de líneas de promedio de MSE sobre pliegues de validación cruzada frente a alfa. Para la modalidad de Gráfico de rastreo , se genera automáticamente un gráfico similar basándose en los datos de entrenamiento completos.
- Promedio de R cuadrado de validación cruzada frente a alfa
- La modalidad Selección alfa mediante validación cruzada muestra un gráfico de líneas de R2 promedio sobre pliegues de validación cruzada frente a alfa. Para la modalidad de Gráfico de rastreo , se genera automáticamente un gráfico similar basándose en los datos de entrenamiento completos.
- Observado frente a Predicho
- Muestra un diagrama de dispersión de los valores observados frente a los pronosticados para el modelo especificado o el mejor.
- Residuos frente a pronosticados
- También muestra un diagrama de dispersión de residuos frente a valores pronosticados para el modelo especificado o el mejor.
Guardar
Especifica variables para guardar en el conjunto de datos activo.
- Valores pronosticados
- Guarde los valores pronosticados del modelo especificado o mejor en el conjunto de datos activo. De lo contrario, puede especificar un Nombre de variable personalizada.
- Residuos
- Guarde los residuos de las predicciones de modelo especificadas o mejores en el conjunto de datos activo. De lo contrario, puede especificar un Nombre de variable personalizada.