Selección de modelo (modelos lineales)
Método de selección de modelos. Seleccione uno de los métodos de selección de modelos (a continuación se encuentran los detalles) o Incluir todos los predictores, que simplemente introduce todos los predictores disponibles como términos del modelo de efectos principales. De forma predeterminada, se utiliza Pasos sucesivos hacia adelante.
Selección de Pasos sucesivos hacia adelante. Comienza sin efectos en el modelo y añade y elimina efectos paso por paso hasta que ya no se puedan añadir o eliminar según los criterios de los pasos sucesivos.
- Criterios para entrada/eliminación. Ésta es la estadística utilizada para determinar si debe añadirse o eliminarse un efecto del modelo. Criterio de información (AICC) se basa en la similitud del conjunto de entrenamiento que se le da al modelo, y se ajusta para penalizar modelos excesivamente complejos. Estadísticos de F se utiliza en una prueba estadística de la mejora en el error de modelo. R cuadrado corregida se basa en el ajuste del conjunto de entrenamiento, y se ajusta para penalizar modelos excesivamente complejos.
Criterio de prevención sobreajustado (ASE) se basa en el ajuste del conjunto (error cuadrático medio, ASE) de prevención sobreajustado. El conjunto de prevención sobreajustado es una submuestra aleatoria de aproximadamente 30% del conjunto de datos original que no se utiliza para entrenar el modelo.
Si se selecciona otro criterio que no sea Estadísticos de F, se añadirá al modelo cada paso del efecto que se corresponda con el aumento positivo mayor en el criterio. Se eliminará cualquier efecto en el modelo que se corresponda con una disminución en el criterio.
Si se selecciona Estadísticos de F como criterio, cada paso en el efecto que tenga el valor p más pequeño inferior al umbral especificado, se añadirá Incluir efectos con valores p inferiores a al modelo. El valor predeterminado es 0,05. Cualquier efecto en el modelo con un valor p superior al umbral especificado, Eliminar efectos con valores p mayores que, será eliminado. El valor predeterminado es 0.10.
- Personalizar número máximo de efectos en el modelo final. De forma predeterminada, pueden introducirse todos los efectos disponibles en el modelo. Del mismo modo, si el algoritmo por pasos sucesivos termina con un paso con el número máximo de efectos especificado, el algoritmo se detiene con el conjunto actual de efectos.
- Personalizar número máximo de pasos. El algoritmo por pasos sucesivos termina tras un cierto número de pasos. De forma predeterminada, es 3 veces el número de efectos disponibles. Del mismo modo, especifique un entero positivo para el número máximo de pasos.
Selección de mejores subconjuntos. Comprueba "todos los modelos posibles", o al menos el subconjunto más grande de los modelos posibles que los pasos sucesivos hacia adelante, para seleccionar el mejor según el criterio de mejores subconjuntos. Criterio de información (AICC) se basa en la similitud del conjunto de entrenamiento que se le da al modelo, y se ajusta para penalizar modelos excesivamente complejos. R cuadrado corregida se basa en el ajuste del conjunto de entrenamiento, y se ajusta para penalizar modelos excesivamente complejos. Criterio de prevención sobreajustado (ASE) se basa en el ajuste del conjunto (error cuadrático medio, ASE) de prevención sobreajustado. El conjunto de prevención sobreajustado es una submuestra aleatoria de aproximadamente 30% del conjunto de datos original que no se utiliza para entrenar el modelo.
Se selecciona el modelo con el valor mayor del criterio como el mejor modelo.