Opciones de la selección de características
La pestaña Opciones permite especificar la configuración predeterminada para seleccionar o excluir campos de entrada en el nugget de modelo. Tras ello, se puede añadir el modelo a una ruta para seleccionar un subconjunto de campos para usarlo en generaciones de modelos posteriores. Opcionalmente, se puede sobrescribir esta configuración seleccionando o anulando la selección de campos adicionales en el explorador de modelos cuando haya generado el modelo. Sin embargo, la configuración predeterminada permite aplicar el nugget de modelo sin más cambios, lo que puede ser especialmente útil para scripts.
Consulte el tema Resultados del modelo de selección de características para obtener más información. Las
Se encuentran disponibles las siguientes opciones:
Todos los campos clasificados. Selecciona los campos según la clasificación como important, marginal o unimportant. Se puede editar la etiqueta de clasificación, así como los valores de corte que se utilizan para asignar los registros a un rango u otro.
Número especificado de campos. Selecciona los n campos principales en función de su importancia.
Importancia mayor que. Selecciona todos los campos con una importancia superior al valor especificado.
El campo objetivo siempre se conserva, independientemente de la selección.
Opciones de clasificación de la importancia
Todos categóricos. Cuando todas las entradas y el objetivo son categóricos, la importancia se puede clasificar en función de cualquiera de las cuatro medidas siguientes:
- Chi-cuadrado de Pearson. Comprueba la independencia del objetivo y la entrada sin indicar la fuerza o la dirección de cualquier relación existente.
- Chi-cuadrado de la razón de verosimilitud. Parecida al chi-cuadrado de Pearson, pero también comprueba la independencia del objetivo y de la entrada entre sí.
- V de Cramer. Medida de asociación basada en el estadístico de chi-cuadrado de Pearson. Los valores oscilan entre 0 (que indica que no hay asociación) y 1 (que señala una asociación perfecta).
- Lambda. Una medida de asociación que refleja la reducción proporcional de error cuando se utiliza la variable para predecir el valor objetivo. Un valor de 1 indica que el campo de entrada predice perfectamente el objetivo, mientras que un valor de 0 denota que la entrada no proporciona información útil sobre el objetivo.
Algunos categóricos. Cuando algunas entradas, pero no todas, son categóricos y el objetivo también es categórico, la importancia se puede clasificar según los chi-cuadrado de Pearson o de la razón de verosimilitud. (La V de Cramer y lambda no estarán disponibles a menos que todas las entradas sean categóricas.)
Categóricos frente a continuos. Cuando se clasifica una entrada categórica al compararla con un objetivo continuo o a la inversa (uno de los dos es categórico, pero no ambos), se utiliza el estadístico F.
Ambos continuos. Cuando se clasifica una entrada continua al compararla con un objetivo continuo, se utiliza el estadístico t basado en el coeficiente de correlación.