Opciones de análisis del nodo de modelado
Muchos nodos de modelado incluyen la pestaña Analizar que le permite obtener información sobre la importancia de los predictores junto con puntuaciones de propensión ajustadas y en bruto.
Evaluación del modelo
Calcular importancia del predictor. En el caso de modelos que produzcan una medida adecuada de importancia, puede mostrar un gráfico que indique la importancia relativa de cada predictor al estimar el modelo. Normalmente, desea centrar sus esfuerzos de modelado en los predictores que importan más y considera eliminar o ignorar los que importan menos. Tenga en cuenta que puede tardarse más tiempo en calcular la importancia del predictor para algunos modelos, especialmente al trabajar con conjuntos de datos de gran tamaño; además, como resultado está desactivada para algunos modelos de forma predeterminada. La importancia del predictor no está disponible para modelos de listas de decisiones. Consulte Importancia del predictor si desea obtener más información.
Puntuaciones de propensión
Las puntuaciones de propensión pueden activarse en el nodo de modelado y en la pestaña Configuración del nugget de modelo. Esta funcionalidad sólo está disponible cuando el objetivo seleccionado es un campo de marca. Consulte Puntuaciones de propensión para obtener más información.
Calcular puntuaciones de propensión en bruto. Las puntuaciones de propensión en bruto están derivadas del modelo basado únicamente en los datos de entrenamiento. Si el modelo predice el valor true (responderá), la propensión es la misma que P, donde P es la probabilidad de la predicción. Si el modelo predice el valor false, la propensión se calcula como (1 - P).
- Si selecciona esta opción al crear el modelo, las puntuaciones de propensión se activarán en el nugget de modelo de forma predeterminada. Sin embargo, siempre puede activar las puntuaciones de propensión en bruto en el nugget de modelo independientemente de si las selecciona o no en el nodo de modelado.
- Al puntuar el modelo, se añadirán puntuaciones de propensión en bruto a un campo con las letras RP unidas al prefijo estándar. Por ejemplo, si las predicciones están en un campo denominado $R-churn, el nombre del campo de puntuación de propensión será $RRP-churn.
Calcular puntuaciones de propensión ajustada. Las propensiones brutas se basan totalmente en estimaciones proporcionadas por el modelo, las cuales pueden estar ajustadas excesivamente, lo que lleva a estimaciones de propensión demasiado optimistas. Las propensiones ajustadas intentan compensar este hecho observando el rendimiento del modelo en las particiones de comprobación o validación y ajustando las propensiones para proporcionar una mejor estimación en consecuencia.
- Esta configuración requiere que haya un campo de partición válido en la ruta.
- A diferencia de las puntuaciones brutas de confianza, las puntuaciones ajustadas de propensión deben calcularse al crear el modelo; de lo contrario, no estarán disponibles cuando se puntúe el nugget de modelo.
- Al puntuar el modelo, se añadirán puntuaciones ajustadas de propensión a un campo con las letras AP unidas al prefijo estándar. Por ejemplo, si las predicciones están en un campo denominado $R-churn, el nombre del campo de puntuación de propensión será $RAP-churn. Las puntuaciones ajustadas de propensión no están disponibles para modelos de regresión logística.
- Al calcular las puntuaciones ajustadas de propensión, la partición de comprobación o validación utilizada para el cálculo no debe haberse equilibrado. Para evitarlo, asegúrese de seleccionar la opción Sólo datos de entrenamiento de equilibrado en todos los nodos Equilibrar anteriores en la ruta. Además, si se ha llevado una muestra compleja a un punto anterior en la ruta, se invalidarán las puntuaciones ajustadas de propensión.
- Las puntuaciones ajustadas de propensión no están disponibles para modelos de árbol "aumentado" y de conjuntos de reglas. Consulte Modelos C5.0 aumentados para obtener más información.
Basado en. Para que se calculen las puntuaciones ajustadas de propensión, debe haber un campo de partición en la ruta. Puede especificar si desea utilizar la partición de comprobación o validación para este cálculo. Para obtener los mejores resultados, la partición de comprobación o validación debe incluir al menos el mismo número de registros que la partición utilizada para entrenar el modelo original.