Nodo Clasificador automático

El nodo Clasificador automático calcula y compara modelos de los objetivos nominales (conjuntos) o binarios (yes/no), utilizando varios métodos diferentes, permitiéndole probar diversos planteamientos en una sola ejecución de modelado. Puede seleccionar los algoritmos que se utilizarán y experimentar con múltiples combinaciones de opciones. Por ejemplo, en lugar de elegir entre los métodos de función de base radial, polinómico, sigmoide o lineal para una SVM, puede probarlos todos. El nodo explora cada combinación posible de opciones, evalúa cada modelo candidato basándose en la medida especificada y guarda los mejores modelos para utilizarlos en la puntuación o en futuros análisis. Para obtener más información, consulte Nodos de modelado automático.
Ejemplo
Una empresa minorista contiene datos históricos en los que se registran las ofertas realizadas a determinados clientes en campañas anteriores. Ahora la empresa quiere obtener resultados más rentables realizando la mejor oferta para cada cliente.
Requisitos
Un campo de objetivo con un nivel de medición de Nominal o Marca (con el rol establecido a Objetivo), y al menos un campo de entrada (con el rol establecido a Entrada). En un campo de marca, el valor Verdadero definido para el campo objetivo se supone que representa un acierto al calcular beneficios, elevación y estadísticos relacionados. Los campos de entrada pueden tener un nivel de medición de Continuo o Categórico, con la limitación de que algunas entradas pueden no ser apropiadas para algunos tipos de modelos. Por ejemplo, los campos ordinales que se utilizan como entradas en los modelos C&RT, CHAID y QUEST deben tener almacenamiento numérico (no en cadenas); asimismo, estos modelos los omitirán si se especifica lo contrario. De igual modo, los campos de entrada continuos pueden establecerse en intervalos en algunos casos. Los requisitos son los mismos que cuando se utilizan los nodos de modelado individuales; por ejemplo, un modelo Red bayesiana funciona igual independientemente de si se ha generado desde el nodo Red bayesiana o el nodo Clasificador automático.
Campos de frecuencia y ponderación
La frecuencia y la ponderación se utilizan para proporcionar importancia adicional a ciertos registros sobre otros porque, por ejemplo, el usuario sabe que el conjunto de datos creado no representa totalmente una sección de la población principal (Ponderación) o porque un registro representa un número de casos idénticos (Frecuencia). Si se especifica, los modelos C&RT, CHAID, QUEST, Lista de decisiones y Red bayesiana pueden utilizar un campo de frecuencia. Los modelos C&RT, CHAID y C5.0 pueden utilizar un campo de ponderación. Otros tipos de modelo omitirán estos campos y crearán los modelos de todas formas. Los campos de frecuencia y ponderación sólo se utilizan para la creación de modelos y no se tienen en cuenta al evaluar o puntuar modelos. Para obtener más información, consulte Uso de campos de frecuencia y ponderación.
Prefijos
Si conecta un nodo tabla al nugget para el nodo Clasificador automático, existen varias variables nuevas en la tabla con nombres que empiezan con un prefijo $.
Los nombres de los campos que se generan durante la puntuación se basan en el campo objetivo, pero con un prefijo estándar. Los distintos tipos de modelo utilizan diferentes conjuntos de prefijos.
Por ejemplo, los prefijos $G, $R, $C se utilizan como prefijo para las predicciones que han generado el modelo lineal generalizado, el modelo CHAID y el modelo C5.0, respectivamente. Normalmente, $X se genera utilizando un conjunto, y $XR, $XS y $XF se utilizan como prefijos en los casos donde el campo objetivo es un campo Continuo, Categórico o de Marca, respectivamente.
$.Los prefijos .C se utilizan para la confianza de predicción de un objetivo Categórico o de Marca; por ejemplo, $XFC se utiliza como prefijo para la confianza de predicción de Marca del conjunto. $RC y $CC son los prefijos para una sola predicción de confianza para un modelo CHAID y un modelo C5.0, respectivamente.

Tipos de modelos admitidos

Los tipos de modelo soportados incluyen red neuronal, árbol C&R, QUEST, CHAID, C5.0, regresión logística, lista de decisiones, red bayesiana, discriminante, vecino más cercano, SVM, XGBoost Tree y XGBoost-AS. Consulte Opciones de experto para el nodo Clasificador automático para obtener más información.

Aprendizaje de las máquinas continuo

Un inconveniente del modelado de modelos es que queden obsoletos debido a cambios en los datos con el tiempo. Esto se suele denominar deriva del modelo o deriva del concepto. Para ayudar a solucionar de forma eficiente una deriva del modelo, SPSS Modeler proporciona aprendizaje de las máquinas continuo. Esta característica está disponible para el nodo Clasificador automático y los nuggets de modelo de nodo Autonumérico. Para obtener más información, consulte Aprendizaje de las máquinas continuo.