Nodo Autonumérico

El nodo Autonumérico calcula y compara los modelos de resultados de rango numérico continuo utilizando varios métodos diferentes, permitiéndole probar una gran variedad de planteamientos en una única ejecución de modelado. Puede seleccionar los algoritmos que se utilizarán y experimentar con múltiples combinaciones de opciones. Por ejemplo, puede predecir valores de viviendas utilizando los modelos Red neuronal, Regresión lineal, C&RT y CHAID para ver cuál tiene el mejor rendimiento; asimismo, puede probar diferentes combinaciones de métodos de regresión Por pasos, Adelante y Hacia atrás. El nodo explora cada combinación posible de opciones, evalúa cada modelo candidato en función de la medida especificada y guarda los mejores para su uso en la puntuación o en futuros análisis. Consulte Nodos de modelado automático para obtener más información.

Ejemplo
Un municipio desea calcular de forma más precisa el impuesto sobre la propiedad y ajustar los valores de propiedades específicas del modo necesario sin tener que inspeccionar cada propiedad. Mediante el nodo Autonumérico, el analista puede generar y comparar un número de modelos que predicen valores de propiedad basándose en el tipo de edificación, vecindario, tamaño y otros factores conocidos.
Requisitos
Un único campo objetivo (con el rol establecido a Objetivo), y al menos un campo de entrada (con el rol establecido a Entrada). El objetivo debe ser un campo continuo (rango numérico), como edad o ingresos. Los campos de entrada pueden ser continuos o categóricos, con la limitación de que puede que algunas entradas no sean adecuadas para algunos tipos de modelo. Por ejemplo, los modelos C&RT pueden utilizar campos de cadena categóricos como entradas, mientras que los modelos Regresión lineal no pueden utilizar estos campos y los omitirán si se especifica. Los requisitos son los mismos que cuando se utilizan los nodos de modelado individuales. Por ejemplo, un modelo CHAID funciona igual independientemente de si se ha generado desde el nodo CHAID o el nodo Autonumérico.
Campos de frecuencia y ponderación
La frecuencia y la ponderación se utilizan para proporcionar importancia adicional a ciertos registros sobre otros porque, por ejemplo, el usuario sabe que el conjunto de datos creado no representa totalmente una sección de la población principal (Ponderación) o porque un registro representa un número de casos idénticos (Frecuencia). Si se especifica, los algoritmos C&RT y CHAID pueden utilizar un campo de frecuencia. Los algoritmos C&RT, CHAID, Regresión y GenLin pueden utilizar un campo de ponderación. Otros tipos de modelo omitirán estos campos y crearán los modelos de todas formas. Los campos de frecuencia y ponderación sólo se utilizan para la creación de modelos y no se tienen en cuenta al evaluar o puntuar modelos. Consulte Uso de campos de frecuencia y ponderación para obtener más información.
Prefijos
Si conecta un nodo de tabla al nugget para el nodo Autonumérico, existen distintas variables en la tabla con nombres que empiezan con un prefijo $.
Los nombres de los campos que se generan durante la puntuación se basan en el campo objetivo, pero con un prefijo estándar. Los distintos tipos de modelo utilizan diferentes conjuntos de prefijos.
Por ejemplo, los prefijos $G, $R, $C se utilizan como prefijo para las predicciones que han generado el modelo lineal generalizado, el modelo CHAID y el modelo C5.0, respectivamente. Normalmente, $X se genera utilizando un conjunto, y $XR, $XS y $XF se utilizan como prefijos en los casos donde el campo objetivo es un campo Continuo, Categórico o de Marca, respectivamente.
$.Los prefijos .E se utilizan para la confianza de predicción de un objetivo Continuo; por ejemplo, $XRE se utiliza como prefijo para el conjunto de confianza de predicción continua. $GE es el prefijo para una sola predicción de confianza para un modelo lineal generalizado.

Tipos de modelo soportados

Los tipos de modelo soportados incluyen red neuronal, árbol C&R, CHAID, regresión, GenLin, vecino más cercano, SVM, XGBoost Linear, GLE y XGBoost-AS. Si desea obtener más información, consulte Opciones de experto para el nodo Autonumérico.

Aprendizaje de las máquinas continuo

Un inconveniente del modelado de modelos es que queden obsoletos debido a cambios en los datos con el tiempo. Esto se suele denominar deriva del modelo o deriva del concepto. Para ayudar a solucionar de forma eficiente una deriva del modelo, SPSS Modeler proporciona aprendizaje de las máquinas continuo. Esta característica está disponible para el nodo Clasificador automático y los nuggets de modelo de nodo Autonumérico. Para obtener más información, consulte Aprendizaje de las máquinas continuo.