Opciones de modelo para el nodo Logística

Nombre del modelo. Puede generar el nombre del modelo de forma automática basándose en el campo objetivo o de ID (o en el nombre del tipo de modelo si se especifica ningún campo objetivo), o bien especificar un nombre personalizado.

Utilice datos en particiones. Si se ha definido un campo de partición, esta opción garantiza que sólo se utilicen los datos de la partición de entrenamiento para la generación del modelo.

Crear modelos divididos. Genera un modelo diferente para cada valor posible de campos de entrada que se especifican como campos de división. Consulte Generación de modelos divididos si desea obtener más información.

Procedimiento. Especifica si se ha creado un modelo binomial o multinomial. Las opciones disponibles en el cuadro de diálogo varían en función del tipo de procedimiento de modelado seleccionado.

  • Binomial. Se utiliza cuando el campo objetivo es un campo marca o nominal con dos valores discretos (dicotómicos), como /no, encendido/apagado, hombre/mujer.
  • Multinomial. Se utiliza cuando el campo objetivo es un campo nominal con más de dos valores. Puede especificar Efectos principales, Factorial completo o Personalizada.

Incluir la constante en la ecuación. Esta opción determina si las ecuaciones resultantes incluirán un término constante. En la mayoría de las situaciones, debe dejar esta opción seleccionada.

Modelos binomiales

Para los modelos binomiales, están disponibles los siguientes métodos y opciones:

Método. Especifique el método que se va a utilizar para la creación del modelo de regresión logística.

  • Intro. Éste es el método predeterminado que introduce directamente todos los términos en la ecuación. No se realiza ninguna selección de campos en la creación del modelo.
  • Por pasos hacia adelante. El método Por pasos hacia adelante de selección de campo crea la ecuación por pasos, como su nombre indica. El modelo inicial es el más simple que puede haber, sin ningún término del modelo (excepto el constante) en la ecuación. En cada paso, se evalúan los términos que no se han añadido aún al modelo y si el mejor de dichos términos se suma de forma significativa a la eficacia predictiva del modelo, se añadirá a éste. Además, los términos que se encuentran actualmente en el modelo se vuelven a evaluar para determinar si se puede eliminar alguno de ellos sin que afecte al modelo de forma significativa. Si es así, se eliminan. El proceso se repite y se añaden y/o eliminan otros términos. Cuando no se puedan añadir más términos para mejorar el modelo, y no se puedan eliminar más sin que le afecte, se creará el modelo final.
  • Por pasos hacia atrás. El método Por pasos hacia atrás es fundamentalmente lo contrario al método Por pasos hacia adelante. Con este método, el modelo inicial contiene todos los términos como predictores. En cada paso, se evalúan los términos del modelo y se eliminan los que no afecten al modelo de forma significativa. Además, los términos eliminados anteriormente se vuelven a evaluar para determinar si el mejor de dichos términos se añade de forma significativa a la eficacia predictiva del modelo. Si es así, se volverá a añadir al modelo. Cuando no se puedan añadir más términos para mejorar el modelo y no se puedan eliminar más sin que le afecte, se creará el modelo final.

Entradas categóricas. Enumera los campos que están identificados como categóricos, o sea, los que tienen un nivel de medición de marca, nominal u ordinal. Puede especificar el contraste y la categoría base para cada campo categórico.

  • Nombre de campo. Esta columna contiene los nombres de campo de las entradas categóricas. Para añadir entradas continuas o numéricas a esta columna, pulse en el icono de agregar campos situado a la derecha de la lista y, a continuación, seleccione las entradas requeridas.
  • Contraste. La interpretación de los coeficientes de regresión para un campo categórico depende de los contrastes utilizados. El contraste determina como se configuran los contrastes de hipótesis para comparar las medias estimadas. Por ejemplo, si sabe que un campo categórico tiene un orden implícito (como un patrón o agrupación), puede utilizar el contraste para modelar dicho orden. Los contrastes disponibles son:

    Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una categoría. Éste es el método predeterminado.

    simples. Se compara cada categoría del campo predictor, excepto la categoría de referencia, con la categoría de referencia.

    Diferencia. Se compara cada categoría del campo predictor, excepto la primera categoría, con el efecto promedio de las categorías anteriores. También se conoce como contrastes de Helmert inversos.

    Helmert. Se compara cada categoría del campo predictor, excepto la última categoría, con el efecto promedio de las categorías posteriores.

    Repetidas. Se compara cada categoría del campo predictor, excepto la primera categoría, con la categoría que la precede.

    Polinómico. Contrastes polinómicos ortogonales. Se supone que las categorías están espaciadas de forma equidistante. Los contrastes polinómicos están disponibles sólo para los campos numéricos.

    Desviación. Se compara cada categoría del campo predictor, excepto la categoría de referencia, con el efecto global.

  • Categoría base. Especifica de qué forma se determina la categoría de referencia para el tipo de contraste seleccionado. Seleccione Primera para utilizar la primera categoría para el campo de entrada, -ordenado alfabéticamente, o seleccione Última para utilizar la última categoría. La categoría base predeterminada se aplica a las variables que están listadas en el área Entradas categóricas.
    Nota: Este campo no está disponible si el valor de contraste se Diferencia, Helmert, Repetido o Polinómico.

La estimación del efecto de cada campo sobre la respuesta global se calcula como un aumento o disminución en la verosimilitud de cada una de las otras categorías relativas a la categoría de referencia. Esto puede ayudarle a identificar los campos y valores con más posibilidades de producir una respuesta específica.

La categoría base se muestra en el resultado como 0,0. Esto se debe a que, al compararse consigo misma, produce un resultado vacío. El resto de categorías se muestran como ecuaciones relevantes para la categoría base. Consulte Detalles del nugget de modelo logístico para obtener más información.

Modelos multinomiales

Para los modelos multinomiales, están disponibles los siguientes métodos y opciones:

Método. Especifique el método que se va a utilizar para la creación del modelo de regresión logística.

  • Intro. Éste es el método predeterminado que introduce directamente todos los términos en la ecuación. No se realiza ninguna selección de campos en la creación del modelo.
  • Por pasos. El método de selección de campos Por pasos crea la ecuación por pasos, como su nombre indica. El modelo inicial es el más simple que puede haber, sin ningún término del modelo (excepto el constante) en la ecuación. En cada paso, se evalúan los términos que no se han añadido aún al modelo y si el mejor de dichos términos se suma de forma significativa a la eficacia predictiva del modelo, se añadirá a éste. Además, los términos que se encuentran actualmente en el modelo se vuelven a evaluar para determinar si se puede eliminar alguno de ellos sin que afecte al modelo de forma significativa. Si es así, se eliminan. El proceso se repite y se añaden y/o eliminan otros términos. Cuando no se puedan añadir más términos para mejorar el modelo, y no se puedan eliminar más sin que le afecte, se creará el modelo final.
  • Adelante. El método Adelante de la selección de campos se parece al método Por pasos en el que el modelo se crea por pasos. No obstante, con este método, el modelo inicial es el más simple y sólo se pueden añadir los términos y la constante al modelo. En cada paso, los términos que no están aún en el modelo se prueban en función de lo que puedan mejorarlo y el que resulte ser el mejor de esos términos es el que se añade al modelo. Cuando no se puedan añadir más términos, o el mejor candidato no produzca una mejora lo suficientemente grande en el modelo, se creará el modelo final.
  • Hacia atrás. El método Hacia atrás es fundamentalmente lo contrario al método Adelante. Con este método, el modelo inicial contiene todos los términos como predictores y sólo se pueden eliminar los términos del modelo. Los términos del modelo que contribuyen poco al modelo se eliminan uno a uno hasta que no se puedan eliminar más sin que lo perjudiquen de forma significativa, dando lugar al modelo final.
  • Por pasos hacia atrás. El método Por pasos hacia atrás es fundamentalmente lo contrario al método Por pasos. Con este método, el modelo inicial contiene todos los términos como predictores. En cada paso, se evalúan los términos del modelo y se eliminan los que no afecten al modelo de forma significativa. Además, los términos eliminados anteriormente se vuelven a evaluar para determinar si el mejor de dichos términos se añade de forma significativa a la eficacia predictiva del modelo. Si es así, se volverá a añadir al modelo. Cuando no se puedan añadir más términos para mejorar el modelo y no se puedan eliminar más sin que le afecte, se creará el modelo final.
Nota: Los métodos automáticos, incluidos Por pasos, Hacia adelante y Hacia atrás, son métodos de aprendizaje altamente adaptables y tienen una fuerte tendencia a sobreajustarse a los datos de entrenamiento. Cuando se utilicen estos métodos, es muy importante comprobar la validez del modelo resultante, bien con datos nuevos o con una muestra de comprobación reservada mediante el nodo Partición.

Categoría base para el objetivo. Especifica cómo se determina la categoría de referencia. Se utiliza como línea de base con la que se estiman las ecuaciones de regresión para todas las otras categorías del objetivo. Seleccione Primera para utilizar la primera categoría para el campo objetivo actual, ordenado alfabéticamente, o seleccione Última para utilizar la última categoría. Si lo prefiere, puede seleccionar Especificar para seleccionar una categoría específica y elegir el valor deseado de la lista. Se pueden definir los valores disponibles para cada campo en un nodo Tipo.

Normalmente se especifica la categoría en la que se está menos interesado como categoría base, por ejemplo, un producto líder con pérdidas. A continuación, se relaciona con la categoría base el resto de categorías de forma relativa para identificar la probabilidad de que estén en su propia categoría. Esto puede ayudarle a identificar los campos y valores con más posibilidades de producir una respuesta específica.

La categoría base se muestra en el resultado como 0,0. Esto se debe a que, al compararse consigo misma, produce un resultado vacío. El resto de categorías se muestran como ecuaciones relevantes para la categoría base. Consulte Detalles del nugget de modelo logístico para obtener más información.

Tipo de modelo. Hay tres opciones para definir los términos del modelo. Los modelos Efectos principales sólo incluyen los campos de entrada de forma individual y no comprueban las interacciones (efectos multiplicativos) entre los campos de entrada. Los modelos del tipo Factorial completo incluyen todas las interacciones, así como los efectos principales de los campos de entrada. Los modelos factoriales completos están más capacitados para capturar relaciones complejas pero son mucho más difíciles de interpretar y tienen más posibilidades de sufrir sobreajuste. Debido a la posibilidad de que haya un gran número de combinaciones posibles, los métodos de selección automática de campos (métodos distintos de Introducir) se desactivarán para los modelos factoriales completos. Los modelos Personalizados sólo incluyen los términos que se especifiquen (efectos principales e interacciones). Cuando seleccione esta opción, utilice la lista Términos del modelo para añadir términos al modelo o eliminarlos.

Términos del modelo. Al crear un modelo personalizado, deberá especificar explícitamente los términos del modelo. La lista muestra el conjunto actual de términos para el modelo. Los botones situados en el lado derecho de la lista Términos del modelo le permiten añadir y eliminar términos de modelo.

  • Para añadir términos al modelo, pulse en el botón Añadir nuevos términos del modelo. Consulte el tema Adición de términos a un modelo de regresión logística para obtener más información.
  • Seleccione los términos deseados para eliminarlos y pulse en el botón Eliminar los términos del modelo seleccionado.