Objetivo (modelos GLE)
Estos ajustes definen el objetivo, su distribución y su relación con los predictores mediante la función de enlace.
Objetivo El objetivo es obligatorio. Puede tener cualquier nivel de medición y el nivel de medición del destino afecta a las distribuciones y funciones de enlace que son adecuadas.
- Utilizar destino predefinido Para utilizar los valores de destino desde un nodo Tipo situado en un punto anterior de la ruta (o la pestaña Tipos de un nodo de origen situado en un punto anterior de la ruta), seleccione esta opción.
- Utilizar destino personalizado Para asignar manualmente un destino, seleccione esta opción.
- Utilice el número de ensayos como denominador Cuando la respuesta prevista es un número de eventos que se producen en un conjunto de ensayos, el campo objetivo contiene el número de eventos y puede seleccionar un campo adicional que contiene el número de ensayos. Por ejemplo, al probar un nuevo pesticida puede que exponga muestras de hormigas a diferentes concentraciones del pesticida y, a continuación, registre el número de hormigas muertas y el número de hormigas de cada muestra. En este caso, el campo que registra el número de hormigas muertas debe especificarse como el campo objetivo (eventos) y el campo que registre el número de hormigas de cada muestra debe especificarse como el campo de ensayos. Si el número de hormigas es el mismo para cada muestra, entonces el número de ensayos puede especificarse mediante un valor fijo.
El número de ensayos debe ser superior o igual al número de eventos de cada registro. Los eventos deben ser enteros no negativos y los ensayos deben ser enteros positivos.
- Personalizar categoría de referencia. Para un objetivo categórico, puede seleccionar la categoría de referencia. Esto puede afectar a determinados resultados, como las estimaciones de los parámetros, pero no debería cambiar el ajuste del modelo. Por ejemplo, si su objetivo toma los valores 0, 1 y 2, de forma predeterminada, el procedimiento convierte la última categoría (el valor más alto), o 2, en la categoría de referencia. En esta situación, las estimaciones de los parámetros deben interpretarse como relacionadas con la verosimilitud de la categoría 0 o 1 relativa a la verosimilitud de la categoría 2. Si especifica una categoría personalizada y su objetivo tiene etiquetas definidas, puede establecer la categoría de referencia seleccionando un valor de la lista. Esto puede resultar cómodo cuando, al especificar un modelo, no se recuerda exactamente cómo se codificó un determinado campo.
Distribución de destino y relación (enlace) con el modelo lineal Teniendo en cuenta los valores de los predictores, el modelo espera que la distribución de los valores del objetivo siga la forma especificada, y que los valores de objetivo estén relacionados de forma lineal con los predictores a través de la función de enlace especificada. Se proporcionan los accesos directos de varios modelos comunes o seleccione un ajuste Personalizado si hay una combinación específica de distribución y función de enlace que desee ajustar y que no esté en la lista corta.
- Modelo lineal Especifica una distribución normal con un enlace de identidad, que es útil cuando el objetivo se puede pronosticar utilizando una regresión lineal o un modelo ANOVA.
- Regresión gamma Especifica una distribución gamma con un enlace log, que se deberá utilizar cuando el objetivo contiene todos los valores positivos y es asimétrico a valores mayores.
- Loglinear Especifica una distribución Poisson con un enlace log,que se deberá utilizar cuando el objetivo representa un recuento de apariciones en un periodo de tiempo fijo.
- Regresión binomial negativa Especifica una distribución binomial negativa con un enlace log, que se deberá utilizar cuando el objetivo y el denominador representan el número de ensayos necesarios para observar k éxitos.
- Regresión Tweedie Especifica una distribución Tweedie con funciones de enlace de potencia, logaritmo o identidad y son útiles para modelar respuestas que son una combinación de ceros y valores reales positivos. Estas distribuciones también se denominan Poisson compuesto, gamma compuesto y Poisson-gamma.
- Regresión logística multinomial Especifica una distribución multinomial, que se deberá utilizar cuando el objetivo es una respuesta de varias categorías. Utiliza un enlace logit acumulado (resultados ordinales) o un enlace logit generalizado (respuestas nominales de categorías múltiples).
- Regresión logística binaria Especifica una distribución binomial con un enlace logit, que se deberá utilizar cuando el objetivo es una repuesta binaria pronosticada por un modelo de regresión logística.
- Probit binario Especifica una distribución binomial con un enlace probit, que se deberá utilizar cuando el objetivo es una respuesta binaria con una distribución normal subyacente.
- Supervivencia censurada por intervalos Especifica una distribución binomial con un enlace log-log complementario, que es útil en el análisis de supervivencia cuando algunas observaciones no tienen ningún evento de terminación.
- Personalizado Especifique su propia combinación de la función de distribución y enlace.
Distribución
Esta selección especifica la Distribución del objetivo. La capacidad de especificar una distribución no normal y una función de enlace que no sea la identidad es la mejora principal del modelo lineal generalizado con respecto al modelo lineal. Hay muchas combinaciones posibles de distribución y función de enlace, varias de las cuales pueden ser adecuadas para un determinado conjunto de datos, por lo que su elección puede estar guiada por consideraciones teóricas a priori y por las combinaciones que parezcan funcionar mejor.
- Automático Si no está seguro de qué distribución a utilizar, seleccione esta opción; el nodo analiza los datos para calcular y aplicar el mejor método de distribución.
- Binomial Esta distribución solo es apropiada para un objetivo que representa una respuesta binaria o un número de eventos.
- Gamma Esta distribución es apropiada para un objetivo con valores de escala positivos que se desvían hacia valores positivos mayores. Si un valor de datos es menor o igual que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis.
- De Gauss inversa Esta distribución es apropiada para un objetivo con valores de escala positivos que se desvían hacia valores positivos mayores. Si un valor de datos es menor o igual que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis.
- Multinomial Esta distribución es apropiada para un objetivo que representa una respuesta de varias categorías. La forma del modelo dependerá del nivel de medición del objetivo.
Un objetivo nominal dará como resultado un modelo multinomial nominal en el que se calcula un conjunto independiente de parámetros del modelo para cada categoría del objetivo (excepto la categoría de referencia). Las estimaciones de parámetros de un predictor determinado muestran la relación entre ese predictor y la verosimilitud de cada categoría del objetivo, relativa a la categoría de referencia.
Un objetivo ordinal dará como resultado un modelo multinomial ordinal en el que el término de interceptación tradicional se sustituye por un conjunto de parámetros de umbral que se relacionan con la probabilidad acumulada de las categorías objetivo.
- Binomial negativa La regresión binomial negativa utiliza una distribución binomial negativa con un enlace de logaritmo, que se debe utilizar cuando el objetivo representa un recuento de apariciones con una varianza elevada.
- Normal Esto es apropiado para un objetivo continuo cuyos valores adoptan una distribución simétrica en forma de campana en torno a un valor central (media).
- Poisson Esta distribución se puede considerar el número de apariciones de un evento de interés en un periodo de tiempo fijo y es apropiado para variables con valores de entero que no sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis.
- Tweedie Esta distribución es adecuada para las variables que se pueden representar mediante mezclas de Poisson de distribuciones gamma; la distribución está "mezclada" en el sentido de que combina propiedades de distribuciones continuas (toma valores reales no negativos) y discretas (masa de probabilidad positiva en un único valor, 0). La variable dependiente debe ser numérica, con valores de datos mayores o iguales que cero. Si un valor de datos es menor que 0 o es un valor perdido, el correspondiente caso no se utilizará en el análisis. El valor fijo del parámetro de distribución Tweedie puede ser cualquier número mayor que uno y menor que dos.
Funciones de enlace
La función de enlace es una transformación del objetivo que permite la estimación del modelo. Se encuentran disponibles las siguientes funciones:
- Automático Si no está seguro de qué enlace utilizar, seleccione esta opción; el nodo analiza los datos para calcular y aplicar la mejor función de enlace.
- Identidad f(x)=x. El destino no se transforma. Este enlace se puede utilizar con cualquier distribución, excepto la multinomial.
- log-log complementario f(x)=log(−log(1−x)). Adecuado solamente con la distribución binomial o multinomial.
- Cauchit f(x) = tan(π (x − 0.5)). Adecuado solamente con la distribución binomial o multinomial.
- Log f(x)=log(x). Este enlace se puede utilizar con cualquier distribución, excepto la multinomial.
- Complemento log f(x)=log(1−x). Adecuado solamente con la distribución binomial.
- Logit f(x)=log(x / (1−x)). Adecuado solamente con la distribución binomial o multinomial.
- log-log negativo f(x)=−log(−log(x)). Adecuado solamente con la distribución binomial o multinomial.
- Probit f(x)=Φ−1(x), donde −1 es la función de distribución acumulada normal estándar inversa. Adecuado solamente con la distribución binomial o multinomial.
- Potencia f(x)=x α, if α ≠ 0. f(x)=log(x), si α=0. α es la especificación de número necesaria y debe ser un número real. Este enlace se puede utilizar con cualquier distribución, excepto la multinomial.
Parámetro para Tweedie Sólo disponible si ha seleccionado el botón de selección Regresión Tweedie o Tweedie como el método de Distribución. Seleccione un valor entre 1 y 2.