Nó GLE

O modelo GLE identifica a variável dependente que está linearmente relacionada aos fatores e covariáveis por meio de uma função de ligação especificada. Além do mais, o modelo permite que a variável dependente tenha uma distribuição não normal. Ele abrange modelos estatísticos amplamente utilizados, como regressão linear para respostas distribuídas normalmente, modelos logísticos para dados binários, modelos log-lineares para dados de contagem, modelos de log-log complementares para dados de sobrevivência censurados por intervalo, além de muitos outros modelos estatísticos por meio de sua formulação de modelo amplamente generalizada.

Exemplos. Um companhia de navegação pode usar modelos lineares generalizados para ajustar uma regressão de Poisson às contagens de danos para uma variedade de tipos de navios construídos em períodos de tempo diferentes, sendo que o modelo resultante pode ajudar a determinar quais tipos de navios são mais propensos a danos.

Uma empresa de seguros para veículos pode usar modelos lineares generalizados para ajustar uma regressão de gama às solicitações de seguro quanto a danos em carros, sendo que o modelo resultante pode ajudar a determinar os fatores que mais contribuem com o tamanho da solicitação.

Pesquisadores médicos podem usar modelos lineares generalizados para ajustar uma regressão de log-log complementar aos dados de sobrevivência censurados por intervalo para predizer o tempo para recorrência de uma condição médica.

Os modelos GLE funcionam ao construir uma equação que relaciona os valores do campo de entrada com os valores do campo de saída. Após a geração do modelo, você pode usá-lo para estimar valores para novos dados.

Para um destino categórico, para cada registro, uma probabilidade de associação é calculada para cada categoria de saída possível. A categoria de destino com a probabilidade mais alta é designada como o valor de saída predito para esse registro.

Requisitos. Você precisa de um ou mais campos de entrada e exatamente um campo de destino (que pode ter um nível de medição de Continuous, Categorical, ou Flag) com duas ou mais categorias. Os campos utilizados no modelo devem ter seus tipos totalmente instanciados.

Observação: ao criar um fluxo pela primeira vez, você seleciona qual tempo de execução usar. Por padrão, os fluxos usam o tempo de execução do IBM SPSS Modeler. Se você quiser usar algoritmos nativos Spark em vez de algoritmos SPSS, selecione o tempo de execução Spark. As propriedades para este nó irão variar dependendo da opção de tempo de execução que você escolher.