nó CHAID

CHAID, ou Chi-squared Automatic Interaction Detection, é um método de classificação para construir árvores de decisão usando estatísticas de qui-quadrado para identificar divisões ideais.

CHAID primeiro examina as tabulações cruzadas entre cada um dos campos de entrada e o resultado e testa a significância usando um teste de independência qui-quadrado. Se mais de uma dessas relações for estatisticamente significativa, CHAID seleciona o campo de entrada que é o mais significativo (menor valor p ). Se uma entrada tiver mais de duas categorias, elas serão comparadas.. Essas categorias que não mostram diferenças no resultado são reduzidas juntas.. A mesclagem de categorias é feita juntando sucessivamente o par de categorias que mostram a diferença menos significativa. Esse processo de mesclagem de categoria para quando todas as categorias restantes diferirem no nível de teste especificado. Para campos de entrada nominal, quaisquer categorias podem ser mescladas e, para um conjunto ordinal, apenas categorias contínuas podem ser mescladas.

O Exhaustive CHAID é uma modificação do CHAID que executa uma tarefa mais completa de examinar todas as divisões possíveis para cada preditor, mas leva mais tempo para calcular.

Requisitos

Os campos de resposta e entrada podem ser contínuos ou categóricos. Nós podem ser divididos em dois ou mais subgrupos em cada nível. Quaisquer campos ordinais que são usados no modelo devem ter armazenamento numérico (não sequência). Se necessário, o nó Reclassificar pode ser usado para convertê-los.

pontos fortes

Ao contrário dos nós C & R Tree e QUEST, o CHAID pode gerar árvores não binárias, o que significa que algumas divisões têm mais de duas ramificações. Por esta razão, CHAID tende a criar uma árvore mais ampla do que os métodos de crescimento binário. O CHAID funciona para todos os tipos de entradas e aceita ambas ponderações de caso e variáveis de frequência.

Camadas customizadas

É possível customizar as propriedades para o nó CHAID para especificar campos que o algoritmo CHAID deve usar ao determinar onde dividir a árvore de decisão. Quando o fluxo do SPSS Modeler é executado, a árvore de decisão usa o campo especificado para essa camada quando ela é dividida. É possível especificar campos para diversas camadas para controlar cada divisão da árvore de decisão

É possível usar camadas customizadas para controlar o crescimento da árvore de decisão.. Esse controle é especialmente útil quando você conhece bem seu conjunto de dados ou tem algumas regras de decisão predefinidas

Para usar camadas customizadas, você deve ativá-las e configurá-la:
  1. Nas propriedades para o nó CHAID, expanda Opções do Modelador.
  2. Clique na caixa de seleção Customizar camadas e clique em Incluir valor..
  3. Clique na linha e selecione o nome de um campo na lista.
  4. Clique em Incluir valor para incluir mais linhas na tabela Camadas customizadas .