Definindo divisões customizadas

É possível selecionar o preditor e especificar as condições para cada divisão

  1. No construtor de árvore interativo, clique com o botão direito do mouse em um nó e selecione Personalizar divisão.
  2. Selecione o preditor desejado na lista Dividir em .
  3. É possível aceitar as condições padrão para cada divisão ou especificar condições para a divisão conforme apropriado.
    • Para preditores contínuos (intervalo numérico), é possível usar os campos disponíveis para especificar o intervalo de valores que caem em cada novo nó.
    • Para preditores categóricos, é possível usar os campos disponíveis para especificar os valores específicos (ou intervalo de valores no caso de um preditor ordinal) que são mapeados para cada novo nó.
  4. Clique em Aplicar para regenerar a ramificação usando o preditor selecionado
Figura 1. Customizar divisão
Customizar divisão

A árvore geralmente pode ser dividida utilizando qualquer preditor, independentemente das regras de parada. As únicas exceções são quando o nódulo é puro (significando que 100% dos casos caem na mesma classe de destino, portanto nada resta a dividir), ou o preditor escolhido é constante (não há nada para se dividir contra).

Em Visualização detalhada, a árvore interativa exibe estatísticas para preditores disponíveis (ou "concorrentes" como eles são chamados às vezes) que podem ser usados para a divisão atual.
  • Para CHAID, a estatística qui-quadrado é listada para cada preditor categórico; se um preditor for um intervalo numérico, a estatística F será mostrada. A estatística qui-quadrado é uma medida de quão independente o campo de destino é do campo de divisão Uma estatística qui-quadrado alta geralmente se relaciona a uma probabilidade mais baixa, o que significa que há menos chance de que os dois campos sejam independentes-uma indicação de que a divisão é boa. Graus de liberdade também são incluídos porque eles levam em conta o fato de que é mais fácil para uma divisão de três vias ter uma grande estatística e pequena probabilidade do que para uma divisão de duas vias.
  • Para C & R Tree e QUEST, a melhoria para cada preditor é exibida. Quanto maior a melhoria, maior a redução na impureza entre os nós pai e filho se esse preditor for usado. (Um nó puro é aquele em que todos os casos caem em uma única categoria de destino; quanto menor a impureza na árvore, melhor o modelo se ajusta aos dados.) Em outras palavras, um alto valor de melhoria geralmente indica uma divisão útil para esse tipo de árvore.. A medida de impureza usada é especificada no nó de construção de árvore