propriedades das árvores

Ícone do nó da árvore-ASO nó Tree-AS é semelhante ao nó CHAID; no entanto, o nó Tree-AS é projetado para processar big data para criar uma única árvore e exibe o modelo resultante no visualizador de saída. O nó gera uma árvore de decisão usando estatísticas de qui-quadrado (CHAID) para identificar as divisões ideais. Esse uso do CHAID pode gerar árvores não binárias, o que significa que algumas divisões têm mais de dois ramos. Os campos de destino e de entrada podem ser de intervalo numérico (contínuo) ou categóricos. O CHAID exaustivo é uma modificação do CHAID que faz um trabalho mais completo ao examinar todas as divisões possíveis, mas leva mais tempo para ser calculado.

Tabela 1. propriedades de treeas
treeas Propriedades Valores Descrição da propriedade
target campo No nó Tree-AS, os modelos CHAID exigem um único destino e um ou mais campos de entrada. Um campo de frequência também pode ser especificado. Veja Propriedades do nó de modelagem comum para obter mais informações.
method chaid exhaustive_chaid  
max_depth número inteiro Profundidade máxima da árvore, de 0 a 20. O valor padrão é 5.
num_bins número inteiro Usado somente se os dados forem compostos de entradas contínuas. Defina o número de compartimentos de frequência iguais a serem usados para as entradas; as opções são: 2, 4, 5, 10, 20, 25, 50 ou 100.
record_threshold número inteiro O número de registros em que o modelo mudará do uso de valores de p para tamanhos de efeito ao construir a árvore. O padrão é 1.000.000; aumente ou diminua esse valor em incrementos de 10.000.
split_alpha número Nível de significância para divisão. O valor deve estar entre 0.01 e 0.99.
merge_alpha número Nível de significância para fusão. O valor deve estar entre 0.01 e 0.99.
bonferroni_adjustment sinalização Ajuste os valores de significância usando o método de Bonferroni.
effect_size_threshold_cont número Defina o limite do tamanho do efeito ao dividir nós e mesclar categorias ao usar um alvo contínuo. O valor deve estar entre 0.01 e 0.99.
effect_size_threshold_cat número Defina o limite do tamanho do efeito ao dividir nós e mesclar categorias ao usar um destino categórico. O valor deve estar entre 0.01 e 0.99.
split_merged_categories sinalização Permitir a reintegração de categorias mescladas.
grouping_sig_level número Usado para determinar como os grupos de nós são formados ou como os nós incomuns são identificados.
chi_square pearson likelihood_ratio Método usado para calcular a estatística de qui-quadrado: Pearson ou razão de verossimilhança
minimum_record_use use_percentage use_absolute  
min_parent_records_pc número O valor padrão é 2. Mínimo 1, máximo 100, em incrementos de 1. O valor do ramo pai deve ser maior que o do ramo filho.
min_child_records_pc número O valor padrão é 1. Mínimo 1, máximo 100, em incrementos de 1.
min_parent_records_abs número O valor padrão é 100. Mínimo 1, máximo 100, em incrementos de 1. O valor do ramo pai deve ser maior que o do ramo filho.
min_child_records_abs número O valor padrão é 50. Mínimo 1, máximo 100, em incrementos de 1.
epsilon número Alteração mínima nas frequências celulares esperadas...
max_iterations número Máximo de iterações para convergência.
use_costs sinalização  
costs estruturado Propriedade estruturada. O formato é uma lista de 3 valores: o valor real, o valor previsto e o custo se a previsão estiver errada. Por exemplo: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY", 4.0]])
default_cost_increase none linear square custom Ativado somente para alvos ordinais. Definir valores padrão na matriz de custos.
calculate_conf sinalização  
display_rule_id sinalização Adiciona um campo na saída de pontuação que indica o ID do nó terminal ao qual cada registro é atribuído.