propriedades das árvores
O nó Tree-AS é semelhante ao nó CHAID; no entanto, o nó Tree-AS é projetado para processar big data para criar uma única árvore e exibe o modelo resultante no visualizador de saída. O nó gera uma árvore de decisão usando estatísticas de qui-quadrado (CHAID) para identificar as divisões ideais. Esse uso do CHAID pode gerar árvores não binárias, o que significa que algumas divisões têm mais de dois ramos. Os campos de destino e de entrada podem ser de intervalo numérico (contínuo) ou categóricos. O CHAID exaustivo é uma modificação do CHAID que faz um trabalho mais completo ao examinar todas as divisões possíveis, mas leva mais tempo para ser calculado.
treeas Propriedades |
Valores | Descrição da propriedade |
|---|---|---|
target |
campo | No nó Tree-AS, os modelos CHAID exigem um único destino e um ou mais campos de entrada. Um campo de frequência também pode ser especificado. Veja Propriedades do nó de modelagem comum para obter mais informações. |
method |
chaid exhaustive_chaid |
|
max_depth |
número inteiro | Profundidade máxima da árvore, de 0 a 20. O valor padrão é 5. |
num_bins |
número inteiro | Usado somente se os dados forem compostos de entradas contínuas. Defina o número de compartimentos de frequência iguais a serem usados para as entradas; as opções são: 2, 4, 5, 10, 20, 25, 50 ou 100. |
record_threshold |
número inteiro | O número de registros em que o modelo mudará do uso de valores de p para tamanhos de efeito ao construir a árvore. O padrão é 1.000.000; aumente ou diminua esse valor em incrementos de 10.000. |
split_alpha |
número | Nível de significância para divisão. O valor deve estar entre 0.01 e 0.99. |
merge_alpha |
número | Nível de significância para fusão. O valor deve estar entre 0.01 e 0.99. |
bonferroni_adjustment |
sinalização | Ajuste os valores de significância usando o método de Bonferroni. |
effect_size_threshold_cont |
número | Defina o limite do tamanho do efeito ao dividir nós e mesclar categorias ao usar um alvo contínuo. O valor deve estar entre 0.01 e 0.99. |
effect_size_threshold_cat |
número | Defina o limite do tamanho do efeito ao dividir nós e mesclar categorias ao usar um destino categórico. O valor deve estar entre 0.01 e 0.99. |
split_merged_categories |
sinalização | Permitir a reintegração de categorias mescladas. |
grouping_sig_level |
número | Usado para determinar como os grupos de nós são formados ou como os nós incomuns são identificados. |
chi_square |
pearson likelihood_ratio |
Método usado para calcular a estatística de qui-quadrado: Pearson ou razão de verossimilhança |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
número | O valor padrão é 2. Mínimo 1, máximo 100, em incrementos de 1. O valor do ramo pai deve ser maior que o do ramo filho. |
min_child_records_pc |
número | O valor padrão é 1. Mínimo 1, máximo 100, em incrementos de 1. |
min_parent_records_abs |
número | O valor padrão é 100. Mínimo 1, máximo 100, em incrementos de 1. O valor do ramo pai deve ser maior que o do ramo filho. |
min_child_records_abs |
número | O valor padrão é 50. Mínimo 1, máximo 100, em incrementos de 1. |
epsilon |
número | Alteração mínima nas frequências celulares esperadas... |
max_iterations |
número | Máximo de iterações para convergência. |
use_costs |
sinalização | |
costs |
estruturado | Propriedade estruturada. O formato é uma lista de 3 valores: o valor real, o valor previsto e o custo se a previsão estiver errada. Por exemplo: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
Ativado somente para alvos ordinais. Definir valores padrão na matriz de custos. |
calculate_conf |
sinalização | |
display_rule_id |
sinalização | Adiciona um campo na saída de pontuação que indica o ID do nó terminal ao qual cada registro é atribuído. |