arbres propriétés

Icône de noeud Tree-ASLe noeud Tree-AS est similaire au noeud CHAID ; toutefois, le noeud Tree-AS est conçu pour traiter des données volumineuses afin de créer un arbre unique et affiche le modèle résultant dans le visualiseur de résultats. Le nœud génère un arbre de décision en utilisant les statistiques du chi carré (CHAID) pour identifier les divisions optimales. Cette utilisation de CHAID peut générer des arbres non-binaires, ce qui signifie que certaines divisions ont plus de deux branches. Les champs cibles et les champs de saisie peuvent être numériques (continus) ou catégoriels. Exhaustive CHAID est une modification de CHAID qui examine de manière plus approfondie toutes les divisions possibles, mais qui prend plus de temps à calculer.

Tableau 1. propriétés de treeas
treeas Propriétés Valeurs Description de la propriété
target zone Dans le nœud Tree-AS, les modèles CHAID nécessitent une seule cible et un ou plusieurs champs de saisie. Un champ de fréquence peut également être spécifié. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation .
method chaid exhaustive_chaid  
max_depth entier Profondeur maximale de l'arbre, de 0 à 20. La valeur par défaut est 5.
num_bins entier Utilisé uniquement si les données sont constituées d'entrées continues. Définissez le nombre de classes de fréquences égales à utiliser pour les entrées; les options sont : 2, 4, 5, 10, 20, 25, 50 ou 100.
record_threshold entier Nombre d'enregistrements pour lesquels le modèle passera de l'utilisation des valeurs p à celle des tailles d'effet lors de la construction de l'arbre. La valeur par défaut est 1 000 000; augmentez ou diminuez cette valeur par incréments de 10 000.
split_alpha numéro aujourd'hui Niveau de signification pour le fractionnement. La valeur doit être comprise entre 0.01 et 0.99.
merge_alpha numéro aujourd'hui Niveau de signification pour la fusion. La valeur doit être comprise entre 0.01 et 0.99.
bonferroni_adjustment option Ajuster les valeurs de signification à l'aide de la méthode de Bonferroni.
effect_size_threshold_cont numéro aujourd'hui Définissez le seuil de taille d'effet lors de la division des nœuds et de la fusion des catégories lors de l'utilisation d'une cible continue. La valeur doit être comprise entre 0.01 et 0.99.
effect_size_threshold_cat numéro aujourd'hui Définissez le seuil de taille d'effet lors de la division des nœuds et de la fusion des catégories lors de l'utilisation d'une cible catégorielle. La valeur doit être comprise entre 0.01 et 0.99.
split_merged_categories option Autoriser le redécoupage des catégories fusionnées.
grouping_sig_level numéro aujourd'hui Utilisé pour déterminer comment les groupes de nœuds sont formés ou comment les nœuds inhabituels sont identifiés.
chi_square pearson likelihood_ratio Méthode utilisée pour calculer la statistique du chi carré : Pearson ou rapport de vraisemblance
minimum_record_use use_percentage use_absolute  
min_parent_records_pc numéro aujourd'hui La valeur par défaut est 2. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parente doit être supérieure à celle de la branche enfant.
min_child_records_pc numéro aujourd'hui La valeur par défaut est 1. Minimum 1, maximum 100, par incréments de 1.
min_parent_records_abs numéro aujourd'hui La valeur par défaut est 100. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parente doit être supérieure à celle de la branche enfant.
min_child_records_abs numéro aujourd'hui La valeur par défaut est 50. Minimum 1, maximum 100, par incréments de 1.
epsilon numéro aujourd'hui Changement minimum des fréquences de cellules attendues.
max_iterations numéro aujourd'hui Nombre maximal d'itérations pour la convergence.
use_costs option  
costs Structuré Biens structurés. Le format est une liste de 3 valeurs : la valeur réelle, la valeur prédite et le coût si cette prédiction est erronée. Par exemple : tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY", 4.0]])
default_cost_increase none linear square custom Uniquement activé pour les cibles ordinales. Définir les valeurs par défaut dans la matrice des coûts.
calculate_conf option  
display_rule_id option Ajoute un champ dans la sortie de notation qui indique l'ID du nœud terminal auquel chaque enregistrement est attribué.