arbres propriétés
Le noeud Tree-AS est similaire au noeud CHAID ; toutefois, le noeud Tree-AS est conçu pour traiter des données volumineuses afin de créer un arbre unique et affiche le modèle résultant dans le visualiseur de résultats. Le nœud génère un arbre de décision en utilisant les statistiques du chi carré (CHAID) pour identifier les divisions optimales. Cette utilisation de CHAID peut générer des arbres non-binaires, ce qui signifie que certaines divisions ont plus de deux branches. Les champs cibles et les champs de saisie peuvent être numériques (continus) ou catégoriels. Exhaustive CHAID est une modification de CHAID qui examine de manière plus approfondie toutes les divisions possibles, mais qui prend plus de temps à calculer.
treeas Propriétés |
Valeurs | Description de la propriété |
|---|---|---|
target |
zone | Dans le nœud Tree-AS, les modèles CHAID nécessitent une seule cible et un ou plusieurs champs de saisie. Un champ de fréquence peut également être spécifié. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
method |
chaid exhaustive_chaid |
|
max_depth |
entier | Profondeur maximale de l'arbre, de 0 à 20. La valeur par défaut est 5. |
num_bins |
entier | Utilisé uniquement si les données sont constituées d'entrées continues. Définissez le nombre de classes de fréquences égales à utiliser pour les entrées; les options sont : 2, 4, 5, 10, 20, 25, 50 ou 100. |
record_threshold |
entier | Nombre d'enregistrements pour lesquels le modèle passera de l'utilisation des valeurs p à celle des tailles d'effet lors de la construction de l'arbre. La valeur par défaut est 1 000 000; augmentez ou diminuez cette valeur par incréments de 10 000. |
split_alpha |
numéro aujourd'hui | Niveau de signification pour le fractionnement. La valeur doit être comprise entre 0.01 et 0.99. |
merge_alpha |
numéro aujourd'hui | Niveau de signification pour la fusion. La valeur doit être comprise entre 0.01 et 0.99. |
bonferroni_adjustment |
option | Ajuster les valeurs de signification à l'aide de la méthode de Bonferroni. |
effect_size_threshold_cont |
numéro aujourd'hui | Définissez le seuil de taille d'effet lors de la division des nœuds et de la fusion des catégories lors de l'utilisation d'une cible continue. La valeur doit être comprise entre 0.01 et 0.99. |
effect_size_threshold_cat |
numéro aujourd'hui | Définissez le seuil de taille d'effet lors de la division des nœuds et de la fusion des catégories lors de l'utilisation d'une cible catégorielle. La valeur doit être comprise entre 0.01 et 0.99. |
split_merged_categories |
option | Autoriser le redécoupage des catégories fusionnées. |
grouping_sig_level |
numéro aujourd'hui | Utilisé pour déterminer comment les groupes de nœuds sont formés ou comment les nœuds inhabituels sont identifiés. |
chi_square |
pearson likelihood_ratio |
Méthode utilisée pour calculer la statistique du chi carré : Pearson ou rapport de vraisemblance |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
numéro aujourd'hui | La valeur par défaut est 2. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parente doit être supérieure à celle de la branche enfant. |
min_child_records_pc |
numéro aujourd'hui | La valeur par défaut est 1. Minimum 1, maximum 100, par incréments de 1. |
min_parent_records_abs |
numéro aujourd'hui | La valeur par défaut est 100. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parente doit être supérieure à celle de la branche enfant. |
min_child_records_abs |
numéro aujourd'hui | La valeur par défaut est 50. Minimum 1, maximum 100, par incréments de 1. |
epsilon |
numéro aujourd'hui | Changement minimum des fréquences de cellules attendues. |
max_iterations |
numéro aujourd'hui | Nombre maximal d'itérations pour la convergence. |
use_costs |
option | |
costs |
Structuré | Biens structurés. Le format est une liste de 3 valeurs : la valeur réelle, la valeur prédite et le coût si cette prédiction est erronée. Par exemple : tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
Uniquement activé pour les cibles ordinales. Définir les valeurs par défaut dans la matrice des coûts. |
calculate_conf |
option | |
display_rule_id |
option | Ajoute un champ dans la sortie de notation qui indique l'ID du nœud terminal auquel chaque enregistrement est attribué. |