Benutzerdefinierte Aufteilungen definieren
Sie können den Prädiktor auswählen und Bedingungen für jede Aufteilung angeben.
- Klicken Sie im interaktiven Baum-Builder mit der rechten Maustaste auf einen Knoten und wählen Sie "Aufteilung anpassen" aus.
- Wählen Sie den gewünschten Prädiktor aus der Liste Aufteilen auf aus.
- Sie können die Standardbedingungen für jede Aufteilung akzeptieren oder Bedingungen für die Aufteilung angeben.
- Bei stetigen Prädiktoren (numerischer Bereich) können Sie die verfügbaren Felder verwenden, um den Wertebereich anzugeben, der in jeden neuen Knoten fällt.
- Bei kategorialen Prädiktoren können Sie die verfügbaren Felder verwenden, um die spezifischen Werte (oder den Wertebereich im Fall eines ordinalen Prädiktors) anzugeben, die jedem neuen Knoten zugeordnet werden.
- Klicken Sie auf Anwenden , um die Verzweigung mit dem ausgewählten Prädiktor neu zu erweitern.

Der Baum kann unabhängig von Stoppregeln im Allgemeinen mithilfe eines beliebigen Prädiktors aufgeteilt werden. Die einzigen Ausnahmen sind, wenn der Knoten rein ist (d. h., dass 100% der Fälle in dieselbe Zielklasse fallen, also nichts aufzuteilen bleibt) oder der ausgewählte Prädiktor konstant ist (es gibt nichts zu teilen).
In der Detailansichtzeigt die interaktive Baumstruktur Statistiken für verfügbare Prädiktoren (oder "Wettbewerber", wie sie manchmal genannt werden) an, die für die aktuelle Aufteilung verwendet werden können.
- Bei CHAID wird die Chi-Quadrat-Statistik für jeden kategorialen Prädiktor aufgelistet. Wenn ein Prädiktor ein numerischer Bereich ist, wird die
F-Statistik angezeigt. Die Chi-Quadrat-Statistik ist ein Maß dafür, wie unabhängig das Zielfeld vom Aufteilungsfeld ist. Eine hohe Chi-Quadrat-Statistik bezieht sich im Allgemeinen auf eine geringere Wahrscheinlichkeit, was bedeutet, dass es weniger wahrscheinlich ist, dass die beiden Felder unabhängig sind-ein Hinweis darauf, dass die Aufteilung gut ist. Freiheitsgrade sind ebenfalls eingeschlossen, da diese die Tatsache berücksichtigen, dass es einfacher ist, eine Dreifachaufteilung mit einer großen Statistik und einer kleinen Wahrscheinlichkeit durchzuführen als eine Zweifachaufteilung. - Für C & R Tree und QUEST wird die Verbesserung für jeden Prädiktor angezeigt. Je höher die Verbesserung ist, desto höher ist die Verringerung der Unreinheit zwischen den übergeordneten und untergeordneten Knoten, wenn dieser Prädiktor verwendet wird. (Ein reiner Knoten ist ein Knoten, in dem alle Fälle in eine einzelne Zielkategorie fallen. je niedriger die Unreinheit im Baum, desto besser passt das Modell zu den Daten.) Mit anderen Worten, ein hoher Verbesserungswert weist im Allgemeinen auf eine sinnvolle Aufteilung für diesen Baumstrukturtyp hin. Das verwendete Unreinheitsmaß wird im Baumerstellungsknoten angegeben.