Baumsicht
In der Baumsicht werden die Ergebnisse der Baumklassifikations-Mining-Läufe angezeigt. Sie enthält den Entscheidungsbaum, der durch die Klassifikations-Mining-Funktion aufgebaut wird. Der Entscheidungsbaum ist in eine Tabelle eingebettet.
Die Baumsicht zeigt außerdem die aus Eingabefeldern abgeleiteten Felder, wenn Sie die Maus über die Verzweigungen der Baumstruktur bewegen.
Der Baum besteht aus verschiedenen Knoten. Jeder Knoten des Baums entspricht einer Zeile in der Tabelle. Die Spalten der Tabelle zeigen die Attribute der Knoten an.

- Baum
- Jeder Knoten in der Spalte Baum verfügt über ein Diagramm, das die Verteilung der Sätze in diesem Knoten über die vorhersagbaren Klassen sichtbar macht. Jede der vorhersagbaren Klassen wird durch eine andere Farbe dargestellt. Der Anteil einer Farbe in einem Knoten stellt den Prozentsatz der Sätze dar, die zu der jeweiligen Klasse gehören. Es können mindestens zwei Klassen vorhergesagt werden. Sie können die Farbe einer bestimmten Klasse auf der Seite 'Farbschlüssel' des Eigenschaftennotizbuchs ändern.
Neben dem Diagramm wird die zugehörige Entscheidung angezeigt, die zur Zuordnung der Sätze zu diesem Knoten führt.
Die entsprechende Entscheidung kann typische Feldvergleichselemente enthalten, z. B.REVENUE_OF_CONTRACT<912oderDISTRIBUTOR≠CAR_DEALERS. Prädikate für Ausnahmefelder sind beispielsweiseLOCATION_SIZE IS NOT MISSINGoderLOCATION_SIZE IS MISSING.- Das Feldprädikat
LOCATION_SIZE IS MISSINGwird angewendet, wenn die Mining-Funktion beim Scoring des Datensatzes feststellt, dass dieses Feld leer ist. Das heißt, das Feld enthält einenNULL-Wert oder einen der Werte, die im Datenverzeichnis des PMML-Modells als fehlend definiert sind. - Das Feldprädikat
LOCATION_SIZE IS NOT MISSINGwird angewendet, wenn die Mining-Funktion beim Scoring des Datensatzes feststellt, dass dieses Feld nicht leer ist. Das heißt, es enthält keinenNULL-Wert oder keinen der Werte, die im Datenverzeichnis des PMML-Modells als fehlend definiert sind. Der spezielle Wert ist für das Scoring nicht von Bedeutung.Es könnte beispielsweise eine Spalte mit Telefonnummern geben. Das Modell könnte von folgenden Bedingungen abhängig sein:- Die Telefonnummern sind angegeben. Das heißt, die Felder sind nicht leer.
- Die Telefonnummern sind nicht angegeben. Das heißt, die Felder sind leer oder enthalten
NULL-Werte.
Wenn viele verschiedene Klassen mit annähernd derselben Größe vorhanden sind, z. B. im Fall von numerischen Vorhersagen, zeigen die Diagramme in den Knoten nicht die Verteilung der Sätze an, sondern die Klassenbezeichnung dieses Knotens. Das heißt, die Knoten sind in der Farbe dargestellt, die dem vorhersagten Wert laut Legende zugeordnet ist.
- Das Feldprädikat
- Knoten-ID
- Die Knoten-IDs zeigen die berechneten Ebenen des Baums.
Jeder Knoten im Baum wird durch eine Knoten-ID identifiziert. Die Knoten-ID wird durch Erweiterung der übergeordneten ID eines Knotens durch ".x" gebildet, wobei x die Position dieses Knotens in Bezug auf die anderen Geschwisterknoten ist. Der Anfangsknoten (Rootknoten) hat die ID 1.
Knoten B kann beispielsweise das zweite untergeordnete Element von Knoten A sein. Knoten A hat die Knoten-ID 1.2. Die Knoten-ID des Knotens B ist 1.2.2. Mit dieser Knoten-ID-Struktur lässt sich der Pfad vom Anfangsknoten zu einem beliebigen anderen Knoten sowie die Ebene eines Knotens in einem Baum leicht ermitteln.
- Bewertung
- Der Score eines Knotens ist ein Attribut des PMML-Modells. Er zeigt die Klasse, für die alle Sätze in diesem Knoten vorhergesagt werden. Sie können beispielsweise die Scores 'Gesund' und 'Krank' oder 'Sicher' und 'Riskant' haben.
- Satzanzahl
- Die Satzanzahl ist ein Attribut des PMML-Modells. Es zeigt die Anzahl Sätze und den entsprechenden Prozentsatz im Vergleich zur Gesamtpopulation. Außerdem wird der Prozentsatz der Satzanzahl durch ein Histogramm dargestellt.
- Reinheit
- Die Reinheit wird durch die Klassifikations-Mining-Funktion berechnet. Sie zeigt den Prozentsatz der korrekt vorhergesagten Sätze in diesem Knoten an.
- Geprunt
- Intelligent Miner ® kann Ergebnisse generieren, die bereinigte Knoten enthalten. Das Kontrollkästchen in der Spalte Geprunt ist ausgewählt, wenn ein Knoten geprunt ist.
Die Legende zeigt die Farbe, die Sie den einzelnen Klassenbezeichnungen zugeordnet haben, sowie die entsprechenden Werte (z. B. Ja und Nein oder Gesund und Krank). Wenn Sie kontinuierliche numerische Werte verwenden, wird die Legende als Farbskala dargestellt.
Bäume müssen nicht binär sein. Sie können in jedem Knoten eine beliebige Anzahl Verzweigungen aufweisen, um den Bäumen der PMML 1.1-Definition zu entsprechen.