Widok drzewa

W widoku drzewa zostaną wyświetlone wyniki eksploracji drzewa klasyfikacji drzewa. Przedstawia drzewo decyzyjne, które jest konstruowane przez funkcję eksploracji klasyfikacji. Drzewo decyzyjne jest osadzone w tabeli.

W widoku drzewa wyświetlane są także pola, które są wyprowadzane z pól wejściowych podczas przenoszenia myszy nad gałęziami drzewa.

Drzewo składa się z różnych węzłów. Każdy węzeł drzewa odpowiada wierszowi w tabeli. Kolumny w tabeli wyświetlają atrybuty węzłów.

Na poniższym rysunku przedstawiono przykład widoku drzewa:
Rysunek 1. Widok drzewa wizualizatora klasyfikacji
Ta grafika przedstawia widok drzewa w Wizualizatorze klasyfikacji.
Tabela w widoku drzewa zawiera następujące kolumny:
Drzewo
Każdy węzeł w kolumnie Drzewo zawiera diagram wizualizujący rozkład rekordów w tym węźle nad przewidywalnymi klasami. Każda z klas, które mogą być przewidywane, jest reprezentowana przez inny kolor. Udział koloru w węźle reprezentuje procent rekordów, które należą do odpowiedniej klasy. Można przewidzieć dwie lub więcej klas. Kolor konkretnej klasy można zmienić na stronie Coding Color (Kolor kodowany) notatnika Właściwości.

Obok diagramu wyświetlana jest odpowiednia decyzja, która prowadzi do przypisania rekordów do tego węzła.

Odpowiednia decyzja może obejmować typowe predykaty pól, na przykład REVENUE_OF_CONTRACT < 912, lub DISTRIBUTORCAR_DEALERS. Wyjątkowe predykaty pól to, na przykład, LOCATION_SIZE IS NOT MISSING lub LOCATION_SIZE IS MISSING.
  • Predykat pola LOCATION_SIZE IS MISSING ma zastosowanie, jeśli funkcja eksploracji wykrywa podczas oceniania rekordu, że to pole jest puste. Oznacza to, że pole zawiera wartość NULL lub zawiera jedną z wartości, które są zdefiniowane jako brakujące w słowniku danych modelu PMML.
  • Predykat pola LOCATION_SIZE IS NOT MISSING ma zastosowanie, jeśli funkcja eksploracji wykrywa podczas oceniania rekordu, że to pole nie jest puste. Oznacza to, że nie zawiera on wartości NULL ani wartości, która jest zdefiniowana jako brakująca w słowniku danych modelu PMML. Konkretna wartość nie jest istotna dla oceniania.
    Na przykład może istnieć kolumna zawierająca numery telefonów. Model może być uzależniony od następujących warunków:
    • Numery telefonów są podane, oznacza to, że pola nie są puste.
    • Numery telefonów nie są udostępniane, oznacza to, że pola są puste lub zawierają wartości NULL .
    W takim przypadku numery telefonów nie mają znaczenia dla naliczania rekordów.

Jeśli istnieje wiele różnych klas o prawie tej samej wielkości, na przykład w przypadku predykcji numerycznych, diagramy w węzłach nie wizualizują rozkładu rekordów, ale etykieta klasy tego węzła. Oznacza to, że węzły są reprezentowane w kolorze, który jest powiązany z wartością przewidywaną, jak pokazano w legendzie.

ID węzła
W identyfikatorach węzłów wyświetlane są obliczone poziomy drzewa.

Każdy węzeł w drzewie jest identyfikowany przez identyfikator węzła. Identyfikator węzła jest tworzony przez rozszerzenie identyfikatora nadrzędnego węzła o wartość ". x", gdzie x jest pozycją tego węzła w odniesieniu do innych węzłów równorzędnych. Węzeł główny ma identyfikator 1.

Na przykład, węzeł B może być drugim elementem potomnym węzła A. Węzeł A ma identyfikator węzła 1.2. Identyfikator węzła B to 1.2.2. W przypadku tego rodzaju konstrukcji identyfikatora węzła można łatwo określić ścieżkę z węzła głównego do dowolnego innego węzła oraz poziom węzła w drzewie.

Wynik
Wynik węzła jest atrybutem modelu PMML. Przedstawia ona klasę, do której przewidywane są wszystkie rekordy w tym węźle. Na przykład, możesz mieć wyniki Healthy i Ill, lub Secure i Risky.
Liczebność rekordów
Liczba rekordów jest atrybutem modelu PMML. Przedstawia on ilość rekordów oraz odpowiednią wartość procentową w porównaniu do całej populacji. Dodatkowo wartość procentowa liczby rekordów jest wizualizowana przy użyciu histogramu.
Czystość
Czystość jest obliczana przez funkcję eksploracji klasyfikacji. Wskazuje wartość procentową poprawnie przewidywanych rekordów w tym węźle.
Pruned
Produkt Intelligent Miner ® może generować wyniki, które zawierają węzły oczyszczone. Pole wyboru w kolumnie Pruned (Pruned) jest zaznaczone, jeśli węzeł jest wyczyszczony.

Legenda przedstawia kolor przypisany do każdej etykiety klasy i odpowiednie wartości, na przykład Tak i Nie, lub Zdrowy lub Ill. Jeśli używane są ciągłe wartości liczbowe, legenda jest reprezentowana jako skala kolorów.

Drzewa nie muszą być binarne. Aby być zgodne z drzewami definicji PMML 1.1, mogą one mieć dowolną liczbę gałęzi w każdym węźle.