Węzeł Mieszanina rozkładów Gaussa — Opcje budowania

Karta Opcje budowania służy do określania opcji budowania dla węzła Mieszanina rozkładów Gaussa, w tym opcji podstawowych i opcji zaawansowanych. Więcej informacji na temat opcji nieomówionych w tej sekcji można znaleźć w następujących źródłach internetowych:

Podstawowe

Typ kowariancji. Wybierz jedną z następujących macierzy kowariancji:
  • Pełna. Każdy komponent ma własną ogólną macierz kowariancji.
  • Powiązana. Wszystkie komponenty mają tę samą ogólną macierz kowariancji.
  • Diagonalna. Każdy komponent ma własną diagonalną macierz kowariancji.
  • Sferyczna. Każdy komponent ma własną jedną wariancję.

Liczba komponentów. Określ liczbę komponentów mieszaniny, które mają być używane przy budowaniu modelu.

Etykieta skupienia. Określ, czy etykieta skupienia jest liczbą, czy łańcuchem. W przypadku wybrania opcji Łańcuch należy określić przedrostek dla etykiety skupienia (na przykład domyślny przedrostek to skupienie, co powoduje utworzenie etykiet, takich jak skupienie-1, skupienie-2 itd.).

Losowa wartość początkowa. Wybierz tę opcję i kliknij przycisk Utwórz, aby wygenerować wartość początkową dla generatora liczb losowych.

Zaawansowane

Tolerancja. Określić próg zbieżności. Wartość domyślna to 0,001.

Liczba iteracji. Określ maksymalną liczbę wykonywanych iteracji. Wartość domyślna to 100.

Parametry początkowe. Wybierz parametr początkowy Kmeans (odpowiedzialności są inicjowane przy użyciu k-średnich) albo Losowe (odpowiedzialności są inicjowane losowo).

Gorący start. Wybranie opcji Prawda spowoduje, że zainicjowania następnego dopasowania zostanie użyte rozwiązanie ostatniego dopasowania. Może to przyspieszyć uzyskanie zbieżności, gdy dopasowanie wywoływane jest kilka razy w odniesieniu do tych samych problemów.

W poniższej tabeli przedstawiono relację między ustawieniami w oknie dialogowym węzła Mieszanina rozkładów Gaussa w programie SPSS Modeler a parametrami biblioteki Gaussian Mixture w języku Python.
Tabela 1. Właściwości węzła odwzorowane na parametry biblioteki Python
Ustawienie w programie SPSS Modeler Nazwa w skryptach (nazwa właściwości) Parametr mieszaniny rozkładów Gaussa
Użyj wstępnie zdefiniowanych ról/Użyj niestandardowych przypisań zmiennych role_use
Dane wejściowe predyktory
Użyj danych podzielonych na podzbiory use_partition
Typ kowariancji covariance_type covariance_type
Liczba komponentów number_component n_components
Etykieta skupienia component_lable
Przedrostek etykiety label_prefix
Ustaw wartość startową generatora liczb losowych enable_random_seed
Losowa wartość początkowa random_seed random_state
Tolerancja tol tol
Liczba iteracji max_iter max_iter
Parametry początkowe init_params init_params
Gorący start warm_start warm_start

1 Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.

2 "Podręcznik użytkownika." Gaussian mixture models. WWW. © 2007 - 2017. scikit-learn developers.