Regresja metodą cząstkowych najmniejszych kwadratów

Procedura regresji metodą cząstkowych najmniejszych kwadratów szacuje modele regresji metodą cząstkowych najmniejszych kwadratów (PLS, zwaną także „odwzorowaniem na strukturę utajoną”). PLS jest techniką prognostyczną, stanowiącą zamiennik regresji metodą zwykłych najmniejszych kwadratów (OLS), korelacji kanonicznej lub modelowania równań strukturalnych, i jest szczególnie użyteczna, gdy predyktory są wysoko skorelowane lub kiedy liczba przeliczników jest większa niż liczba obserwacji.

Metoda cząstkowych najmniejszych kwadratów łączy cechy analizy składowych głównych i regresji wielokrotnej. W pierwszej kolejności wyodrębnia zbiór czynników utajonych, które wyjaśniają jak najwięcej kowariancji między zmiennymi niezależnymi i zależnymi. Następnie, w fazie regresji, prognozuje się wartości zmiennych zależnych, używając dekompozycji zmiennych niezależnych.

Tabele: Udział wariancji wyjaśnionej (według czynnika utajonego), wagi czynników utajonych, ładunki czynników utajonych, ważność zmiennej niezależnej w odwzorowaniu (VIP) oraz oszacowania parametrów regresji (według zmiennej zależnej) są generowane domyślnie.
Wykresy: Zmienna ważność w projekcji (VIP), oceny czynnikowe, wagi czynników dla pierwszych trzech czynników utajonych oraz odległość do modelu są produkowane z karty Opcje .

Wymagania dotyczące danych

Poziom pomiaru: Zmienne zależne i niezależne (predyktory) mogą mieć charakter nominalny, porządkowy lub ilościowy. W procedurze przyjmuje się, że odpowiedni poziom pomiaru został przypisany do wszystkich zmiennych, choć można tymczasowo zmienić poziom pomiaru dla zmiennej, klikając prawym przyciskiem myszy zmienną na liście zmiennych źródłowych i wybierając poziom pomiaru z menu kontekstowego. Zmienne jakościowe (nominalne lub porządkowe) są traktowane przez procedurę równoważnie.
Kodowanie zmiennych jakościowych: Procedura tymczasowo przekodowuje zależne zmienne jakościowe, używając jednego z c kodowań na czas trwania procedury. Jeśli istnieje c kategorii zmiennej, zmienna jest przechowywana jako c wektorów, z pierwszą kategorią oznaczoną (1,0, ..., 0), następną kategorią (0,1,0, ..., 0), ..., i kategorii końcowej (0,0, ..., 0, 1). Zależne zmienne jakościowe są przedstawiane przy użyciu sztucznego kodowania, tzn. z pominięciem wskaźnika odpowiadającego kategorii odniesienia.
Wagi liczebności: Wartości wag są przed użyciem zaokrąglane do najbliższej liczby całkowitej. Obserwacje, w których brakuje wag lub które mają wagi mniejsze niż 0,5, nie są wykorzystywane w analizach.
Brakujące dane: Zdefiniowane i systemowe braki danych są traktowane jako wartości nieprawidłowe.
Przeskalowanie: Wszystkie zmienne modelu są centrowane i standaryzowane; dotyczy to także zmiennych wskaźnikowych reprezentujących zmienne kategorialne.

Uzyskiwanie regresji metodą cząstkowych najmniejszych kwadratów

Z menu wybierz:

Analiza > Regresja > Częściowe najmniejsze kwadraty ...

Wybierz co najmniej jedną zmienną zależną.
Wybierz co najmniej jedną zmienną niezależną.

Opcjonalnie można wykonać następujące czynności:

Określ kategorię odniesienia dla jakościowych (nominalnych lub porządkowych) zmiennych zależnych.
Określ zmienną, która ma być używana jako unikalny identyfikator wyników obserwacji i zapisanych zbiorów danych.
Określ górny limit liczby wyodrębnianych czynników utajonych.

Ta procedura służy do wkleiania składni komendy PLS .

Wymagania wstępne

Procedura regresji metodą cząstkowych najmniejszych kwadratów jest komendą rozszerzanową Python i wymaga funkcjonalności Python , która jest częścią produktu IBM® SPSS® Statistics . Wymagane są również ogólnodostępne biblioteki NumPy oraz SciPy Python.

Notatka: Dla użytkowników pracujących w trybie analizy rozproszonej (wymaga serwera IBM SPSS Statistics Server) na serwerze muszą być zainstalowane produkty NumPy i SciPy . Dodatkowe wsparcie można uzyskać u administratora systemu.

Użytkownicy systemów Windows i Mac

W przypadku systemów Windows i Mac, produkty NumPy i SciPy muszą być zainstalowane w oddzielnej wersji produktu Python 3.10 z wersji zainstalowanej z produktem IBM SPSS Statistics. Jeśli użytkownik nie ma oddzielnej wersji Python 3.10, można go pobrać z serwisu http://www.python.org. Then, install NumPy and SciPy for Python version 3.10. Instalatory są dostępne pod adresem http://www.scipy.org/Download.

Aby włączyć użycie opcji NumPy i SciPy, należy ustawić lokalizację Python na wersję Python 3.10 , w której zainstalowano NumPy i SciPy. Lokalizację środowiska Python można ustawić na karcie Lokalizacje plików w oknie dialogowym Opcje (Edycja > Opcje).

Użytkownicy systemu Linux

Zalecamy pobranie źródła i samodzielne utworzenie bibliotek NumPy i SciPy. Źródło jest dostępne pod adresem http://www.scipy.org/Download. Produkt NumPy i SciPy można zainstalować w wersji Python 3.10 zainstalowanej z produktem IBM SPSS Statistics. Znajduje się on w katalogu Python w miejscu, w którym zainstalowano produkt IBM SPSS Statistics .

Jeśli produkt NumPy i produkt SciPy zostaną zainstalowane w wersji Python 3.10 innej niż wersja, która jest instalowana z produktem IBM SPSS Statistics, należy ustawić położenie produktu Python w taki sposób, aby wskazywało na tę wersję. Położenie Python jest ustawiane na karcie Lokalizacje plików w oknie dialogowym Opcje (Edycja > Opcje).

Serwer Windows i Unix

Produkty NumPy i SciPy muszą być zainstalowane na serwerze do oddzielnej wersji produktu Python 3.10 z wersji zainstalowanej wraz z produktem IBM SPSS Statistics. Jeśli na serwerze nie ma oddzielnej wersji programu Python 3.10 , to można ją pobrać z programu http://www.python.org. Opcje NumPy i SciPy dla języka Python 3.10 są dostępne w serwisie http://www.scipy.org/Download. Aby umożliwić korzystanie z opcji NumPy i SciPy, położenie Python dla serwera musi być ustawione na wersję Python 3.10 , gdzie zainstalowano NumPy i SciPy . Położenie Python jest ustawiane za pomocą Konsola administracyjna IBM SPSS Statistics.