Regression mit partiellen kleinsten Quadraten

Die Prozedur "Regression mit partiellen kleinsten Quadraten" schätzt Regressionsmodelle mit partiellen kleinsten Quadraten (Partial Least Squares, PLS;, auch als "Projektion auf latente Struktur" (Projection to Latent Structure) bezeichnet). PLS ist ein Vorhersageverfahren, das eine Alternative zum Regressionsmodell der gewöhnlichen kleinsten Quadrate (Ordinary Least Squares, OLS), zur kanonischen Korrelation bzw. zur Strukturgleichungsmodellierung darstellt und besonders nützlich ist, wenn die Prädiktorvariablen eine hohe Korrelation aufweisen oder wenn die Anzahl der Prädiktoren die Anzahl der Fälle übersteigt.

PLS kombiniert Merkmale der Hauptkomponentenanalyse mit Merkmalen der mehrfachen Regression. Zunächst wird ein Set latenter Faktoren extrahiert, die einen möglichst großen Anteil der Kovarianz zwischen den unabhängigen und den abhängigen Variablen erklären. Anschließend werden in einem Regressionsschritt die Werte der abhängigen Variablen mithilfe der Zerlegung der unabhängigen Variablen vorhergesagt.

Tabellen. Der Anteil der (durch den latenten Faktor) erklärten Varianz, die Gewichtungen latenter Faktoren, die Ladungen latenter Faktoren, die Bedeutung der unabhängigen Variablen in der Projektion (VIP - Variable Importance in Projection) und die Schätzungen für Regressionsparameter (nach abhängiger Variablen) werden jeweils standardmäßig angegeben.

Diagramme. Die Bedeutung der Variablen in der Projektion, Faktorscores, Faktorgewichtungen für die ersten drei latenten Faktoren und die Distanz zum Modell werden jeweils über die Registerkarte Optionen erstellt.

Erläuterungen der Daten für die Regression mit partiellen kleinsten Quadraten

Messniveau. Die abhängigen und unabhängigen Variablen (Prädiktorvariablen) können metrisch, nominal oder ordinal sein. Bei der Prozedur wird davon ausgegangen, dass allen Variablen das richtige Messniveau zugewiesen wurde. Sie können das Messniveau für eine Variable jedoch vorübergehend ändern. Klicken Sie hierzu mit der rechten Maustaste auf die Variable in der Liste der Quellenvariablen und wählen Sie das gewünschte Messniveau im Popup-Menü aus. Kategoriale (nominale bzw. ordinale) Variablen werden von der Prozedur als äquivalent behandelt.

Codierung für kategoriale Variablen. Die Prozedur codiert vorübergehend für die Dauer ihrer Ausführung kategoriale abhängige Variablen mithilfe der "Eins-aus-c"-Codierung neu. Wenn es c Kategorien für eine Variable gibt, wird die Variable als c Vektoren gespeichert. Dabei wird die erste Kategorie als (1,0,...,0) angegeben, die zweite Kategorie als (0,1,0,...,0),... und die letzte Kategorie als (0,0,...,0,1). Kategoriale abhängige Variablen werden mithilfe von Dummy-Codierung dargestellt, d. h. es wird einfach der Indikator weggelassen, der der Referenzkategorie entspricht.

Häufigkeitsgewichtungen. Gewichtungswerte werden vor der Verwendung auf die nächste ganze Zahl gerundet. Fälle mit fehlenden Gewichtungen oder Gewichtungen unter 0,5 werden in der Analyse nicht verwendet.

Fehlende Werte. Benutzer- und systemdefiniert fehlende Werte werden als ungültig behandelt.

Neuskalierung. Alle Modellvariablen werden zentriert und standardisiert, einschließlich der Indikatorvariablen die für kategoriale Variablen stehen.

So lassen Sie eine Regression mit partiellen kleinsten Quadraten berechnen:

Wählen Sie in den Menüs Folgendes aus:

Analysieren > Regression > Partielle kleinste Quadrate...

  1. Wählen Sie mindestens eine abhängige Variable aus.
  2. Wählen Sie mindestens eine unabhängige Variable aus.

Die folgenden Optionen sind verfügbar:

Mit dieser Prozedur wird PLS-Befehlssyntax eingefügt.

Voraussetzungen

Die Prozedur der Regression mit partiellen kleinsten Quadraten ist ein Python-Erweiterungsbefehl und erfordert IBM® SPSS Statistics - Essentials for Python, das standardmäßig mit Ihrem IBM SPSS Statistics-Produkt installiert wird. Die Regression mit partiellen kleinsten Quadraten erfordert darüber hinaus die frei erhältlichen Python-Bibliotheken NumPy und SciPy.
Anmerkung: Für Benutzer, die im verteilten Analysemodus arbeiten (erfordert IBM SPSS Statistics Server), müssen NumPy und SciPy auf dem Server installiert sein. Bitten Sie Ihren Systemadministrator um Unterstützung.
Windows- und Mac-Benutzer

Unter Windows und Mac müssen NumPy und SciPy in einer anderen Instanz von Python 2.7 installiert werden als in der, die mit IBM SPSS Statistics installiert ist. Wenn Sie nicht über eine separate Instanz von Python 2.7 verfügen, können Sie diese von http://www.python.org herunterladen. Installieren Sie anschließend NumPy und SciPy für Python Version 2.7. Die Installationsprogramme sind unter http://www.scipy.org/Download verfügbar.

Zum Aktivieren der Verwendung von NumPy und SciPy müssen Sie Ihren Speicherort für Python auf die Instanz von Python 2.7 setzen, in der Sie NumPy und SciPy installiert haben. Der Speicherort für Python wird auf der Registerkarte "Dateispeicherorte" im Dialogfeld "Optionen" (Bearbeiten> Optionen) festgelegt.

Linux-Benutzer

Es wird empfohlen, die Quelle herunterzuladen und NumPy und SciPy selbst zu erstellen. Die Quelle ist unter http://www.scipy.org/Download verfügbar. Sie können NumPy und SciPy in der Instanz von Python 2.7 installieren, die mit IBM SPSS Statistics installiert ist. Diese befindet sich im Verzeichnis Python an dem Speicherort, an dem IBM SPSS Statistics installiert ist.

Wenn Sie NumPy und SciPy in einer anderen Instanz von Python 2.7 installieren wollen als in der, die mit IBM SPSS Statistics installiert ist, müssen Sie Ihren Speicherort für Python so festlegen, dass er auf diese Instanz verweist. Der Speicherort für Python wird auf der Registerkarte "Dateispeicherorte" im Dialogfeld "Optionen" (Bearbeiten> Optionen) festgelegt.

Windows- und UNIX-Server

NumPy und SciPy müssen auf dem Server in einer anderen Version von Python 2.7 installiert werden als in der, die mit IBM SPSS Statistics installiert ist. Wenn auf dem Server keine separate Version von Python 2.7 vorhanden ist, kann sie von http://www.python.org heruntergeladen werden. NumPy und SciPy für Python 2.7 sind unter http://www.scipy.org/Download verfügbar. Zum Aktivieren der Verwendung von NumPy und SciPy muss der Speicherort für Python auf die Version von Python 2.7 gesetzt werden, in der NumPy und SciPy installiert sind. Der Speicherort für Python wird über IBM SPSS Statistics Administration Console gesetzt.