Verallgemeinerte lineare Modelle

Das verallgemeinerte lineare Modell erweitert das allgemeine lineare Modell so, dass die abhängige Variable über eine angegebene Verknüpfungsfunktion in linearem Zusammenhang zu den Faktoren und Kovariaten steht. Außerdem ist es mit diesem Modell möglich, dass die abhängige Variable eine von der Normalverteilung abweichende Verteilung aufweist. Es deckt durch seine sehr allgemein gehaltene Modellformulierung häufig verwendete statistische Modelle ab, wie beispielsweise die lineare Regression für normalverteilte Antworten, logistische Modelle für binäre Daten und loglineare Modelle für Häufigkeitsdaten, Modelle vom Typ "Log-Log komplementär" für intervallzensierte Überlebensdaten sowie viele andere statistische Modelle.

Beispiele. Eine Reederei kann verallgemeinerte lineare Modelle verwenden, um eine Poisson-Regression auf die Anzahl der Havarien für mehrere Schiffstypen anzuwenden, die in verschiedenen Zeiträumen gebaut wurden. Anhand des so entstandenen Modells kann ermittelt werden, welche Schiffstypen am havarieanfälligsten sind.

Ein KFZ-Versicherungsunternehmen kann mithilfe von verallgemeinerten linearen Modellen eine Gamma-Regression an die Schadensansprüche für Autos anpassen. Anhand des so entstandenen Modells können die Faktoren ermittelt werden, die am meisten zur Anspruchshöhe beitragen.

Medizinforscher können mithilfe von verallgemeinerten linearen Modellen eine komplementäre Log-Log-Regression für intervallzensierte Überlebensdaten anpassen, um die Dauer bis zum Wiederauftreten eines Krankheitsbilds vorherzusagen.

Erläuterungen der Daten für verallgemeinerte lineare Modelle

Daten. Die Antwort kann metrisch (Skala), eine Anzahl, binär oder vom Typ "Ereignisse in Versuchen" sein. Es wird davon ausgegangen, dass Faktoren kategorial sind. Es wird davon ausgegangen, dass Kovariaten, Skalengewichtung und Offset metrisch (Skala) sind.

Annahmen. Fälle werden als unabhängige Beobachtungen betrachtet.

So erstellen Sie ein verallgemeinertes lineares Modell:

Für diese Funktion ist SPSS Statistics Standard Edition oder die Option "Advanced Statistics" erforderlich.

Wählen Sie in den Menüs Folgendes aus:

Analysieren > Verallgemeinerte lineare Modelle > Verallgemeinerte lineare Modelle...

  1. Geben Sie eine Verteilung und eine Verknüpfungsfunktion an (unten finden Sie Einzelheiten zu den verschiedenen Optionen).
  2. Wählen Sie auf der Registerkarte Abhängige Variable eine abhängige Variable aus.
  3. Wählen Sie auf der Registerkarte Prädiktoren die Faktoren und Kovariaten aus, die zur Vorhersage der abhängigen Variablen verwendet werden sollen.
  4. Geben Sie auf der Registerkarte Modell mithilfe der ausgewählten Faktoren und Kovariaten Modelleffekte an.

Auf der Registerkarte "Typ des Modells" können Sie die Verteilung und die Verknüpfungsfunktion für Ihr Modell angeben, die Schnellverfahren für mehrere häufig verwendete Modelle bieten, die durch den Antworttyp kategorisiert sind.

Modelltypen

Metrische abhängige Variable. Die folgenden Optionen sind verfügbar:

Ordinale abhängige Variable. Die folgenden Optionen sind verfügbar:

Häufigkeiten. Die folgenden Optionen sind verfügbar:

Binär oder Anzahl Ereignisse. Die folgenden Optionen sind verfügbar:

Mischung. Die folgenden Optionen sind verfügbar:

Benutzerdefiniert. Geben Sie Ihre eigene Kombination von Verteilung und Verknüpfungsfunktion an.

Verteilung

Diese Auswahl gibt die Verteilung der abhängigen Variablen an. Die Möglichkeit einer anderen Verteilung als "Normal" und einer anderen Verknüpfungsfunktion als "Identität" ist die wichtigste Verbesserung des verallgemeinerten linearen Modells gegenüber dem allgemeinen linearen Modell. Es gibt zahlreiche mögliche Kombinationen aus Verteilung und Verknüpfungsfunktion und es können mehrere davon für das jeweils vorliegende Dataset geeignet sein. Daher können Sie sich in Ihrer Wahl durch theoretische Vorüberlegungen leiten lassen oder davon, welche Kombination am besten zu passen scheint.

Verknüpfungsfunktionen

Die Verknüpfungsfunktion ist eine Transformation der abhängigen Variablen, die eine Schätzung des Modells ermöglicht. Die folgenden Funktionen sind verfügbar:

Mit dieser Prozedur wird Syntax des Befehls GENLIN eingefügt.