Ziel (GLE-Modelle)

Mit diesen Einstellungen werden das Ziel, seine Verteilung und seine Beziehung zu den Prädiktoren über die Verknüpfungsfunktion definiert.

Ziel Das Ziel muss angegeben werden. Es kann jedes beliebige Messniveau aufweisen. Das Messniveau des Ziels wirkt sich auf die Menge der jeweils geeigneten Verteilungen und Verknüpfungsfunktionen aus.

  • Vordefiniertes Ziel verwenden Wählen Sie diese Option aus, um die Zieleinstellungen aus einem vorgeordneten Typknoten (oder die Registerkarte "Typen" eines vorgeordneten Quellenknotens) zu verwenden.
  • Benutzerdefiniertes Ziel verwenden Wählen Sie diese Option aus, um ein Ziel manuell zuzuweisen.
  • Anzahl der Versuche als Nenner verwenden Wenn die Zielantwort eine Anzahl von Ereignissen ist, die in einer Menge von Versuchen eintreten, enthält das Zielfeld die Anzahl der Ereignisse und Sie können ein zusätzliches Feld auswählen, das die Anzahl der Versuche enthält. Beim Testen eines neuen Pestizids können Sie beispielsweise Stichproben von Ameisen verschiedenen Konzentrationen des Schädlingsbekämpfungsmittels aussetzen. Zeichnen Sie dabei die Anzahl der vernichteten Ameisen und die Anzahl der Ameisen in den einzelnen Stichproben auf. In diesem Fall sollte das Feld, in dem die Zahl der vernichteten Ameisen aufgezeichnet wird, als Zielfeld (Ereignisfeld) und das Feld, in dem die Anzahl der Ameisen in den einzelnen Stichproben aufgezeichnet wird, als Feld für die Versuche festgelegt werden. Wenn die Zahl der Ameisen in den einzelnen Stichproben gleich ist, kann die Anzahl der Versuche mit einem festen Wert angegeben werden.

    Die Anzahl der Versuche sollte größer-gleich der Anzahl der Ereignisse für die einzelnen Datensätze sein. Bei den Ereignissen sollte es sich um nicht negative Ganzzahlen und bei den Versuchen um positive Ganzzahlen handeln.

  • Referenzkategorie anpassen. Bei einem kategorialen Ziel können Sie die Referenzkategorie auswählen. Dies kann sich auf bestimmte Ausgaben, wie beispielsweise Parameterschätzungen, auswirken, sollte jedoch nicht die Anpassungsgüte des Modells verändern. Beispiel: Angenommen, Ihr Ziel kann die Werte 0, 1 und 2 annehmen. In diesem Fall verwendet die Prozedur standardmäßig die letzte Kategorie (die mit dem höchsten Wert), also 2, als Referenzkategorie. In diesem Fall sollten Parameterschätzungen als Bezug auf die Wahrscheinlichkeit von Kategorie 0 oder 1 im Verhältnis zur Wahrscheinlichkeit von Kategorie 2 interpretiert werden. Wenn Sie eine benutzerdefinierte Kategorie festlegen und Ihr Ziel über definierte Beschriftungen verfügt, können Sie die Referenzkategorie festlegen, indem Sie einen Wert aus der Liste auswählen. Dies kann nützlich sein, wenn Sie bei der Festlegung eines Modells nicht mehr wissen, wie genau ein bestimmtes Feld codiert war.

Zielverteilung und Beziehung (Verknüpfung) mit dem linearen Modell Angesichts der Werte der Prädiktoren geht das Modell davon aus, dass die Verteilung der Werte des Ziels der angegebenen Form folgt und dass die Zielwerte über die angegebene Verknüpfungsfunktion in einer linearen Beziehung zu den Prädiktoren stehen. Für mehrere allgemeine Modelle werden Verknüpfungen bereitgestellt. Sie können aber auch eine benutzerdefinierte Einstellung auswählen, wenn es eine bestimmte Kombination einer Verteilung und einer Verknüpfungsfunktion gibt, die Sie anpassen möchten und die nicht in der Liste der Verknüpfungen enthalten ist.

  • Lineares Modell Gibt eine Normalverteilung mit einer Identitätsverknüpfung an, was nützlich ist, wenn sich das Ziel mit einer linearen Regression oder einem ANOVA-Modell vorhersagen lässt.
  • Gammaregression Gibt eine Gammaverteilung mit einer Log-Verknüpfung an, die eingesetzt werden sollte, wenn das Ziel ausschließlich positive Werte enthält und eine Verzerrung hin zu größeren Werten aufweist.
  • Loglinear Gibt eine Poisson-Verteilung mit einer Log-Verknüpfung an, die eingesetzt werden sollte, wenn das Ziel eine Anzahl an Vorkommen in einem festen Zeitraum darstellt.
  • Negative binomiale Regression Gibt eine negative Binomialverteilung mit einer Log-Verknüpfung an, die eingesetzt werden sollte, wenn Ziel und Nenner die Anzahl der Versuche darstellen, die erforderlich sind, um k Erfolge zu beobachten.
  • Tweedie-Regression Gibt eine Tweedie-Regression mit Identitäts-, Log- oder Potenzverknüpfungsfunktionen an, die für Modellierungsantworten nützlich sind, die eine Mischung aus Nullen und positiven reellen Zahlenwerten sind. Diese Verteilungen werden auch als zusammengesetzte Poisson-Verteilung, zusammengesetzte Gammaverteilung und Poisson-Gammaverteilung bezeichnet.
  • Multinomiale logistische Regression Gibt eine Multinomialverteilung an, die eingesetzt werden sollte, wenn es sich bei dem Ziel um eine Antwort mit mehreren Kategorien handelt. Verwendet entweder eine Verknüpfung vom Typ "Logit (kumulativ)" (ordinale Ergebnisse) oder eine Verknüpfung vom Typ "Logit (verallgemeinert)" (nominale Antwort mit mehreren Kategorien).
  • Binäre logistische Regression Gibt eine Binomialverteilung mit einer Logit-Verknüpfung an, die eingesetzt werden sollte, wenn es sich bei dem Ziel um eine Binärantwort handelt, die durch ein logistisches Regressionsmodell vorhergesagt wird.
  • Binär Probit Gibt eine Binomialverteilung mit einer Probit-Verknüpfung an, die eingesetzt werden sollte, wenn es sich bei dem Ziel um eine Binärantwort handelt, der eine Normalverteilung zugrunde liegt.
  • Intervallzensiertes Überleben Gibt eine Binomialverteilung mit einer Verknüpfung vom Typ "Log-Log komplementär" an, die sinnvoll für Überlebensanalysen ist, bei denen einige Beobachtungen kein Beendigungsereignis aufweisen.
  • Benutzerdefiniert Geben Sie Ihre eigene Kombination von Verteilungs- und Verknüpfungsfunktionen an.

Verteilung

Diese Auswahl gibt die Verteilung des Ziels an. Die Möglichkeit einer anderen Verteilung als "Normal" und einer anderen Verknüpfungsfunktion als "Identität" ist die wichtigste Verbesserung des verallgemeinerten linearen Modells gegenüber dem linearen Modell. Es gibt zahlreiche mögliche Kombinationen aus Verteilung und Verknüpfungsfunktion und es können mehrere davon für das jeweils vorliegende Dataset geeignet sein. Daher können Sie sich in Ihrer Wahl durch theoretische Vorüberlegungen leiten lassen oder davon, welche Kombination am besten zu passen scheint.

  • Automatisch Wählen Sie diese Option aus, wenn Sie unsicher sind, welche Verteilung verwendet werden soll. Der Knoten analysiert Ihre Daten, um die beste Verteilungsmethode zu schätzen und anzuwenden.
  • Binomial Diese Verteilung ist nur für Ziele geeignet, die eine binäre Antwort oder eine Anzahl von Ereignissen repräsentieren.
  • Gamma Diese Verteilung eignet sich für Ziele mit positiven Skalenwerten, die in Richtung größerer positiver Werte verzerrt sind. Wenn ein Datenwert kleiner-gleich 0 ist oder fehlt, wird der entsprechende Fall nicht in der Analyse verwendet.
  • Invers normal Diese Verteilung eignet sich für Ziele mit positiven Skalenwerten, die in Richtung größerer positiver Werte verzerrt sind. Wenn ein Datenwert kleiner-gleich 0 ist oder fehlt, wird der entsprechende Fall nicht in der Analyse verwendet.
  • Multinomial Diese Verteilung eignet sich für ein Ziel, das eine Antwort mit mehreren Kategorien darstellt. Die Form des Modells hängt vom Messniveau des Ziels ab.

    Ein nominales Ziel führt zu einem nominalen multinomialen Modell, in dem für jede Kategorie des Ziels (mit Ausnahme der Referenzkategorie) ein separates Set an Modellparametern geschätzt wird. Die Parameterschätzungen für einen Prädiktor zeigen jeweils die Beziehung zwischen dem betreffenden Prädiktor und der Wahrscheinlichkeit der einzelnen Kategorien des Ziels, relativ zur Referenzkategorie.

    Ein ordinales Ziel führt zu einem ordinalen multinomialen Modell, in dem der herkömmliche konstante Term durch eine Menge an Schwellen-Parametern ersetzt ist, die sich auf die kumulative Wahrscheinlichkeit der Zielkategorien beziehen.

  • Negativ binomial Für die negative binomiale Regression wird eine negative Binomialverteilung mit einer Log-Verknüpfung eingesetzt, die verwendet werden sollte, wenn das Ziel eine Anzahl an Vorkommen mit hoher Varianz darstellt.
  • Normal Diese Option eignet sich für stetige Ziele, deren Werte eine symmetrische, glockenförmige Verteilung um einen Mittelwert aufweisen.
  • Poisson Diese Verteilung lässt sich als Anzahl der Vorkommen eines untersuchten Ereignisses in einem festen Zeitraum betrachten und eignet sich für Variablen mit nicht negativen ganzzahligen Werten. Wenn ein Datenwert keine ganze Zahl oder kleiner als 0 ist oder fehlt, wird der entsprechende Fall nicht in der Analyse verwendet.
  • Tweedie Diese Verteilung eignet sich für Variablen, die durch Poisson-Mischungen von Gamma-Verteilungen repräsentiert werden können. Die Verteilung ist dahin gehend "gemischt", dass sie sowohl Eigenschaften von stetigen Verteilungen (nimmt nicht negative reelle Werte an) als auch von diskreten Verteilungen (positive Wahrscheinlichkeitsmasse an einem Einzelwert, 0) aufweist. Die abhängige Variable muss numerisch sein, mit Datenwerten größer-gleich 0. Wenn ein Datenwert kleiner als 0 ist oder fehlt, wird der entsprechende Fall nicht in der Analyse verwendet. Der feste Wert des Parameters der Tweedie-Verteilung kann jede beliebige Zahl zwischen 1 und 2 sein.

Verknüpfungsfunktionen

Die Verknüpfungsfunktion ist eine Transformation des Ziels, die eine Schätzung des Modells ermöglicht. Die folgenden Funktionen sind verfügbar:

  • Automatisch Wählen Sie diese Option aus, wenn Sie unsicher sind, welche Verknüpfung verwendet werden soll. Der Knoten analysiert Ihre Daten, um die beste Verknüpfungsfunktion zu schätzen und anzuwenden.
  • Identität f(x)=x. Das Ziel ist nicht transformiert. Diese Verknüpfung kann abgesehen von der Multinomialverteilung mit jeder beliebigen Verteilung verwendet werden.
  • Log-Log komplementär f(x)=log(−log(1−x)). Nur für die Binomialverteilung oder Multinomialverteilung geeignet.
  • Cauchit f(x) = tan(π (x − 0.5)). Nur für die Binomialverteilung oder Multinomialverteilung geeignet.
  • Log f(x)=log(x). Diese Verknüpfung kann abgesehen von der Multinomialverteilung mit jeder beliebigen Verteilung verwendet werden.
  • Log-Komplement f(x)=log(1−x). Nur für die Binomialverteilung geeignet.
  • Logit f(x)=log(x / (1−x)). Nur für die Binomialverteilung oder Multinomialverteilung geeignet.
  • Log-Log negativ f(x)=−log(−log(x)). Nur für die Binomialverteilung oder Multinomialverteilung geeignet.
  • Probit f(x)=Φ−1(x), wobei Φ−1 die inverse kumulative Standardnormalverteilungsfunktion ist. . Nur für die Binomialverteilung oder Multinomialverteilung geeignet.
  • Potenz f(x)=x α, if α ≠ 0. f(x)=log(x), wenn α=0. α ist die erforderliche Zahlenangabe. Es muss sich dabei um eine reelle Zahl handeln. Diese Verknüpfung kann abgesehen von der Multinomialverteilung mit jeder beliebigen Verteilung verwendet werden.

Parameter für Tweedie Nur verfügbar, wenn Sie das Optionsfeld Tweedie-Regression oder die Verteilungsmethode Tweedie ausgewählt haben. Wählen Sie einen Wert zwischen 1 und 2 aus.