Unterbefehl SAVE (Befehl RBF)

Der Unterbefehl SAVE schreibt optionale temporäre Variablen in das aktive Dataset.

PREDVAL (Variablenname Variablenname ...). Vorhergesagte(r) Wert oder Kategorie. Wenn eine abhängige Variable ein metrische Messniveau aufweist, ist dies der vorhergesagte Wert. Wenn eine abhängige Variable kategorial ist, ist dies die vorhergesagte Kategorie.

  • Geben Sie mindestens einen eindeutigen, gültigen Variablennamen an. Es sollten so viele Variablennamen angegeben werden, wie abhängige Variablen vorhanden sind, und die Namen sollten in der Reihenfolge der abhängigen Variablen in der Befehlszeile aufgelistet werden. Wenn Sie nicht genügend Variablennamen angeben, werden für alle verbleibenden Variablen Standardnamen verwendet. Wenn Sie zu viele Variablennamen angeben, werden alle verbleibenden Namen ignoriert.
  • Wenn es nur eine abhängige Variable gibt, lautet der Standard-Variablenname RBF_PredictedValue. Sind mehrere abhängige Variablen vorhanden, lauten die Standardvariablennamen RBF_PredictedValue_1, RBF_PredictedValue_2usw. entsprechend der Reihenfolge der abhängigen Variablen in der Befehlszeile.

PSEUDOPROB (rootname:n rootname ...). Vorhergesagte Pseudowahrscheinlichkeit. Wenn eine abhängige Variable kategorial ist, speichert dieses Schlüsselwort die vorhergesagten Pseudowahrscheinlichkeiten der ersten n Kategorien dieser abhängigen Variablen.

  • Geben Sie mindestens einen eindeutigen, gültigen Variablennamen an. Es sollten so viele Variablennamen angegeben werden, wie kategoriale abhängige Variablen vorhanden sind, und die Namen sollten in der Reihenfolge der kategorialen abhängigen Variablen in der Befehlszeile aufgelistet werden. Die angegebenen Namen werden als Stammnamen behandelt. Jedem Stammnamen werden Suffixe hinzugefügt, um eine Gruppe von Variablennamen zu erhalten, die den Kategorien für eine bestimmte abhängige Variable entspricht. Wenn Sie nicht genügend Variablennamen angeben, werden für alle verbleibenden kategorialen abhängigen Variablen Standardnamen verwendet. Wenn Sie zu viele Variablennamen angeben, werden alle verbleibenden Namen ignoriert.
  • Auf den Stammnamen können ein Doppelpunkt und eine positive ganze Zahl folgen, die die Anzahl der Wahrscheinlichkeiten angeben, die für eine abhängige Variable gespeichert werden sollen.
  • Wenn es nur eine abhängige Variable gibt, lautet der Standard-Wurzelname RBF_PseudoProbability. Wenn es mehrere abhängige Variablen gibt, sind die Standardstammnamen RBF_PseudoProbability_1, RBF_PseudoProbability_2usw., entsprechend der Reihenfolge der kategorialen abhängigen Variablen in der Befehlszeile und unter Berücksichtigung der Position aller metrischen abhängigen Variablen.
  • Der Standardwert für n ist 25.
  • Dieses Schlüsselwort wird für metrische abhängige Variablen ignoriert.

Wahrscheinlichkeiten und Pseudowahrscheinlichkeiten

Vorhergesagte Pseudowahrscheinlichkeiten können nicht als Wahrscheinlichkeiten interpretiert werden, weil die Prozedur RBF die Funktion zur Aktivierung der Quadratsumme und der Identität für die Ausgabeschicht verwendet. Der Unterbefehl SAVE speichert diese vorhergesagten Pseudowahrscheinlichkeiten, auch wenn sie kleiner als 0 oder größer als 1 sind oder die Summe für eine bestimmte abhängige Variable nicht 1 ist.

Die Diagramme ROC, kumulative Gewinne und Lift (siehe /PLOT ROC, GAINbzw. LIFT) werden auf der Basis von Pseudowahrscheinlichkeiten erstellt. Für den Fall, dass eine der Pseudo-Wahrscheinlichkeiten kleiner als 0 oder größer als 1 ist oder die Summe für eine gegebene Variable nicht 1 ist, werden sie zunächst auf einen Wert zwischen 0 und 1 und auf die Summe 1 skaliert. Der Unterbefehl SAVE speichert die ursprünglichen Pseudowahrscheinlichkeiten, aber die Diagramme basieren auf neu skalierten Pseudowahrscheinlichkeiten.

Pseudowahrscheinlichkeiten werden durch Division durch ihre Summe skaliert. Wenn ein Fall beispielsweise für eine abhängige Variable mit drei Kategorien vorhergesagte Pseudowahrscheinlichkeiten von 0,50, 0,60 und 0,40 aufweist, wird jede Pseudowahrscheinlichkeit durch die Summe 1,50 dividiert, woraus sich die Werte 0,33, 0,40 und 0,27 ergeben.

Wenn negative Pseudowahrscheinlichkeiten vorliegen, werden vor der oben beschriebenen Neuskalierung alle Pseudowahrscheinlichkeiten jeweils mit dem Betrag der niedrigsten Wahrscheinlichkeit addiert. Beispiel: Wenn die Pseudowahrscheinlichkeiten0.30, 0.50und 1.30lauten, fügen Sie zuerst 0.30 zu jedem Wert hinzu, um 0.00, 0.80und 1.60zu erhalten. Als Nächstes dividieren Sie die einzelnen neuen Werte durch die Summe 2,40, wodurch sich die Werte 0,00, 0,33 und 0,67 ergeben.