Übersicht (Befehl ROC ANALYSIS)

ROC ANALYSIS Beurteilt die Genauigkeit von Modellvorhersagen durch Darstellung der Sensitivität im Vergleich zur (1-Spezifität) eines Klassifikationstests (da der Schwellenwert über einen gesamten Bereich von Diagnosetestergebnissen variiert). Die gesamte Fläche unter einer gegebenen ROC-Kurve (AUC) formuliert eine wichtige Statistik, die die Wahrscheinlichkeit darstellt, dass die Vorhersage in der richtigen Reihenfolge ist, wenn eine Testvariable beobachtet wird (für ein Subjekt, das zufällig aus der Fallgruppe ausgewählt wird, und ein anderes Subjekt, das zufällig aus der Kontrollgruppe ausgewählt wird). Die ROC-Analyse unterstützt die Inferenz bezüglich einer einzelnen Fläche unter der Kurve, Genauigkeitsrückrufkurven und stellt Optionen zum Vergleichen zweier ROC-Kurven bereit, die entweder aus unabhängigen Gruppen oder paarigen Subjekten generiert wurden.

Die alte Prozedur "ROC-Kurve" unterstützt die statistische Inferenz für eine einzelne ROC-Kurve. Dies kann auch durch die neue ROC-Analyseprozedur wiederhergestellt werden. Darüber hinaus können mit der neuen Prozedur "ROC-Analyse" zwei ROC-Kurven verglichen werden, die aus unabhängigen Gruppen oder paarigen Subjekten generiert wurden.

Optionen

Design für Stichproben mit paarigen Werten
Es ist nicht ungewöhnlich, zwei ROC-Kurven in einem Szenario mit Stichproben mit paarigen Werten zu vergleichen, bei dem mehrere Testwerte an denselben Subjekten gemessen werden, die einer Zustandsvariablen zugeordnet sind. Das Design mit Stichproben mit paarigen Werten verwendet mindestens zwei Testmessungen.
Gruppierungsvariable
Wenn eine Gruppierungsvariable angegeben wird, können Sie das unabhängige Gruppendesign für die Testvariable (n) anfordern. Numerische Werte oder Zeichenfolgewerte können als benutzerdefinierte Werte angegeben werden oder die Einstellungen für den Mittelpunkt und den Trennwert können verwendet werden.
Klassifikation
Der Trennwert für die positive Klassifizierung kann in die Analyse eingeschlossen oder aus der Analyse ausgeschlossen werden.
Testrichtung
Die Testrichtung kann so eingestellt werden, dass größere oder kleinere Testergebnisse auf einen positiveren Test hinweisen.
Parameter für Standard des Fehlerbereichs
Stellt Optionen für die Definition der Verteilungsannahme und des Konfidenzniveaus in Prozent bereit.
Fehlende Werte
Stellt Optionen zum Ausschließen benutzerdefiniert fehlender und systemdefiniert fehlender Werte oder zum Behandeln benutzerdefiniert fehlender Werte als gültig bereit.
Plotoptionen
Stellt Optionen für die Darstellung der ROC-und Precision-Recall-Kurven bereit und steuert, ob ein Balkendiagramm erstellt wird, um den Wert der Untergrenze des Konfidenzintervalls der geschätzten Fläche unter der Kurve anzuzeigen.
Druckoptionen
Stellt Optionen für die Definition der Ausgabe für die entsprechenden Statistiken bereit, einschließlich der Anzeige der Statistiken in der Tabelle "Fläche unter der Kurve", der Koordinatenpunkte von ROC-und Precision-Recall-Kurven sowie der Auswertungsmetriken für Klassifikationsmerkmale.

Basisspezifikation

Die Basisspezifikation ist eine oder mehrere numerische Variablen als Testergebnisvariable (n) und eine Variable als tatsächliche Statusvariable mit einem ihrer Werte. Bei /DESIGN PAIR = TRUEmüssen mindestens zwei numerische Variablen als Testergebnisvariablen definiert sein. ROC ANALYSIS verwendet die nicht parametrische (verteilungsfreie) Methode, um die Fläche unter zwei ROC-Kurven zu berechnen. Die Standard-und Minimalausgabe sind Diagramme der ROC-Kurven und Tabellen der Flächen unter den Kurven.

Der Unterbefehl /PLOT stellt Optionen zum Definieren von ROC-Kurven oder Genauigkeitsrückrufkurven bereit.

Syntaxregeln

  • Minimale Syntax: Sie benötigen immer eine Testergebnisvariable und eine tatsächliche Statusvariable mit einem ihrer Werte in derROC ANALYSISBefehlszeile.
  • Die Testergebnisvariable muss numerisch sein, aber die Statusvariable kann einen beliebigen Typ mit einem beliebigen Format haben.
  • Unterbefehle können in beliebiger Reihenfolge angegeben werden.
  • Wenn ein Unterbefehl dupliziert wird, wird nur der letzte berücksichtigt, wenn alle Duplikate Syntaxfehler aufweisen. Eine Syntaxwarnung wird ausgegeben.
  • Wenn in einem Unterbefehl zwei oder mehr ausschließliche oder widersprüchliche Schlüsselwörter angegeben werden, überschreiben letztere die früheren Schlüsselwörter. Eine Syntaxwarnung wird ausgegeben.
  • Wenn ein Schlüsselwort in einem Unterbefehl doppelt vorkommt, wird es stillschweigend ignoriert.

Einschränkungen

Verteilungsannahmen
Im Unterbefehl CRITERIA kann der Benutzer die nicht parametrische oder parametrische Methode auswählen, um den Standardfehler der Fläche unter der Kurve zu schätzen. Derzeit ist die bi-negative Exponentialverteilung die einzige parametrische Option.
Optionale Ausgabe
Zusätzlich zu einer Schätzung der Fläche unter den ROC-Kurven kann der Benutzer seinen Standardfehler, ein Konfidenzintervall und einen p -Wert unter der Nullhypothese anfordern, dass die Fläche unter der Kurve gleich 0.5ist. Es können auch Tabellen mit Trennwerten und Koordinaten angezeigt werden, die zur Darstellung der ROC-Kurven verwendet werden.