Análisis ROC

El Análisis ROC (Receiver operating characteristic o característica operativa del receptor) es una forma útil de evaluar la precisión de las predicciones de modelo al trazar la sensibilidad frente a la especificidad de una prueba de clasificación (ya que el umbral varía en todo un rango de resultados de pruebas de diagnostico). El área completa bajo una curva ROC dada, o AUC, formula un estadístico importante que representa la probabilidad de que la predicción esté en el orden correcto cuando se observa una variable de prueba (para un sujeto que se selecciona aleatoriamente del grupo de casos, y el otro se selecciona aleatoriamente del grupo de control). El Análisis ROC admite la inferencia en relación con una sola AUC, curvas de precisión/exhaustividad (PR), y proporciona opciones para comparar dos curvas ROC que se generan de grupos independientes o sujetos emparejados.

El antiguo procedimiento de Curva ROC soporta la inferencia estadística sobre una sola curva ROC. Esto también puede ser recuperado por el nuevo procedimiento de análisis ROC. Además, el nuevo procedimiento de análisis ROC puede comparar dos curvas ROC generadas a partir de grupos independientes o sujetos emparejados.

Las curvas PR representan la precisión frente a la exhaustividad, tienden a ser más informativas cuando las muestras de datos observados son muy asimétricas, y proporcionan una alternativa a las curvas ROC para datos con una alta asimetría en la distribución de clase.

Ejemplo
Un banco tiene interés en clasificar a sus clientes dependiendo de si se retrasarán o no en el pago de sus préstamos; por tanto, se desarrollan modelos especiales para tomar estas decisiones. Se puede utilizar el Análisis ROC para evaluar y valorar la precisión de las predicciones del modelo.
Estadísticas
AUC, grupo negativo, valores perdidos, clasificación positiva, valor de corte, grado de convicción, intervalo de confianza asintótico bilateral, distribución, error estándar, diseño de grupo independiente, diseño de muestra emparejada, supuesto no paramétrico, supuesto de distribución exponencial binegativo, punto medio, punto de corte, curva PR, interpolación por pasos, significación asintótica (bilateral), Sensibilidad y (1 - Especificidad), Precisión y Exhaustividad.
Métodos
Se comparan las áreas bajo dos curvas ROC, que se generan a partir de grupos independientes o sujetos emparejados. Comparar dos curvas ROC puede proporcionar más información en cuanto a la precisión que resulta de dos acercamientos de diagnósticos comparativos.

Consideraciones de datos sobre el Análisis ROC

Datos
Las curvas PR representan la precisión frente a la exhaustividad y tienden a ser más informativas cuando las muestras de datos observados son muy asimétricas. Una interpolación lineal simple puede producir erróneamente una estimación excesivamente optimista de una curva PR.
Supuestos
La predicción estará en el orden correcto cuando se observa una variable de prueba para un sujeto seleccionado aleatoriamente del grupo de casos, y el otro seleccionado aleatoriamente del grupo de control. Cada grupo definido contendrá al menos una observación válida. Sólo se utiliza una variable de agrupación única para un procedimiento único.

Obtención de un análisis ROC

Esta característica requiere la opción Statistics Base.

  1. En los menús seleccione:

    Analizar > Clasificar > Análisis ROC

  2. Seleccione una o más variables de probabilidad de prueba.
  3. Elija una variable de estado.
  4. Identifique el valor de positivo para la variable de estado.
  5. Si lo desea, seleccione la opción Diseño de muestras emparejadas o seleccione una única variable de agrupación (no puede seleccionar ambas opciones).
    • Utilice el valor Diseño de muestras emparejadas para solicitar el diseño de muestras emparejadas para las variables de prueba. El diseño de muestras emparejadas compara dos curvas ROC en un escenario de muestras emparejadas cuando se miden varios valores de prueba en los mismos sujetos que están asociados con una variable de estado.
      Nota: cuando se selecciona Diseño de muestra emparejada , las opciones Variable de agrupación y Asunción de distribución (en el diálogo Opciones) están inhabilitadas.
    • Cuando se selecciona una variable de agrupación numérica, puede pulsar Definir grupos ... solicitar el diseño de grupo independiente para las variables de prueba y especificar dos valores, un punto medio o un punto de corte.
  6. Opcionalmente, pulse Opciones para definir los valores de clasificación, dirección de prueba, parámetros de error estándar y valores perdidos.
  7. Opcionalmente, pulse Visualizar para definir los valores de trazado e impresión (que incluyen curva ROC, curva de precisión/exhaustividad y valores de calidad del modelo).
  8. Pulse Aceptar.

Este procedimiento pega la sintaxis del comando ROC ANALYSIS .