Análise ROC

A análise da característica operacional do receptor (ROC) é uma maneira útil de avaliar a precisão das previsões do modelo plotando a sensibilidade versus (1 especificidade) de um teste de classificação (já que o limite varia em toda uma faixa de resultados de testes diagnósticos). A área completa sob uma determinada curva ROC, ou AUC, formula uma estatística importante que representa a probabilidade de que a predição estará na ordem correta quando uma variável de teste for observada (para um sujeito que é selecionado aleatoriamente do grupo de casos e o outro selecionado aleatoriamente do grupo de controle). A análise ROC suporta a inferência com relação a uma única curva AUC de recuperação de precisão (PR) e fornece opções para comparar duas curvas ROC geradas a partir de grupos independentes ou de sujeitos pareados.

O antigo procedimento de Curva ROC suporta a inferência estatística sobre uma única curva ROC. Isso também pode ser recuperado pelo novo procedimento de Análise de ROC. Além disso, o novo procedimento de Análise de ROC pode comparar duas curvas ROC geradas a partir de grupos independentes ou de assuntos empardos.

As curvas PR plotam precisão versus rechamada, elas tendem a ser mais informativas quando as amostras de dados observadas são altamente distorcidas e fornecem uma alternativa às curvas ROC para dados com grande distorção na distribuição de classes.

Exemplo
É do interesse de um banco classificar corretamente os clientes entre aqueles que irão e não irão inadimplir em seus empréstimos, então modelos especiais são desenvolvidos para tomar essas decisões. A Análise ROC pode ser usada para avaliar e avaliar a precisão das previsões do modelo.
Estatísticas
AUC, grupo negativo, valores ausentes, classificação positiva, valor de corte, força de convicção, intervalo de confiança assintótico bilateral, distribuição, erro padrão, projeto de grupo independente, projeto de amostra pareada, suposição não paramétrica, suposição de distribuição exponencial bi-negativa, ponto médio, ponto de corte, curva PR, interpolação stepwise, significância assintótica (2 caudas), Sensibilidade e (1-Especificidade), Precisão e Rechamada.
Métodos
As áreas sob duas curvas ROC, que são geradas a partir de grupos independentes ou sujeitos pareados, são comparadas. A comparação de duas curvas ROC pode fornecer mais informações sobre a acurácia resultante de duas abordagens diagnósticas comparativas.

Considerações sobre dados de Análise de ROC

Dados
As curvas PR plotam Precision versus Recall e tendem a ser mais informativas quando as amostras de dados observadas são altamente distorcidas. Uma simples interpolação linear pode gerar erroneamente uma estimativa excessivamente otimista de uma curva PR.
Pressupostos
A predição estará na ordem correta quando uma variável de teste for observada para um sujeito que é selecionado aleatoriamente do grupo de casos e o outro é selecionado aleatoriamente do grupo de controle. Cada grupo definido conterá pelo menos uma observação válida. Apenas uma única variável de agrupamento é usada para um único procedimento.

Obtendo uma Análise de ROC

Essa variável requer a opção de Base de Estatísticas.

  1. No menu, escolha:

    Analisar > Classificar > Análise de ROC

    Observação: Os campos destacados em vermelho são obrigatórios. Os botões Colar e OK são ativados após você inserir valores válidos em todos os campos obrigatórios.
  2. Selecione uma ou mais variáveis de probabilidade de teste.
  3. Selecione uma variável de estado.
  4. Identifique o positivo valor da variável de estado.
  5. Opcionalmente, selecione a opção Design de amostra pareado ou selecione uma única variável de agrupamento (não é possível selecionar ambas as opções).
    • Use a configuração Design de amostra pareado para solicitar o design de amostra pareado para a variável ou variáveis de teste. O design de amostra pareada compara duas curvas ROC em um cenário de amostra pareada quando vários valores de teste são medidos nos mesmos sujeitos que estão associados a uma variável de estado.
      Nota: Quando design de amostra de Par-amostra é selecionado, as opções Agrupamento Variável e Distribuição Assumpção (nas opções Opções de diálogo) estão desativadas.
    • Quando uma variável de agrupamento numérico é selecionada, você pode clicar em Definir Grupos ... para solicitar o design de grupo independente para a (s) variável (s) de teste (s), e para especificar dois valores, um ponto intermediário ou um ponto de corte.
  6. Opcionalmente, clique em Opções para definir a classificação, a direção de teste, os parâmetros de erro padrão e as configurações de valores ausentes.
  7. Opcionalmente, clique em Display para definir as configurações de plotagem e impressão (que incluem ROC Curve, Precision-Recall Curva e configurações de qualidade de modelo).
  8. Clique em OK.

Este procedimento pasta a sintaxe de comando ROC ANALYSIS .