R-제곱 통계

그림 1. 모델 요약
모델 요약

선형 회귀 모형에서 결정 계수 R 2는 예측변수 (독립변수) 와 연관된 종속변수의 분산 비율을 요약합니다. R 2 값이 클수록 모델에 의해 더 많은 변동이 설명되는 것을 나타내며 최대값은 1입니다. 범주형 종속변수가 있는 회귀 모형의 경우 선형 회귀 모형에서 R 2 의 모든 특성을 가진 단일 R 2 통계를 계산할 수 없으므로 이러한 근사값이 대신 계산됩니다. 다음 방법을 사용하여 결정 계수를 추정합니다.

  • Cox 을 사용하며, Snell의 R 2 1은 기준 모델의 로그 확률과 비교한 모델의 로그 확률을 기반으로 합니다. 그러나 범주형 결과를 사용하면 "완벽한" 모델의 경우에도 이론적 최대값이 1미만입니다.
  • 나겔커케의 R 2 2는 0에서 1까지의 전체 범위를 포함하도록 통계의 스케일을 조정하는 Cox & Snell R-square의 조정된 버전입니다.
  • McFadden's R 2 3는 차단 전용 모델과 전체 추정 모델의 로그 확률 커널에 기반한 또 다른 버전입니다.

"양호한" R 2 값을 구성하는 것은 애플리케이션의 여러 영역에 따라 다릅니다. 이러한 통계는 자체적으로 제안할 수 있지만 동일한 데이터에 대해 경쟁 모델을 비교할 때 가장 유용합니다. 가장 큰 R 2 통계가 있는 모델은 이 측도에 따라 " 최적입니다.

다음

1 Cox, D. R., 및 E. J. Snell. 1989. 이진 데이터 분석, 제2판. 런던: 채프먼 앤드 홀.
2 나겔커케, N. J. 박사 1991. A note on the general definition of the coefficient of determination. Biometrika, 78:3, 691-692
3 McFadden, D. 1974. Conditional logit analysis of qualitative choice behavior. 포함: Frontiers in Economics, P. Zarembka, eds. 뉴욕: 아카데믹 프레스.