로지스틱 회귀분석

로지스틱 회귀분석은 예측변수 세트의 값을 기준으로 결정되는 특성이나 결과가 있는지 여부를 예측하려는 상황에서 유용합니다. 이 회귀분석은 선형 회귀 모형과 유사하나 종속변수가 이분형인 모형에 적합합니다. 로지스틱 회귀계수는 모형의 각 독립변수에 대한 오즈비를 추정하는데 사용될 수 있습니다. 로지스틱 회귀분석은 판별 분석보다는 좀 더 광범위한 조사에 적절합니다.

예제. 라이프스타일이 CHD(관상동맥성심장병)에 대한 위험 요인이 됩니까? 환자 표본의 흡연 상태, 식습관, 운동, 음주, CHD 상태를 측정한다면 네 가지 라이프스타일 변수를 사용하여 모형을 구축한 다음 환자 표본에 CHD가 발생할지 여부를 예측할 수 있습니다. 모형으로 각 요인에 대한 오즈비 추정값들(예: 비흡연가들보다 흡연가들에게 CHD가 발병할 가능성이 얼마나 더 많은가)을 구할 수 있습니다.

통계. 각 분석에 대해 전체 케이스, 선택한 케이스, 유효 케이스를 선택할 수 있으며 각 범주형 변수에 대해 모수 코딩을 선택할 수 있습니다. 각 단계에서 입력되었거나 제거된 변수, 반복 히스토리, –2 로그-우도, 적합도, Hosmer-Lemeshow 적합도 통계량, 모형 카이제곱, 향상 카이제곱, 분류표, 변수 간의 상관, 관측그룹과 예측 확률 도표, 잔차 카이제곱을 선택할 수 있습니다. 방정식의 각 변수에 대해 계수(B), B의 표준 오차, Wald 통계, 추정된 오즈비(exp(B)), exp(B)에 대한 신뢰구간, 항이 모형에서 제거된 경우의 로그-우도 통계를 구할 수 있습니다. 방정식에 없는 각 변수에 대해 스코어 통계량을 구할 수 있습니다. 각 케이스에 대해 관측그룹, 예측확률, 예측그룹, 잔차, 표준화 잔차 통계를 구할 수 있습니다.

방법. 변수의 블록 입력이나 단계적 방법으로 전진 조건, 전진 LR, 전진 Wald, 후진 조건, 후진 LR, 후진 Wald 중 하나를 사용하여 모형을 추정할 수 있습니다.

로지스틱 회귀분석 데이터 고려 사항

데이터. 종속변수는 이분형이어야 합니다. 독립변수는 구간 수준이나 범주형이 될 수 있습니다. 독립변수가 범주형인 경우 코딩된 더미나 지표여야 합니다. 프로시저에 범주형 변수를 자동으로 코딩 변경하는 옵션이 있습니다.

가정. 로지스틱 회귀분석은 판별 분석에서 사용하는 동일한 개념의 분포 가정을 따르지 않습니다. 그러나 예측변수가 다변량 정규 분포를 따른다면 현재 해법이 좀더 안정적으로 적용될 수 있습니다. 또한 다른 형식의 회귀분석에서처럼 예측변수 간의 다중공선성은 편향된 추정값과 팽창한 표준 오차를 유도할 수 있습니다. 이 프로시저는 소속그룹이 실제로 범주형 변수일 때 가장 효과적입니다. 즉, 소속그룹이 연속형 변수값에 따라 달라지는 경우(예: "높은 IQ" 대 "낮은 IQ") 연속형 변수를 통해 얻을 수 있는 다양한 정보를 활용하려면 선형 회귀분석을 사용하는 것이 좋습니다.

관련 프로시저. 산점도 프로시저를 사용하여 다중공선성 관련 데이터를 화면에 나타냅니다. 다변량 정규성과 등분산-공분산 행렬에 대한 가정이 충족되면 판별 분석 프로시저를 사용하여 해법을 빠르게 구할 수 있습니다. 모든 예측변수가 범주형이면 로그선형 프로시저도 사용할 수 있습니다. 종속변수가 연속형이면 선형회귀 프로시저를 사용합니다. 로지스틱 회귀분석 프로시저를 사용하여 저장된 확률을 도표화하는 ROC 곡선 프로시저를 사용할 수 있습니다.

로지스틱 회귀분석 구하기

이 기능을 사용하려면 SPSS® Statistics Standard Edition 또는 회귀분석 옵션 설치가 필요합니다.

  1. 메뉴에서 다음을 선택합니다.

    분석 > 회귀분석 > 2진 로지스틱...

  2. 이분형 종속변수를 하나 선택합니다. 이 변수는 숫자 또는 문자일 수 있습니다.
  3. 하나 이상의 공분산을 선택합니다. 상호작용 항을 포함시키려면 상호작용에 포함된 모든 변수를 선택한 다음 >a*b>을 선택합니다.

블록에 변수를 입력하려면 블록에 대한 공분산을 선택한 후에 다음을 클릭하고 새 블록을 지정합니다. 블록이 모두 지정될 때까지 이 과정을 반복합니다.

선택적으로 분석할 케이스를 선택할 수 있습니다. 선택변수를 선택한 다음 규칙을 클릭합니다.

이 프로시저는 LOGISTIC REGRESSION 명령 구문을 붙여넣습니다.