일반화 선형 모형

일반화 선형 모형은 종속변수가 지정된 연결 함수를 통해 요인 및 공변량과 선형적으로 관련되도록 일반 선형 모형을 확장합니다. 더욱이 모형을 사용하면 종속변수가 비정규 분포를 갖는 것을 허용합니다. 또한 정상적으로 분포된 반응, 이분형 데이터의 로지스틱 모형, 개수 데이터의 로그선형 모형, 구간 중도절단 생존 데이터에 대한 음의 로그-로그 모형은 물론 매우 일반적인 모형 공식을 통해 다른 많은 통계 모형 같이 널리 사용되는 통계 모형을 포함합니다.

예. 운송 회사에서는 일반화 선형 모델을 사용하여 서로 다른 기간에 구성된 선박의 여러 유형에 대한 손상 횟수에 포아송 회귀분석을 맞출 수 있습니다. 그리고 결과로 생성된 모델은 손상될 확률이 높은 선박 유형을 판별하는 데 도움이 될 수 있습니다.

자동차 보험 회사는 일반화 선형 모델을 사용하여 자동차의 손해 배상 청구에 감마회귀를 맞출 수 있습니다. 결과로 생성되는 모델은 청구 규모에 가장 많이 기여하는 요인을 판별하는 데 도움을 줄 수 있습니다.

의료 연구자는 일반화 선형 모델을 사용하여 구간 중도절단 생존 데이터에 보완 로그-로그 회귀분석을 맞추어 의료 조건에 대한 재발 시간을 예측할 수 있습니다.

일반화 선형 모형 데이터 고려 사항

데이터. 반응은 척도, 개수, 이분형 또는 시행한 이벤트가 될 수 있습니다. 요인은 범주형으로 가정됩니다. 공변량, 척도 가중치 및 오프셋은 척도로 가정됩니다.

가정. 케이스는 독립된 관측으로 가정됩니다.

일반화 선형 모형 얻기

이 기능을 사용하려면 사용자 지정 테이블 및 고급 통계가 필요합니다.

메뉴에서 다음을 선택합니다.

분석 > 일반화된 선형 모델 > 일반화된 선형 모델...

참고: 빨간색으로 강조 표시된 필드는 필수 항목입니다. 모든 필수 입력란에 유효한 값을 입력한 후 붙여넣기확인 버튼이 활성화됩니다.

  1. 분포 및 연결함수를 지정합니다. (다양한 옵션에 대한 자세한 내용은 아래를 참조하십시오.)
  2. Response 탭에서 종속 변수를 선택합니다.
  3. 예측자 탭에서 종속변수 예측에 사용할 요인 및 공변수를 선택합니다.
  4. 모델 탭에서 선택한 요인 및 공변량을 사용하여 모델 효과를 지정합니다.

모형 유형을 사용하면 모형에 대한 분포 및 연결 함수를 지정하여 반응 유형별로 범주화된 여러 공통 모형에 대한 바로 가기를 제공할 수 있습니다.

모델 유형

척도 반응. 다음 옵션을 사용할 수 있습니다.

  • 선형. 정규를 분포로, 항등을 연결 함수로 지정합니다.
  • 로그 링크가 있는 감마. 감마를 분포로, 로그를 연결함수로 지정합니다.

순서 반응. 다음 옵션을 사용할 수 있습니다.

  • 순서 로지스틱. 다항(순서)을 분포로, 누적 로짓을 연결 함수로 지정합니다.
  • 순서 프로빗. 다항(순서)을 분포로, 누적 프로빗을 연결함수로 지정합니다.

생성됩니다. 다음 옵션을 사용할 수 있습니다.

  • 포아송 로그선형. 포아송을 분포로, 로그를 연결 함수로 지정합니다.
  • 로그 링크가 있는 음수 이항. 음수 이항(보조 모수에 대해 값 1을 가짐)을 분포로, 로그를 연결 함수로 지정합니다. 프로시저 추정값이 보조 모수의 값을 갖도록 하려면 음수 이항 분포를 가진 사용자 정의 모형을 지정하고 모수 그룹에서 추정값을 선택합니다.

이분형 반응 또는 이벤트/시행 데이터. 다음 옵션을 사용할 수 있습니다.

  • 이분형 로지스틱. 이항을 분포로, 로짓을 연결 함수로 지정합니다.
  • 이분형 프로빗. 이항을 분포로, 프로빗을 연결 함수로 지정합니다.
  • 구간 중도절단 생존. 이항을 분포로, 보완 로그-로그를 연결 함수로 지정합니다.

혼합. 다음 옵션을 사용할 수 있습니다.

  • 로그 링크가 있는 Tweedie. Tweedie를 분포로, 로그를 연결 함수로 지정합니다.
  • 항등 링크가 있는 Tweedie. Tweedie를 분포로, 항등을 연결 함수로 지정합니다.

사용자 지정. 분포와 연결 함수의 자체 조합을 지정합니다.

분포

이 선택은 종속변수의 분포를 지정합니다. 비정규 분포와 항등하지 않은 연결 함수를 지정하는 기능은 일반 선형 모형에서 일반화 선형 모형의 중요한 개선 사항입니다. 많은 분포-연결 함수가 있으며 주어진 데이터 세트에 적합한 함수가 여러 개일 수 있으므로 사전 이론적 고려 사항을 바탕으로 선택하거나 어느 조합이 가장 적합할지를 고려하여 선택하면 됩니다.

  • 이항. 이 분포는 이분형 반응이나 이벤트 수를 나타내는 변수의 경우에만 적합합니다.
  • 감마. 이 분포는 더 큰 양의 값 쪽으로 비대칭되는 양의 척도 값을 가진 변수에 적합합니다. 데이터 값이 0보다 작거나 같고 또는 없는 경우 해당 케이스는 분석에 사용되지 않습니다.
  • 역가우시안. 이 분포는 더 큰 양의 값 쪽으로 비대칭되는 양의 척도 값을 가진 변수에 적합합니다. 데이터 값이 0보다 작거나 같고 또는 없는 경우 해당 케이스는 분석에 사용되지 않습니다.
  • 음수 이항. 이 분포는 k 성공을 관측하는 데 필요한 시행 횟수로 생각할 수 있으며 양의 정수 값을 갖는 변수에 적합합니다. 데이터 값이 양수이거나, 0보다 작거나 같고 또는 없는 경우 해당 케이스는 분석에 사용되지 않습니다. 음이항 분포 보조 모수의 값은 0 이상의 값이 될 수 있습니다. 고정 값으로 설정하거나, 프로시저로 측정할 수 있습니다. 보조 모수가 0으로 설정되면 분포를 사용하는 것은 포아송 분포를 사용하는 것과 동일합니다.
  • NORMAL. 이것은 중앙(평균) 값에 대해 값이 대칭되는 종 형태의 분포를 띠는 척도변수에 적합합니다. 종속변수는 숫자여야 합니다.
  • 푸아송. 이 분포는 고정 기간 동안 중요 이벤트의 발생 수로 생각할 수 있으며 양의 정수 값을 갖는 변수에 적합합니다. 데이터 값이 양수이거나, 0보다 작거나 같고 또는 없는 경우 해당 케이스는 분석에 사용되지 않습니다.
  • 트위디. 이 분포는 감마 분포의 포아송 혼합으로 표현할 수 있는 변수에 적합합니다. 분포는 연속 특성(음이 아닌 실수 값 사용)과 이산형 분포(단일 값 0에서 양의 확률 매스)의 관점에서 "혼합"된 것입니다. 종속변수는 데이터 값이 0보다 크거나 같은 숫자가 되어야 합니다. 데이터 값이 0보다 작거나 또는 없는 경우 해당 케이스는 분석에 사용되지 않습니다. Tweedie 분포에서 모수의 고정 값은 1보다 크고 2보다 작은 숫자가 될 수 있습니다.
  • 멀티노미얼. 이 분포는 순서 반응을 나타내는 변수에 적합합니다. 종속변수는 숫자나 문자열이 될 수 있으며 최소 두 개의 유효한 개별 데이터 값을 가져야 합니다.

연결 함수

연결 함수는 종속변수의 변환으로 모형을 추정할 수 있습니다. 다음 함수를 사용할 수 있습니다.

  • 아이덴티티. f (x ) =x. 종속변수가 변환되지 않습니다. 이 링크는 분포에 사용할 수 있습니다.
  • 보 로그-로그. f(x)=log(-log(1-x)). 이항 분포에만 적합합니다.
  • 누적 Cauchit. f(x) = tan(π (x – 0.5)), 반응에서 각 범주의 누적 확률에 적용됩니다. 다항 분포에만 적합합니다.
  • 누적 보 로그-로그. f(x)=ln(−ln(1−x)), 반응에서 각 범주의 누적 확률에 적용됩니다. 다항 분포에만 적합합니다.
  • 누적 로짓. f(x)=ln(x / (1−x)), 각 응답 범주의 누적 확률에 적용됩니다. 다항 분포에만 적합합니다.
  • 누적 음수 로그-로그. f(x)=−ln(−ln(x)), 반응에서 각 범주의 누적 확률에 적용됩니다. 다항 분포에만 적합합니다.
  • 누적 프로빗. f(x)=Φ−1(x), 각 응답 범주의 누적 확률에 적용됩니다. 여기서 Φ−1은 역 표준 정규 누적 분포 함수입니다. 다항 분포에만 적합합니다.
  • 로그. f (x )=log (x ). 이 링크는 분포에 사용할 수 있습니다.
  • 로그 보. f(x)=log(1-x). 이항 분포에만 적합합니다.
  • 로그인. f(x)=log(x/(1−x) ). 이항 분포에만 적합합니다.
  • 음수 이항. f(x)=log(x / (x+k −1)), 여기서 k는 음수 이항 분포의 보조 모수입니다. 음수 이항 분포에만 적합합니다.
  • 음수 로그-로그. f(x)=-log(-log(x)). 이항 분포에만 적합합니다.
  • 승산비. f(x)=[(x/(1-x))α-1]/α, α ≠ 0인 경우. f(x)=log(x), α=0인 경우 α는 필수 숫자 사양이며 실수여야 합니다. 이항 분포에만 적합합니다.
  • 프로비트. f(x)=Φ−1(x), 여기서 Φ−1은 표준 정규 누적 분포의 역함수입니다. 이항 분포에만 적합합니다.
  • Power. f(x)=x α(α≠0인 경우). f(x)=log(x)(α=0인 경우). α는 필수 숫자 스펙이며 실수여야 합니다. 이 링크는 분포에 사용할 수 있습니다.

이 절차는 GENLIN 명령 구문을 붙여넣습니다.