선형 회귀: 새로운 변수로 저장
예측값, 잔차, 기타 진단 정보에 유용한 통계를 저장할 수 있습니다. 각각을 선택하면 활성 데이터 파일에 새로운 변수가 여러 개 추가됩니다.
예측값. 각 케이스를 예측하는 회귀 모형 값을 말합니다.
- 비표준화. 모형이 예측하는 종속변수의 값입니다.
- 표준화. 각 예측값을 표준화 형식으로 변환합니다. 즉, 평균 예측값을 예측값에서 빼고 그 차이를 예측값의 표준 편차로 나눕니다. 표준화 예측값은 평균이 0이고 표준 편차가 1이 됩니다.
- 조정됨. 회귀계수 계산에서 제외되는 케이스에 대한 예측값입니다.
- 평균예측 표준 오차. 예측값의 표준 오차입니다. 독립변수와 같은 값을 갖는 케이스에 대한 종속변수 평균값의 표준 편차 추정값입니다.
거리. 회귀 모형에 큰 영향을 줄 수도 있는 독립변수나 케이스에 대한 특수 값 조합으로 케이스를 식별하는 측도가 됩니다.
- 마할라노비스 (Mahalanobis). 독립변수의 케이스 값이 전체 케이스 평균과 얼마나 달라지는지에 대한 측도입니다. Mahalanobis 거리가 크면 케이스가 독립변수 하나 이상에 대해 극단값을 갖는 것으로 식별합니다.
- Cook의 거리. 특정 케이스를 회귀계수 계산에서 제외할 때 모든 케이스의 잔차가 얼마나 변경될 수 있는지에 대한 측도입니다. Cook의 거리가 크면 회귀분석 통계 계산에서 케이스를 제외할 때 계수가 크게 변경됩니다.
- 레버리지 값. 회귀분석의 적합도에 점이 미치는 영향을 측정합니다. 중심화된 레버리지 값의 범위는 0(적합도에 아무 영향도 미치지 않음)부터 (N-1)/N까지입니다.
예측 구간. 평균과 개별 예측 구간에 대한 상한 및 하한 경계를 말합니다.
- 평균. 평균 예측반응의 예측 구간에 대한 하한 및 상한(두 변수)입니다.
- 개별. 단일 케이스에 대한 종속변수 예측 구간의 하한 및 상한(두 변수)입니다.
- 신뢰구간. 1과 99.99 사이의 값을 입력하여 두 예측 구간에 대한 신뢰수준을 지정합니다. 이 값을 입력하려면 먼저 평균 또는 개별을 선택해야 합니다. 일반적인 신뢰구간 값은 90, 95, 99입니다.
잔차. 종속변수의 실제 값에서 회귀 방정식을 통해 예측한 값을 뺀 것을 말합니다.
- 비표준화. 관측값과 모형에 의해 예측된 값 사이 차이입니다.
- 표준화. 표준 편차의 추정값으로 나눈 잔차입니다. Pearson 잔차라고도 하는 표준화 잔차는 평균이 0이고 표준 편차가 1이 됩니다.
- 스튜던트화. 케이스에 따라 다양한 표준 편차의 추정값으로 나눈 잔차로서 독립변수 평균으로부터의 독립변수의 케이스 값 거리에 따라 달라집니다. 내부적으로 스튜던트화 잔차라고도 합니다.
- 삭제됨. 회귀계수 계산에서 케이스를 제외할 때의 케이스에 대한 잔차로, 종속변수 값과 조정된 예측값 간 차이입니다.
- 삭제된 스튜던트화. 표준 오차로 나뉘어진 케이스에 대한 삭제된 잔차입니다. 스튜던트화 삭제된 잔차와 연관된 스튜던트화 잔차 사이의 차이는 케이스가 자체 예측에서 작성하는 차이를 표시합니다. 외부 스튜던트화 잔차라고도 합니다.
영향력 통계. 회귀계수(DFBETA)의 변경 사항과 특수 케이스를 제외함으로써 생기는 예측값(DFFIT)입니다. 표준화된 DFBETA 및 DFFIT 값 또한 공분산 비율과 함께 사용할 수 있습니다.
- DfBetas. 베타 값의 차이는 특정 케이스를 제외하여 나타난 회귀계수의 변화량을 나타냅니다. 값은 모형의 각 항에 대해 계산되며 상수를 포함합니다.
- 표준화된 DfBeta. 베타 값의 표준화된 차이입니다. 특정 케이스를 제외하여 나타난 회귀계수의 변화량을 나타냅니다. 절대값이 2보다 큰 케이스를 N 제곱근(N은 케이스 수)으로 나누어 결과 값을 확인합니다. 값은 모형의 각 항에 대해 계산되며 상수를 포함합니다.
- DfFit. 적합값의 차이는 특정 케이스를 제외하여 나타난 예측값의 변화량입니다.
- 표준화 DfFit. 적합값의 표준화된 차이입니다. 특정 케이스를 제외하여 나타난 예측값의 변화량을 나타냅니다. 절대값이 2보다 큰 표준화 값을 p/N 제곱근(p는 모형에서 모수의 수이고 N은 케이스 수)으로 나누어 결과 값을 확인합니다.
- 공분산 비율. 회귀계수 계산에서 모든 케이스가 포함된 공분산행렬 행렬식에 대한 특정 케이스가 제외된 공분산행렬 행렬식의 비율입니다. 이 비율이 1에 가까우면 케이스로 인해 공분산행렬이 크게 달라지지 않습니다.
계수 통계. 데이터 세트 또는 데이터 파일에 회귀계수를 저장합니다. 데이터 세트는 같은 세션에서 다시 사용할 수 있으나 세션을 마치기 전에 명시적으로 저장하지 않는 한 파일로 저장되지 않습니다. 데이터 세트 이름은 변수 이름 규칙을 준수해야 합니다. 자세한 정보는 변수 이름 주제를 참조하십시오.
XML 파일에 모형정보 내보내기. 모수 추정값과 필요에 따라 해당 공분산을 XML(PMML) 형식의 지정된 파일로 내보냅니다. 스코어링 목적으로 이 모형 파일을 사용하여 모형 정보를 다른 데이터 파일에 적용할 수 있습니다. 자세한 정보는 스코어링 마법사 주제를 참조하십시오.
선형 회귀분석에서 새로운 변수로 저장
이 기능을 사용하려면 Statistics Base 옵션이 필요합니다.
- 메뉴에서 다음을 선택합니다.
- 선형 회귀분석 대화 상자에서 저장을 클릭합니다.
- 원하는 값이나 통계를 선택합니다.