선형 리지 회귀분석

Linear Ridge는 하나 이상의 독립 변수에 대한 종속 변수의 Python 또는 제곱 손실 정규화된 선형 회귀 모델을 추정하는 sklearn.linear_model.Ridge 클래스를 사용하며 추적 플롯을 표시하고 교차 검증에 따라 알파 하이퍼파라미터 값을 선택하는 옵션 모드가 포함되어 있습니다. 단일 모델을 적합하거나 교차 검증을 사용하여 알파를 선택하는 경우, 홀드아웃 데이터의 파티션을 사용하여 표본 외 성능을 추정할 수 있습니다.

선형 릿지는 알파 정규화 매개변수의 지정된 값으로 모델을 맞추는 것 외에도 알파 값 범위에 대한 계수 값의 릿지 트레이스 플롯을 표시하거나 지정된 값 그리드에서 K-배 교차 검증을 통해 하이퍼파라미터 값의 선택을 용이하게 할 수 있습니다. 단일 모델을 적합하거나 교차 검증을 통한 알파 선택을 수행하는 경우, 최종 모델을 입력 데이터의 파티션으로 생성된 홀드아웃 데이터에 적용하여 모델의 표본 외 성능에 대한 유효한 추정치를 얻을 수 있습니다.

선형 릿지 회귀 분석 얻기

  1. 메뉴에서 다음을 선택합니다.

    분석 > 회귀 > 선형 OLS 대안 > 릿지

    변수 대화 상자에서 활성 데이터 세트의 각 사례를 학습 또는 홀드아웃 샘플에 할당하는 변수를 지정할 수 있습니다.

  2. 숫자 목표변수를 선택하십시오. 분석을 실행하려면 하나의 목표변수만 필요합니다.
  3. 숫자 종속 항목을 지정합니다.
  4. 하나 이상의 범주형 요인 변수 또는 숫자 공변량 변수를 지정합니다.

선택적으로, Partition는 지정하거나 선택한 모델의 표본 외 성능을 추정하기 위해 입력 데이터의 홀드아웃 또는 테스트 하위 집합을 생성하는 방법을 제공합니다. 모든 파티셔닝은 프로시저에서 사용하는 변수에 대해 유효하지 않은 데이터가 있는 모든 경우를 목록으로 삭제한 후 수행됩니다. 교차 유효성 검사를 위해 훈련 데이터의 폴드 또는 파티션은 Python에서 생성됩니다. 파티션에 의해 생성된 홀드아웃 데이터는 적용 중인 모드에 관계없이 추정에 사용되지 않습니다.

파티션은 각 샘플에 무작위로 할당되는 사례의 비율을 지정하거나(트레이닝 및 홀드아웃 파티션에서), 각 사례를 트레이닝 또는 홀드아웃 샘플에 할당하는 변수를 사용하여 정의할 수 있습니다. 교육과 변수를 모두 지정할 수는 없습니다. 파티션을 지정하지 않으면 입력 데이터의 약 30%에 해당하는 홀드아웃 샘플이 생성됩니다.

트레이닝 %는 활성 데이터 세트에서 훈련 샘플에 무작위로 할당할 상대적인 사례 수를 지정합니다. 기본 교육은 70%입니다.

이 절차는 LINEAR_RIDGE 명령 구문을 붙여넣습니다.