통신 고객 분류(다항 로지스틱 회귀분석)

로지스틱 회귀분석은 입력 필드 값을 기반으로 레코드를 분류하는 통계 기법입니다. 이는 선형 회귀와 비슷하지만, 숫자 대신 범주형 대상 필드를 사용합니다.

예를 들어, 통신 제공업체가 서비스 사용 패턴을 기준으로 고객층을 세그먼트화하여 고객을 4개의 그룹으로 범주화한다고 가정합니다. 소속그룹을 예측하기 위해 인구 통계학적 데이터를 사용하면 개별 잠재 고객에 대한 제공을 사용자 정의할 수 있습니다.

이 예에서는 telco.sav라는 데이터 파일을 참조하는 telco_custcat.str이라는 스트림을 사용합니다. 이러한 파일은 IBM® SPSS® Modeler 설치의 데모 디렉토리에 있습니다. Windows 시작 메뉴의 IBM SPSS Modeler 프로그램 그룹에서 데모 폴더에 액세스할 수 있습니다. telco_custcat.str 파일은 streams 디렉토리에 있습니다.

이 예에서는 사용 패턴을 예측하기 위해 인구 통계학적 데이터를 사용하는 데 초점을 맞춥니다. 대상 필드 custcat에는 다음과 같이 네 개의 고객 그룹에 해당하는 네 개의 가능한 값이 있습니다.

레이블
1 기본 서비스
2 E-서비스
3 플러스 서비스
4 전체 서비스

대상에 다중 범주가 있으므로 다항 모델이 사용됩니다. 예/아니오, 참/거짓 또는 이탈/이탈하지 않음과 같이 두 개의 고유 범주가 있는 대상의 경우, 이항 모델이 대신 작성될 수 있습니다. 자세한 정보는 통신 서비스 제공자를 바꾸는 고객(이항 로지스틱 회귀분석)의 내용을 참조하십시오.

다음