소매 판매 프로모션 예측
이 튜토리얼은 향후 판매 촉진 효과를 예측하기 위해 두 가지 모델을 구축한 후, 해당 모델들을 비교합니다.
상태 모니터링 튜토리얼과 마찬가지로, 데이터 마이닝 프로세스는 탐색, 데이터 준비, 훈련 및 테스트 단계로 구성됩니다. 데이터 telco.csv 파일의 모든 데이터가 이탈 예측에 유용한 것은 아닙니다. 필터를 사용하여 예측 변수로 사용하기에 중요하다고 간주되는 데이터(모델에서 ' 중요'로 표시된 필드)만 선택할 수 있습니다.
튜토리얼 미리보기
비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 동영상에 표시된 사용자 인터페이스에는 약간의 차이가 있을 수 있습니다. 이 동영상은 서면 튜토리얼을 보완하기 위한 것입니다. 이 동영상은 본 문서의 개념과 작업을 시각적으로 학습할 수 있는 방법을 제공합니다.
튜토리얼을 시도해 보세요
이 학습서에서는 다음 태스크를 완료합니다.
샘플 모델러 흐름 및 데이터 세트
이 튜토리얼은 샘플 프로젝트의 소매 판매 촉진 흐름을 사용합니다. 사용된 데이터 파일은. goods2n.csv 입니다. 다음 이미지는 샘플 모델러 흐름을 보여줍니다.


작업 1: 샘플 프로젝트 열기
샘플 프로젝트에는 여러 데이터 세트와 샘플 모델러 흐름이 포함되어 있습니다. 샘플 프로젝트가 아직 없다면, 튜토리얼 항목을 참조하여 샘플 프로젝트를 생성하십시오. 그런 다음 다음 단계를 따라 샘플 프로젝트를 엽니다:
- 에서 Cloud Pak for Data 탐색 메뉴에서 프로젝트
> 모든 프로젝트를 선택합니다.
- SPSS Modeler 프로젝트를 클릭하세요.
- 자산 탭을 클릭하면 데이터 세트와 모델러 흐름을 볼 수 있습니다.
진행 상황을 확인하세요
다음 이미지는 프로젝트의 'Assets' 탭을 보여줍니다. 이제 이 튜토리얼과 관련된 샘플 모델러 흐름을 사용할 준비가 되었습니다.

작업 2: 데이터 자산, 추출 및 입력 노드 검토
소매 판매 촉진에는 여러 노드가 포함됩니다. 다음 단계를 따라 데이터 자산, 파생 및 유형 노드를 검토하십시오:
데이터 자산 노드
- 자산 탭에서 소매 판매 촉진 모델러 흐름을 열고 캔버스가 로드될 때까지 기다립니다.
- 노드를 goods1n.csv 두 번 클릭하십시오. 이 노드는 프로젝트 내 파일로 goods1n.csv 연결되는 데이터 자산 노드입니다.
- 파일 형식 속성을 검토하십시오.
- 데이터 미리보기를 클릭하면 전체 데이터 세트를 볼 수 있습니다.
- 각 레코드에는 다음이 포함됨을 유의하십시오:
Class제품 유형.Cost단가.Promotion특정 프로모션에 지출된 금액 지수.Before. 프로모션 전 매출.After프로모션 후 매출액.
두 수입 필드(
Before및After)는 절대 조건으로 표현됩니다. 그러나 프로모션 이후(그리고 아마도 그 결과로) 발생한 매출 증가분이 더 유용한 수치일 가능성이 높아 보인다. - 데이터 미리보기와 속성 사이드 패널을 닫으십시오.
파생 노드
- 증가(파생) 노드를 더블 클릭하십시오. 이 노드는 수익 증가분의 가치를 도출합니다.
- 설정을 검토하십시오. 특히 '표현식' 필드를 확인하십시오. 이 필드에는 프로모션 전 매출액 대비 증가율을 도출하는 수식이 포함되어 있습니다:
(After - Before) / Before * 100.0. - 미리보기 데이터를 클릭하면 파생된 값이 포함된 데이터 세트를 볼 수 있습니다.
- 증가 열을 확인하십시오.
각 제품 클래스에 대해 매출 증가와 판촉 비용 사이에 거의 선형 관계가 존재합니다. 따라서 의사결정 트리 또는 신경망이 상당한 정확도로 사용 가능한 기타 필드에서 수입이 증가함을 예측할 수 있습니다.
- 데이터 미리보기와 속성 사이드 패널을 닫으십시오.
유형 노드
- '유형 정의(Type) ' 노드를 두 번 클릭하십시오. 이 노드는 측정 수준(필드가 포함하는 데이터 유형)과 같은 필드 속성 및 모델링에서 각 필드의 대상 또는 입력 역할 등을 지정합니다. 측정 수준은 필드에서 데이터 유형을 나타내는 범주입니다. 원본 데이터 파일은 세 가지 다른 측정 수준을 사용합니다:
- 연속 필드(예: 필드)
Age는 연속적인 숫자 값을 포함합니다. - 명목형 필드(예: 필드
Education)는 두 개 이상의 서로 다른 값을 가집니다—이 경우College또는High school입니다. - 순서체 (예: 순서체)
Income level는 고유한 순서를 지닌 여러 개의 서로 다른 값(이 경우Low,Medium, )High을 가진 데이터를 기술합니다.각 필드에 대해 Type 노드는 모델링에서 각 필드가 수행하는 역할을 나타내기 위한 역할도 지정합니다. 해당 역할은 파생된 필드인 '필드'에 대해 '대상 '으로
Increase설정됩니다. 예측하려는 값의 대상이 되는target필드입니다.대부분의 다른 필드에 대해 역할은 입력 으로 설정됩니다. 입력 필드는 때때로
predictors또는 목표 필드의 값을 예측하기 위해 모델링 알고리즘에서 값을 사용하는 필드로 알려져 있습니다.해당
After필드의 역할은 ' 없음'으로 설정되어 있으므로, 이 필드는 모델링 알고리즘에서 사용되지 않습니다.
- 연속 필드(예: 필드)
- 선택 사항: '데이터 미리 보기'를 클릭하면 파생된 값이 포함된 데이터 세트를 볼 수 있습니다.
진행 상황을 확인하세요
다음 이미지는 Type 노드를 보여줍니다. 이제 모델을 생성하고 비교할 준비가 되었습니다.

작업 3: 모델 생성 및 비교
이 흐름은 이러한 수익 증가를 예측하기 위해 신경망과 의사결정 트리를 교육합니다. 다음 단계를 따라 두 모델을 생성하십시오:
모델 생성
- 증가(신경망) 노드를 더블클릭하여 해당 속성을 검토하십시오.
- 기본 사항 섹션을 확장하면 다층 퍼셉트론 이 모델 유형임을 확인할 수 있습니다. 이 속성은 네트워크가 예측 변수들을 숨겨진 계층을 통해 목표 변수들에 어떻게 연결하는지를 결정합니다. 다층 퍼셉트론은 훈련 및 평가 시간이 증가할 수 있는 대가를 치르면서 더 복잡한 관계를 허용한다.
- 모델 옵션 섹션을 확장하여 평가 및 점수 부여 속성을 확인하세요.
- 증가(C&R 트리) 노드를 더블클릭하여 해당 속성을 확인하십시오.
- 모두 실행을 클릭하고 모델 너겟이
생성될 때까지 기다리십시오.
- 증가(C&R 트리) 모델 너겟을 증가(신경망) 에 연결하십시오.
- 분석 노드 추가:
- 팔레트에서 출력 섹션을 확장합니다.
- 분석 노드를 캔버스 위로 드래그하세요.
- 증가(신경망) 모델 너겟을 분석 노드에 연결하십시오.
- 분석에 사용할 데이터 세트를 변경하십시오:
- 노드를 goods1n.csv 더블클릭하면 해당 노드의 속성을 볼 수 있습니다.
- 이력서 데이터 세트 변경.
- 데이터 자산 > 데이터 자산 관리( GOODS2n.csv )로 이동하십시오.
- 선택을 클릭하십시오.
- 저장 을 클릭하십시오.
- 분석 노드 위에 마우스를 올려놓고 실행 아이콘을 클릭하세요
.
- 출력 및 모델 창에서 '분석'이라는 이름의 출력을 클릭하여 결과를 확인하십시오.
분석 결과, 특히 예측된 증가율과 정답 간의 선형 상관관계를 통해 훈련된 시스템이 수익 증가를 높은 정확도로 예측함을 확인할 수 있습니다.
추가 탐색은 훈련된 시스템이 상대적으로 큰 오류를 발생시키는 경우에 중점을 둘 수 있습니다. 예측된 매출 증가분을 실제 증가분과 비교하여 그래프를 작성하면 이러한 오류를 식별할 수 있습니다. 그런 다음 상호작용 그래픽을 사용하여 그래프에서 이상값을 선별할 수 있으며 SPSS Modeler, 해당 속성을 통해 데이터 설명 또는 학습 과정을 조정하여 정확도를 향상시킬 수 있습니다.
진행 상황을 확인하세요
다음 이미지는 분석 노드의 출력을 보여줍니다.

요약
이 예시는 향후 판매 촉진 활동의 효과를 예측하는 방법을 보여줍니다. 상태 모니터링 사례와 유사하게, 데이터 마이닝 프로세스는 탐색, 데이터 준비, 학습 및 테스트 단계로 구성됩니다.
다음 단계
이제 다른 SPSS® Modeler 튜토리얼을 시도할 준비가 되었습니다.