보유 고객 예측 수 추적
일단 모델에 만족하면 데이터 세트에서 예측한 다음 2년에 걸쳐 보유되는 고객의 수를 추적하고자 할 것입니다. 총 가입 기간(이후 시간 + tenure)이 모델을 학습하는 데 사용된 데이터의 생존 시간 범위에 속하지 않는 고객인 널값은 흥미 있는 도전 과제를 제시합니다. 이를 처리하는 한 가지 방법은 두 예측변수군을 작성하여 한 예측변수군에서는 널값을 이탈한 것으로 간주하고 또 다른 예측변수군에서는 보유된 것으로 간주하는 것입니다. 이 방법으로 보유되는 고객의 예측 수를 기반으로 하여 상한 및 하한 경계를 설정할 수 있습니다.

- 모델 팔레트에서 모델 너깃을 두 번 클릭하거나 너깃을 복사하여 스트림 캔버스에 붙여넣고 새 너깃을 소스 노드에 연결하십시오.
- 설정 탭에서 너깃을 여십시오.
- 정상 구간이 선택되어 있는지 확인하고 시간 간격으로 1.0을 지정하고 스코어링할 기간으로 24를 지정하십시오. 그러면 각 레코드가 다음 24개월 각각에 대해 스코어링됩니다.
- 지난 생존 시간을 지정할 필드로 tenure를 선택하십시오. 스코어링 알고리즘이 각 고객의 해당 회사의 고객으로서의 시간 길이를 계산할 것입니다.
- 모든 확률 추가를 선택하십시오.
그림 2. 통합 노드: 설정 탭 
- 통합 노드를 모델 너깃에 연결하고 설정 탭에서 기본 모드로 평균을 선택 취소하십시오.
- $CP-0-n 양식의 $CP-0-1에서 $CP-0-24까지의 필드를 통합할 필드로 선택하십시오. 필드 선택 대화 상자에 있으면 이름순(문자순)으로 필드를 정렬하는 것이 가장 쉬운 방법입니다.
- 필드에 레코드 수 포함을 선택 취소하십시오.
- 확인을 클릭하십시오. 이 노드는 "하한 경계" 예측을 작성합니다.
그림 3. 채움 노드: 설정 탭 
- 방금 통합 노드에 연결한 Coxreg 너깃에 채움 노드를 연결하십시오. 설정 탭에서 $CP-0-n 양식의 $CP-0-1에서 $CP-0-24까지의 필드를 채울 필드로 선택하십시오. 필드 선택 대화 상자에 있으면 이름순(문자순)으로 필드를 정렬하는 것이 가장 쉬운 방법입니다.
- 널값을 1값으로 바꾸도록 선택하십시오.
- 확인을 클릭하십시오.
그림 4. 통합 노드: 설정 탭 
- 통합 노드를 채움 노드에 연결하고 설정 탭에서 기본 모드로 평균을 선택 취소하십시오.
- $CP-0-n 양식의 $CP-0-1에서 $CP-0-24까지의 필드를 통합할 필드로 선택하십시오. 필드 선택 대화 상자에 있으면 이름순(문자순)으로 필드를 정렬하는 것이 가장 쉬운 방법입니다.
- 필드에 레코드 수 포함을 선택 취소하십시오.
- 확인을 클릭하십시오. 이 노드는 "상한 경계" 예측을 작성합니다.
그림 5. 필터 노드: 설정 탭 
- 추가 노드를 두 개의 통합 노드에 연결한 다음 필터 노드를 추간 노드에 연결하십시오.
- 필터 노드의 설정 탭에서 필드의 이름을 1에서 24까지로 변경하십시오. 전치 노드를 사용하여
이러한 필드 이름이 도표 다운스트림에서 x축에 대한 값이 됩니다.
그림 6. 전치 노드: 설정 탭 
- 전치 노드를 필터 노드에 첨부하십시오.
- 새 필드의 번호로 2를 입력하십시오.
그림 7. 필터 노드: 필터 탭 
- 필터 노드를 전치 노드에 연결하십시오.
- 필터 노드의 설정 탭에서 ID의 이름을 Months로, Field1의 이름을 Lower Estimate로,
Field2의 이름을 Upper Estimate로 변경하십시오.
그림 8. 다중 도표 노드: 도표 탭 
- 다중 도표 노드를 필터 노드에 첨부하십시오.
- 도표 탭에서 Months를 X 필드로, Lower Estimate 및 Upper Estimate를 Y 필드로 지정하십시오.
그림 9. 다중 도표 노드: 외형 탭 
- 외형 탭을 클릭하십시오.
- 제목으로 고객 수를 입력하십시오.
- 캡션으로 보유된 고객 수 추정을 입력하십시오.
- 실행을 클릭하십시오.
그림 10. 보유된 고객 수를 추정하는 다중 도표 
보유된 고객의 추정 수에 대한 상한 및 하한 경계가 도표로 작성됩니다. 두 선 사이의 차이가 널로 스코어링되어 상태가 매우 불명확한 고객의 수입니다. 시간이 경과함에 따라 이러한 고객의 수가 증가합니다. 데이터 세트에서 12개월 이후에는 원래 고객의 601에서 735 사이가 보유될 것으로 예상됩니다. 개월 이후에는 288에서 597 사이입니다.
그림 11. 파생 노드: 설정 탭 
- 보유되는 고객의 수에 대한 추정값이 어느 정도로 불확실한지 보려면 파생 노드를 필터 노드에 연결하십시오.
- 파생 노드의 설정 탭에서 파생 노드로 알 수 없는 %를 입력하십시오.
- 필드 유형으로 연속형을 선택하십시오.
- (100 * ('상한 추정값' - '하한 추정값')) / '하한 추정값'을 수식으로 입력하십시오. Unknown %는 "의심되는" 고객의 수를 하한 추정값의 퍼센트로 표시한 것입니다.
- 확인을 클릭하십시오.
그림 12. plot 노드: 도표 탭 
- plot 노드를 파생 노드에 연결하십시오.
- plot 노드의 도표 탭에서 Months를 X 필드로, Unknown %를 Y 필드로 선택하십시오.
- 외형 탭을 클릭하십시오.
그림 13. plot 노드: 외형 탭 
- 제목으로 예측 가능한 고객에 대한 %로 표시한 예측 불가능한 고객을 입력하십시오.
- 노드를 실행하십시오.

첫 해 동안 예측 불가능한 고객의 퍼센트가 상당히 선형 비율로 증가하나 두 번째 해에서는 23개월까지 증가 비율이 급증하고 23개월에는 널 값을 가진 고객 수가 보유 고객의 예상 수를 능가합니다.