그래프에서 노드 생성
IBM® SPSS® Modeler 그래프가 제공하는 가장 강력한 기능 중 하나는 그래프 또는 그래프 내 선택사항으로부터 노드를 생성하는 기능입니다. 예를 들어, 시간 도표 그래프에서 데이터의 영역 또는 선택사항을 기반으로 파생 및 선택 노드를 생성하여 사실상 데이터의 "서브세트를 작성"할 수 있습니다. 예를 들어, 이 강력한 기능을 사용하여 이상치를 식별하여 제외할 수 있습니다.
밴드를 그릴 수 있을 때마다 파생 노드도 생성할 수 있습니다. 두 개의 척도 축을 가진 그래프에서는 그래프에서 그려진 영역에서 파생 또는 선택 노드를 생성할 수 있습니다. 표시된 요소를 가진 그래프에서는 파생 노드 및 선택 노드를 생성할 수 있으며 일부 경우에는 이 요소에서 필터 노드를 생성할 수 있습니다. 균형 노드 생성은 개수 분포를 표시하는 그래프에 대해 사용으로 설정됩니다.

노드를 생성할 때마다 노드를 기존 스트림에 연결할 수 있도록 노드가 스트림 캔버스에 직접 배치됩니다. 그래프에서 선택, 파생, 균형, 필터 및 재분류 노드를 생성할 수 있습니다.
선택 노드
선택 노드는 영역 내 레코드 포함 및 영역 외부의 모든 레코드 제외(다운스트림 처리의 경우 그 반대)에 대해 검증하기 위해 선택 노드를 생성할 수 있습니다.
- 밴드의 경우. 해당 밴드 내 레코드를 포함하거나 제외하는 선택 노드를 생성할 수 있습니다. 선택 노드에서 사용할 밴드를 선택해야 하므로 밴드에 대한 선택 노드만은 컨텍스트 메뉴를 통해서만 사용 가능합니다.
- 영역의 경우. 영역 내 레코드를 포함하거나 제외하는 선택 노드를 생성할 수 있습니다.
- 표시된 요소의 경우. 표시된 요소 또는 웹 그래프 링크에 해당하는 레코드를 캡처하는 선택 노드를 생성할 수 있습니다.
파생 노드
파생 노드는 영역, 밴드 및 표시된 요소에서 생성될 수 있습니다. 모든 그래프는 파생 노드를 생성할 수 있습니다. 평가 차트의 경우에는 모델 선택을 위한 대화 상자가 표시됩니다. 웹 그래프의 경우에는 파생 노드(“And”) 및 파생 노드(“Or”)를 사용할 수 있습니다.
- 밴드의 경우. 밴드 편집 대화 상자에 나열되는 밴드 이름을 범주 이름으로 사용하여 축에 표시된 각각의 간격에 대해 하나의 범주를 생성하는 파생 노드를 생성할 수 있습니다.
- 영역의 경우. 플래그가 영역 내 레코드에 대해 T로 설정되고 모든 영역 외부의 레코드에 대해 F로 설정되는 in_region이라는 플래그 필드를 작성하는 파생 노드(플래그로 파생)를 생성할 수 있습니다. 레코드가 속하는 영역의 이름을 값으로 사용하는 각 레코드에 대해 region이라는 새 필드를 가진 각각의 영역에 대한 값을 가진 세트를 생성하는 파생 노드(세트로 파생)도 생성할 수 있습니다. 모든 영역 외부의 레코드는 기본 영역의 이름을 수신합니다. 값 이름은 영역 편집 대화 상자에 나열되는 영역 이름이 됩니다.
- 표시된 요소의 경우. 모든 표시된 요소에 대해 참이고 모든 기타 레코드에 대해 거짓인 플래그를 계산하는 파생 노드를 생성할 수 있습니다.
균형 노드
균형 노드는 데이터에서 불균형을 정정하기 위해 생성될 수 있습니다(예: 공통 값의 빈도 감소(균형 노드(감소) 메뉴 옵션 사용) 또는 빈도가 낮은 값의 발생 부스팅(균형 노드(부스트) 메뉴 옵션 사용)). 균형 노드 생성은 개수의 분포를 표시하는 그래프에 대해 사용으로 설정됩니다(예: 히스토그램, 점, 콜렉션, 개수의 막대형, 개수의 원형, 다중 도표).
필터 노드
필터 노드는 그래프에서 표시된 노드 또는 선을 기반으로 필드의 이름을 바꾸고 필드를 필터링하기 위해 생성될 수 있습니다. 평가 차트의 경우 최적 맞춤 선이 필터 노드를 생성하지 않습니다.
재분류 노드
재분류 노드는 값의 코딩을 변경하기 위해 생성될 수 있습니다. 이 옵션은 분포 그래프에 사용됩니다. 그룹에 포함되는지 여부에 따라 표시된 필드의 특정 값의 코딩을 변경하기 위해 그룹에 대해 재분류 노드를 생성할 수 있습니다(테이블 탭에서 Ctrl+클릭을 사용하여 그룹 선택). 수많은 값의 기존 세트로 데이터의 코딩을 변경하기 위해 값에 대해 재분류 노드를 생성할 수도 있습니다(예: 분석을 위해 다양한 회사의 재무 데이터를 병합하기 위해 데이터를 표준 값 세트로 재분류).
- 원래 값. 이 열에는 선택 필드의 기존 값이 나열됩니다.
- 새로운 값. 이 열을 사용하여 새 범주 값을 입력하거나 드롭 다운 목록에서 값을 선택하십시오. 분포 차트의 값을 사용하여 재분류 노드를 자동으로 생성하는 경우 이 값은 드롭 다운 목록에 포함되어 있습니다. 이를 통해 기존 값을 알려진 값 세트에 신속하게 맵핑할 수 있습니다. 예를 들어, 의료 기관에서 네트워크 또는 로케일을 기반으로 진단을 다르게 그룹화하는 경우가 있습니다. 합병 또는 인수 이후 모든 당사자는 일관된 방식으로 새 데이터 또는 기존 데이터를 재분류해야 합니다. 긴 목록으로부터 각각의 목표 값을 수동으로 입력하는 대신 값의 마스터 목록을 IBM SPSS Modeler로 읽어오고 진단 필드에 대한 분포 차트를 실행하고 이 차트에서 직접 이 필드에 대한 재분류(값) 노드를 생성할 수 있습니다. 이 프로세스를 수행하면 모든 목표 진단 값을 새 값 드롭 다운 목록에서 사용할 수 있습니다.
재분류 노드에 대한 자세한 정보는 재분류 노드에 대한 옵션 설정의 내용을 참조하십시오.
그래프에서 노드 생성
그래프 출력 창의 생성 메뉴를 사용하여 노드를 생성할 수 있습니다. 생성된 노드는 스트림 캔버스에 배치됩니다. 해당 노드를 사용하려면 해당 노드를 기존 스트림에 연결하십시오.
그래프에서 노드를 생성하려면 다음을 수행하십시오.
- 탐색 모드에 있는지 확인하십시오. 메뉴에서 보기 > 탐색 모드를 선택하십시오.
- 탐색 모드 도구 모음에서 영역 단추를 클릭하십시오.
- 노드를 생성하기 위해 필요한 밴드, 영역 또는 표시된 요소를 정의하십시오.
- 생성 메뉴에서 생성할 노드의 유형을 선택하십시오. 가능한 유형만 사용으로 설정됩니다.
참고: 마우스 오른쪽 단추를 클릭한 후 컨텍스트 메뉴에서 원하는 생성 옵션을 선택하여 그래프에서 직접 노드를 생성할 수도 있습니다.