그래프에서 노드 생성

IBM® SPSS® Modeler 그래프가 제공하는 가장 강력한 기능 중 하나는 그래프 또는 그래프 내 선택사항으로부터 노드를 생성하는 기능입니다. 예를 들어, 시간 도표 그래프에서 데이터의 영역 또는 선택사항을 기반으로 파생 및 선택 노드를 생성하여 사실상 데이터의 "서브세트를 작성"할 수 있습니다. 예를 들어, 이 강력한 기능을 사용하여 이상치를 식별하여 제외할 수 있습니다.

밴드를 그릴 수 있을 때마다 파생 노드도 생성할 수 있습니다. 두 개의 척도 축을 가진 그래프에서는 그래프에서 그려진 영역에서 파생 또는 선택 노드를 생성할 수 있습니다. 표시된 요소를 가진 그래프에서는 파생 노드 및 선택 노드를 생성할 수 있으며 일부 경우에는 이 요소에서 필터 노드를 생성할 수 있습니다. 균형 노드 생성은 개수 분포를 표시하는 그래프에 대해 사용으로 설정됩니다.

그림 1. 생성 메뉴가 표시되는 그래프
생성 메뉴가 표시되는 그래프

노드를 생성할 때마다 노드를 기존 스트림에 연결할 수 있도록 노드가 스트림 캔버스에 직접 배치됩니다. 그래프에서 선택, 파생, 균형, 필터 및 재분류 노드를 생성할 수 있습니다.

선택 노드

선택 노드는 영역 내 레코드 포함 및 영역 외부의 모든 레코드 제외(다운스트림 처리의 경우 그 반대)에 대해 검증하기 위해 선택 노드를 생성할 수 있습니다.

  • 밴드의 경우. 해당 밴드 내 레코드를 포함하거나 제외하는 선택 노드를 생성할 수 있습니다. 선택 노드에서 사용할 밴드를 선택해야 하므로 밴드에 대한 선택 노드만은 컨텍스트 메뉴를 통해서만 사용 가능합니다.
  • 영역의 경우. 영역 내 레코드를 포함하거나 제외하는 선택 노드를 생성할 수 있습니다.
  • 표시된 요소의 경우. 표시된 요소 또는 웹 그래프 링크에 해당하는 레코드를 캡처하는 선택 노드를 생성할 수 있습니다.

파생 노드

파생 노드는 영역, 밴드 및 표시된 요소에서 생성될 수 있습니다. 모든 그래프는 파생 노드를 생성할 수 있습니다. 평가 차트의 경우에는 모델 선택을 위한 대화 상자가 표시됩니다. 웹 그래프의 경우에는 파생 노드(“And”)파생 노드(“Or”)를 사용할 수 있습니다.

  • 밴드의 경우. 밴드 편집 대화 상자에 나열되는 밴드 이름을 범주 이름으로 사용하여 축에 표시된 각각의 간격에 대해 하나의 범주를 생성하는 파생 노드를 생성할 수 있습니다.
  • 영역의 경우. 플래그가 영역 내 레코드에 대해 T로 설정되고 모든 영역 외부의 레코드에 대해 F로 설정되는 in_region이라는 플래그 필드를 작성하는 파생 노드(플래그로 파생)를 생성할 수 있습니다. 레코드가 속하는 영역의 이름을 값으로 사용하는 각 레코드에 대해 region이라는 새 필드를 가진 각각의 영역에 대한 값을 가진 세트를 생성하는 파생 노드(세트로 파생)도 생성할 수 있습니다. 모든 영역 외부의 레코드는 기본 영역의 이름을 수신합니다. 값 이름은 영역 편집 대화 상자에 나열되는 영역 이름이 됩니다.
  • 표시된 요소의 경우. 모든 표시된 요소에 대해 이고 모든 기타 레코드에 대해 거짓인 플래그를 계산하는 파생 노드를 생성할 수 있습니다.

균형 노드

균형 노드는 데이터에서 불균형을 정정하기 위해 생성될 수 있습니다(예: 공통 값의 빈도 감소(균형 노드(감소) 메뉴 옵션 사용) 또는 빈도가 낮은 값의 발생 부스팅(균형 노드(부스트) 메뉴 옵션 사용)). 균형 노드 생성은 개수의 분포를 표시하는 그래프에 대해 사용으로 설정됩니다(예: 히스토그램, 점, 콜렉션, 개수의 막대형, 개수의 원형, 다중 도표).

필터 노드

필터 노드는 그래프에서 표시된 노드 또는 선을 기반으로 필드의 이름을 바꾸고 필드를 필터링하기 위해 생성될 수 있습니다. 평가 차트의 경우 최적 맞춤 선이 필터 노드를 생성하지 않습니다.

재분류 노드

재분류 노드는 값의 코딩을 변경하기 위해 생성될 수 있습니다. 이 옵션은 분포 그래프에 사용됩니다. 그룹에 포함되는지 여부에 따라 표시된 필드의 특정 값의 코딩을 변경하기 위해 그룹에 대해 재분류 노드를 생성할 수 있습니다(테이블 탭에서 Ctrl+클릭을 사용하여 그룹 선택). 수많은 값의 기존 세트로 데이터의 코딩을 변경하기 위해 에 대해 재분류 노드를 생성할 수도 있습니다(예: 분석을 위해 다양한 회사의 재무 데이터를 병합하기 위해 데이터를 표준 값 세트로 재분류).

참고: 값이 사전 정의되어 있는 경우에는 해당 값을 플랫 파일로서 IBM SPSS Modeler로 읽어오고 분포를 사용하여 모든 값을 표시할 수 있습니다. 그런 다음 차트에서 직접 이 필드에 대한 재분류(값) 노드를 생성하십시오. 그러면 재분류 노드의 새 값 열(드롭 다운 목록)에 모든 목표 값이 배치됩니다.
재분류 노드에 대한 옵션을 설정할 때 테이블을 사용하면 이전 세트 값으로부터 사용자가 지정하는 새 값에 대한 명확한 맵핑을 사용할 수 있습니다.
  • 원래 값. 이 열에는 선택 필드의 기존 값이 나열됩니다.
  • 새로운 값. 이 열을 사용하여 새 범주 값을 입력하거나 드롭 다운 목록에서 값을 선택하십시오. 분포 차트의 값을 사용하여 재분류 노드를 자동으로 생성하는 경우 이 값은 드롭 다운 목록에 포함되어 있습니다. 이를 통해 기존 값을 알려진 값 세트에 신속하게 맵핑할 수 있습니다. 예를 들어, 의료 기관에서 네트워크 또는 로케일을 기반으로 진단을 다르게 그룹화하는 경우가 있습니다. 합병 또는 인수 이후 모든 당사자는 일관된 방식으로 새 데이터 또는 기존 데이터를 재분류해야 합니다. 긴 목록으로부터 각각의 목표 값을 수동으로 입력하는 대신 값의 마스터 목록을 IBM SPSS Modeler로 읽어오고 진단 필드에 대한 분포 차트를 실행하고 이 차트에서 직접 이 필드에 대한 재분류(값) 노드를 생성할 수 있습니다. 이 프로세스를 수행하면 모든 목표 진단 값을 새 값 드롭 다운 목록에서 사용할 수 있습니다.

재분류 노드에 대한 자세한 정보는 재분류 노드에 대한 옵션 설정의 내용을 참조하십시오.

그래프에서 노드 생성

그래프 출력 창의 생성 메뉴를 사용하여 노드를 생성할 수 있습니다. 생성된 노드는 스트림 캔버스에 배치됩니다. 해당 노드를 사용하려면 해당 노드를 기존 스트림에 연결하십시오.

그래프에서 노드를 생성하려면 다음을 수행하십시오.

  1. 탐색 모드에 있는지 확인하십시오. 메뉴에서 보기 > 탐색 모드를 선택하십시오.
  2. 탐색 모드 도구 모음에서 영역 단추를 클릭하십시오.
  3. 노드를 생성하기 위해 필요한 밴드, 영역 또는 표시된 요소를 정의하십시오.
  4. 생성 메뉴에서 생성할 노드의 유형을 선택하십시오. 가능한 유형만 사용으로 설정됩니다.

참고: 마우스 오른쪽 단추를 클릭한 후 컨텍스트 메뉴에서 원하는 생성 옵션을 선택하여 그래프에서 직접 노드를 생성할 수도 있습니다.