인스턴스화란?
인스턴스화는 데이터 필드의 저장 유형 및 값과 같은 정보를 읽거나 지정하는 프로세스입니다. 인스턴스화는 시스템 자원을 최적화하기 위한 사용자 지시 프로세스입니다. 소스 노드의 유형 탭에서 옵션을 지정하거나 유형 노드를 통해 데이터를 실행하여 소프트웨어에 값을 읽도록 지시하십시오.
- 유형을 알 수 없는 데이터도 인스턴스화되지 않음으로 참조됩니다. 해당 저장 유형 및 값을 알 수 없는 데이터는 유형 탭의 측정 열에 <기본값>으로 표시됩니다.
- 필드의 저장 공간(예: 문자열 또는 숫자)에 대한 일부 정보가 있는 경우 해당 데이터는 부분적으로 인스턴스화됨이라고 합니다. 범주형 또는 연속형은 부분적으로 인스턴스화된 측정 수준입니다. 예를 들어, 범주형은 필드가 기호 필드임을 지정하지만 명목, 순서 및 플래그 필드 중 어느 것인지 알 수 없습니다.
- 값을 포함하여 유형에 대한 모든 세부사항을 알고 있는 경우, 완전히 인스턴스화됨 측정 수준(명목, 순서, 플래그 또는 연속형)이 이 열에 표시됩니다. 연속형 유형은 부분적으로 인스턴스화된 데이터 필드 및 완전히 인스턴스화된 데이터 필드 모두에 사용됩니다. 연속형 데이터는 정수 또는 실수일 수 있습니다.
유형 노드가 있는 데이터 스트림의 실행 동안, 인스턴스화되지 않은 유형은 초기 데이터 값을 기반으로 즉시 부분적으로 인스턴스화됩니다. 모든 데이터가 노드를 통과하면, 값을 <Pass>로 설정하지 않은 한, 모든 데이터가 완전히 인스턴스화됩니다. 실행이 중단되면 데이터는 부분적으로 인스턴스화된 상태로 유지됩니다. 유형 탭이 인스턴스화되면 필드의 값은 스트림의 해당 위치에서 정적입니다. 이는 스트림을 다시 실행해도 업스트림 변경사항은 특정 필드의 값에 영향을 주지 않음을 의미합니다. 새 데이터 또는 추가된 조작을 기반으로 값을 변경하거나 업데이트하려면 유형 탭 자체에서 값을 편집하거나 필드의 값을 <Read> 또는 <Read +>로 설정해야 합니다.
인스턴스화 시기
일반적으로, 데이터 세트가 매우 크지 않고 나중에 스트림에 필드를 추가할 계획이 아닌 경우에는 소스 노드에서 인스턴스화하는 것이 가장 편리한 방법입니다. 그러나 다음 경우에는 별도의 유형 노드에서 인스턴스화하는 것이 유용합니다.
- 데이터 세트가 크고 스트림이 해당 유형 노드 이전에 서브세트를 필터링합니다.
- 스트림에서 데이터가 필터링되었습니다.
- 스트림에서 데이터가 병합되었거나 추가되었습니다.
- 처리 중에 새 데이터 필드가 파생됩니다.
참고: 데이터베이스 내보내기 노드에서 데이터를
내보내는 경우 데이터를 완전히 인스턴스화해야 합니다.