여러 데이터 소스의 테이블을 하나의 가상 테이블로 결합하여 모든 참여 데이터 소스의 열 및 데이터가 포함된 통합된 정의를 작성할 수 있습니다. 이러한 테이블은 그룹화 테이블로 참조됩니다.
세그먼트화는 수직적(선택된 열의 선택사항을 기반으로 하는 열의 서브세트 또는 수퍼세트)입니다. 기본 테이블을 쿼리하는 것과 동일한 방법으로 결과 가상 테이블에 대한 쿼리를 실행할 수 있습니다.
드라이버를 통해 확인된 테이블의 이름이 동일한 경우(대소문자를 구분하여 정확한 일치) 해당 테이블을 하나의 가상화된 테이블로 그룹화할 수 있습니다. 테이블 그룹화 시맨틱은 일치하는 동일한 이름(대소문자 구분 안함)이 포함된 열을 고려합니다. 데이터 유형 승격은 우선순위 규칙을 준수합니다.
특히 결과 그룹화 테이블의 데이터 유형 처리와 관련하여 테이블의 그룹화가 논리적인지 확인해야 합니다. 해당 열에 다른 데이터 유형이 포함되는 경우도 있습니다. 규칙은 그룹화된 테이블의 결과 데이터 유형을 판별하기 위해 사용됩니다. 자세한 정보는 결과 데이터 유형에 대한 규칙의 내용을 참조하십시오.
예기치 않은 결과가 발생하지 않도록 하려면 테이블을 하나의 가상화된 테이블로 그룹화할 때 주의를 기울여야 합니다. 제한되는 항목은 없지만 그룹화된 테이블을 작성할 때 다음 권장사항을 고려할 수 있습니다.
- 모든 테이블의 이름이 동일한 열에서 데이터 유형이 호환 가능하고 비즈니스 사용이 호환 가능한지 확인하십시오. 모든 테이블의 데이터 도메인은 호환 가능해야 합니다.
- 일관성 있는 데이터 시맨틱을 보장하기 위해 동일한 유형의 데이터 소스로부터 테이블을 그룹화하십시오.
- 다양한 유형의 데이터 소스로부터 테이블을 그룹화하는 경우 데이터 시맨틱의 일관성이 유지되는지 확인하십시오.
- 그룹의 모든 테이블에 있는 대부분의 컬럼에서 동일한 이름을 사용하는지 확인하십시오. 일치하는 열에 호환 가능한 데이터 유형이 포함되어 있는지 확인하십시오.
- 복합 유형에 정의된 열은 포함시키지 마십시오.
참고: 일부 데이터 소스(예: Hive )는 테이블 이름에 소문자를 기본값으로 사용합니다. 테이블 이름에 대한 정확한 일치를 보장하기 위해 구분 ID가 사용되지 않는 한 이 테이블은 기본값으로 대문자가 포함된 다른 데이터 소스의 테이블과 함께 그룹화될 수 없습니다.
주의:데이터 요청( ) 기능은 버전
Cloud Pak for Data 에서
5.3.0 제거되었습니다. 대신
워크플로를 고려하십시오.
이 태스크에 대한 정보
다음 단계에서는 비즈니스 용어 없이 데이터를 가상화하는 방법을 설명합니다. 가상 데이터를 관리하려면, 가상 데이터 관리 항목을 참조하십시오 Data Virtualization.
프로시저
- 탐색 메뉴에서 를 클릭하여 서비스 메뉴를 표시합니다.
- 서비스 메뉴에서 클릭한 후 테이블 탭을 클릭합니다.
연결 목록은 기본 탐색 보기에 표시됩니다. 연결, 스키마 또는 테이블을 클릭하여 선택하고 내용을 미리 보십시오.
연결에 사용 가능한 테이블 목록이 목록 보기에 표시됩니다. 데이터 소스 페이지에서 필터를 추가하여 나열된 테이블을 필터링할 수 있습니다. 또한 테이블을 이름, 스키마, 열 또는 비즈니스 용어로 검색할 수 있습니다.
Data Virtualization 단일 가상 테이블로 결합될 수 있는 일치하는 테이블을 자동으로 제안할 수 있습니다.
- 테이블을 단일 가상 객체로 결합하려면 설정을
클릭하고 설정 메뉴에서 동일한 이름의 테이블 그룹화를 선택하세요.
디스플레이에 제안된 테이블 그룹이 표시되고 검토 단계에서 참여하는 소스 테이블을 세부 조정할 수 있습니다.
사용 가능한 테이블의 목록에는 읽기 권한이 부여되지 않은 테이블(읽을 수 없는 테이블)이 포함되어 있습니다.
- 읽을 수 없는 테이블이 포함된 가상 테이블을 작성하는 경우 다음 옵션 중 하나를 선택하여 가상 테이블을 쿼리 가능하게 하십시오.
- 옵션 1 테이블 조치 메뉴에서 그룹화된 테이블 편집을 클릭하고 가상화하는 그룹에서 읽을 수 없는 테이블을 제거하십시오.
- 옵션 2 데이터 소스 연결에 지정된 사용자가 읽을 수 없는 테이블에 액세스할 수 있는지 확인하십시오. 이 단계는 테이블이 가상화되기 전 또는 후에 수행될 수 있습니다.
- 옵션 3 : 테이블에 대한 읽기 권한이 있는 별도의 사용자 자격 Data Virtualization 증명을 사용하여 동일한 데이터 소스에 액세스하기 위해 데이터 소스 연결을 생성합니다. 따라서 이름이 동일한 테이블 그룹화 옵션을 선택하는 경우 추가 테이블 인스턴스 목록이 표시됩니다. 테이블을 가상화하기 전에 제한된 사용자의 연결에서 발견된 읽을 수 없는 테이블을 수동으로 제거해야 합니다(옵션 1에서 설명함).
- 가상화하려는 테이블을 선택하고 장바구니에 추가를 클릭하세요.
- 장바구니 보기를 클릭하여 선택한 상품을 확인하세요. 이 창에서 테이블 및 스키마 이름을 편집하거나 장바구니에서 선택 항목을 제거할 수도 있습니다.
- 가상화된 테이블에 대해 적절한 공유 옵션을 선택하십시오.
- 선택한 카 탈로그에도 게시하려면 '카탈로그에 게시'를 선택하십시오.
사용 가능한 카탈로그의 목록이 드롭 다운 메뉴에 표시됩니다. 각 카탈로그는
통제되지 않음 또는
통제되지 않음으로 태그됩니다.
참고: 최소한 하나의 카탈로그가 있어야
IBM® Knowledge
Catalog합니다.
카탈로그에 공개할 수 있는 권한이 있어야 합니다. 관리자는 모든 가상 오브젝트가 선택된 통제 카탈로그에 공개되는지 여부를 사용으로 설정하여 사용자가 지정된 카탈로그에 공개하지 못하도록 할 수 있습니다.
- 스키마 필드에 스키마를 지정하십시오.
다음 단계를 수행하여 스키마를 작성할 수도 있습니다.
- 엔지니어 또는 Data Virtualization 사용자 역할이 있는 경우 스키마 필드를 기본값으로 유지하여 사용자 ID로 스키마를 생성하십시오.
- 관리자 Data Virtualization 역할이 있는 경우 스키마 필드를 기본값으로 두어 사용자 ID로 스키마를 생성하거나, 스키마 필드에 새 스키마 이름을 입력하십시오.
- 가상화를 클릭하여 프로세스를 완료하십시오.
상태 창이 표시되면 가상화된 데이터를 보거나 추가 데이터를 가상화하도록 선택할 수 있습니다. 그러나 페이지에서 이동하기 전에 가상화가 완료될 때까지 기다려야 합니다.
- 가상화된 데이터 보기를 클릭하여 새로 생성한 테이블을 확인하세요.
결과
와 가 동일한 OpenShift®IBM Knowledge
Catalog 프로젝트( Data Virtualization 네임스페이스)에 설치된 경우, 가상 객체는 기본 카탈로그에 게시됩니다.