소개
기업과 조직에서는 매일 방대한 양의 데이터를 취급한다. 이런 데이터를 바탕으로 비즈니스 의사결정 및 규정 관련 보고와 같은 수많은 일상적인 활동이 이루어진다. 데이터를 효과적으로 사용하기 위해서는 IT 시스템을 통해 메타데이터에 대한 가시성을 얻을 수 있어야 한다. 이런 가시성은 곧 데이터 신뢰성에 대한 신뢰 강화, 민첩성 증대 및 엔터프라이즈 전체적인 공통적 이해의 개선으로 이어진다.
데이터의 이해에 관해 비즈니스 및 기술 사용자들이 직면하는 몇 가지 공통된 문제는 다음과 같다.
- 신뢰할 수 있는 정보의 부족
- 데이터의 출처가 어디인가?
- 데이터를 얼마나 신뢰할 수 있는가?
- 민첩성의 부족
- 데이터가 최근에 수정되었는가?
- 데이터를 변경하면 다른 시스템이 영향을 받을 것인가?
- 공통된 시맨틱의 부족
- "고객"과 "클라이언트"가 개념적으로 같은 의미인가?
- 엔터프라이즈 조직에 속한 다른 이들이 내가 의미하는 바를 이해하도록 하려면 특정 엔티티를 뭐라고 불러야 하는가?
다양한 소스로부터 얻은 비즈니스 및 기술 메타데이터를 통합하는 엔터프라이즈 아키텍처를 통해 이런 문제들을 해결할 수 있다. 상위 레벨에서, 메타데이터는 정의, 구조, 소스 등과 같이 데이터에 대한 정보를 나타낸다. 메타데이터에 대한 자세한 설명은 참고자료 섹션으로 링크되는 "유형이 다른 메타데이터 통합" developerWorks 기사를 참조한다.
일반적인 데이터 통합 아키텍처에는 데이터 웨어하우스, 마트 및 큐브로 추출, 변환 및 로드(ETL) 중인 다양한 소스 시스템의 데이터가 포함된다. 비즈니스 사용자의 요구를 충족시키기 위해, 보고 도구로 데이터 통합을 더욱 심화시키고 이를 대시보드 뷰로 시각적으로 표현한다. 반면, 기술 사용자는 통합에 있어 IT 관련 작업을 담당한다. 이 글에서 다루고 있는 문제에 대한 해결책인 메타데이터 통합에서는 이런 아키텍처를 바탕으로 다음과 같은 기술 및 비즈니스 데이터의 통합을 다룬다.
- 데이터 웨어하우스, 마트 및 큐브를 채우기 위해 사용된 소스 시스템에 대한 데이터
- 변환을 수행하기 위해 사용된 ETL 작업에 대한 데이터
- 특정 보고서를 채우기 위해 사용된 데이터 마트 테이블에 대한 데이터
- 보고서에 나오는 특정 용어의 의미에 대한 데이터(비즈니스 메타데이터)
이러한 통합을 달성하기 위한 관건은 모든 메타데이터 요구 사항에 대한 단일 정보 소스의 역할을 하는 엔터프라이즈 레벨 메타데이터 저장소를 구축하는 것이다. 이런 저장소가 있으면 다른 애플리케이션과 사용자가 이 저장소로 링크하여 이전 섹션에서 제시한 문제에 답할 수 있는 계보 및 추적 솔루션을 구축할 수 있다.
그림 1은 엔터프라이즈 메타데이터 통합 솔루션의 아웃라인을 나타낸 것이다. 점선 위의 레이블은 다양한 유형의 메타데이터(보고서 이름 및 패키지, 데이터베이스 테이블, ETL 작업 및 데이터 소스 이름)를 가리킨다.
그림 1. 엔터프라이즈 메타데이터 통합 솔루션
주: 위 그림은 통합 아키텍처의 기술 Perspective를 나타낸 것이다. 따라서 이 그림이 메타데이터 저장소로 채워지는 비즈니스 메타데이터를 나타내는 것은 아니다.
이 튜토리얼에서 설명하는 솔루션은 IBM InfoSphere Information Server V8.1, Cognos 8 Business Intelligence (BI) V8.4 및 Import Export Manager V8.1, 수정팩 1을 기반으로 한다.
IBM InfoSphere Information Server는 조직이 여러 시스템으로부터 얻은 간단하거나 복잡한 데이터에서 비즈니스에 유용한 정보와 가치를 유도하는 데 도움이 되는 데이터 통합 소프트웨어 플랫폼이다. 이 플랫폼은 유용하고 의미 있는 정보를 제공하기 위해 데이터를 프로파일, 정리, 변환 및 통합하는 다양한 컴포넌트로 구성된다. 이 튜토리얼에서 메타데이터 통합을 보여주기 위해 사용하는 InfoSphere Information Server V8.1의 컴포넌트는 다음과 같다.
- 메타데이터 저장소
- InfoSphere Metadata Workbench(이후로 이 튜토리얼에서는 이를 간단히 Workbench로 칭함)
- Import Export Manager
- InfoSphere Business Glossary
- InfoSphere DataStage
InfoSphere 메타데이터 저장소는 DataStage 및 Business Glossary와 같이 다른 다양한 컴포넌트에서 사용 가능한 모든 메타데이터를 위한 중앙 데이터 저장소의 역할을 한다. Workbench는 다양한 소스에서 얻은 데이터 간에 자동 링크를 설정할 때 핵심적인 역할을 하고 유용한 계보 보고서 및 영향 분석 세부 사항을 제공한다. Import Export Manager 컴포넌트는 메타데이터 저장소와의 사이에서 메타데이터를 가져오고 내보내는 데 도움이 되는 브릿지(MetaBroker도 브릿지임)로 구성된다. 이 컴포넌트는 데이터 파일, 데이터베이스 테이블, 데이터 모델, 비즈니스 용어집, Cognos 보고서 등의 다양한 데이터 소스를 지원한다.
그림 2는 Cognos BI 및 InfoSphere 통합에 대한 비즈니스 사용자 Perspective와 기술 사용자 Perspective 간의 관계를 나타낸 것이다.
그림 2. Cognos BI 및 InfoSphere 통합
통합의 의미는 비즈니스 사용자가 비즈니스 보고서에서 웹 링크를 사용하여 비즈니스 용어집과 계보 보고서를 탐색할 수 있다는 것이다.
기술 사용자에게 통합이 의미하는 바는 다음과 같다.
- Cognos BI의 보고서 메타데이터, DataStage의 ETL 작업 메타데이터 및 데이터베이스의 웨어하우스 메타데이터를 서로에게 맵핑하여 계보 보고서를 통해 추적 기능을 사용해야 한다.
- 용어집 통합을 위해 메타데이터 저장소에 용어집 데이터를 채워야 한다.
- Cognos BI 보고서와 InfoSphere 도구(Glossary 및 Workbench) 간의 연계가 작동하려면 올바른 URI로 Cognos BI를 구성해야 한다.
이 튜토리얼에서는 다음 절차에 따라 데이터 맵핑 및 구성 프로세스를 구현할 수 있는 방법을 설명한다.
- Import Export Manager를 사용하여 데이터 파일, 데이터 테이블, 비즈니스 용어, 보고서 및 모델에 대한 메타데이터를 Workbench로 가져온다.
- 메타데이터 사이에 수동 및 자동 링크를 설정한다.
- InfoSphere 통합을 위한 Cognos BI를 구성한다.
메타데이터를 통합하기 위한 첫 번째 단계는 메타데이터를 저장소로 끌어오는 것이다. MetaBroker와 브릿지는 다양한 도구에서 메타데이터 저장소로 메타데이터를 가져오는 데 중요한 역할을 한다. 이런 도구를 사용하여 저장소에서 InfoSphere Information Server로 메타데이터를 내보낼 수도 있다.
데이터베이스 테이블, 보고서, 모델, 사용자 정보 등에 대한 메타데이터를 가져오고 내보낼 때 사용 가능한 다양한 유형의 브릿지가 있다. 이 튜토리얼에서는 이런 브릿지를 사용하여 메타데이터를 Workbench로 가져오는 방법을 보여준다.
