시작하기 전에
데이터 웨어하우징 및 데이터 모델링은 컴퓨터 과학과 IT가 결합된 잘 알려져 있는 중요한 분야이다. 이 기술은 1990년대 초기 당시에 개발된 여러 가지 접근 방법을 사용하여 발전했다. 가장 중요한 방법으로는 Ralph Kimball이 정의한 하향식 방법과 W. H. Inmon이 정의한 상향식 방법이 있다(참고자료 참조).
상업용 데이터 모델링 제품은 실질적인 경험과 비즈니스 전문성을 바탕으로 하는 컨텐츠 관련 지식이 담겨 있기 때문에 그 가치가 매우 높다. IBM에서는 이 분야를 위해 IBM Industry Models라는 지적 자산 제품군을 제공한다. IBM Industry Models 제품은 충분한 검증을 거치고 성숙 단계에 도달한 데이터 모델링(관계형 및 다차원형) 패턴 프레임워크로 구성되어 있으며, 산업별로 패키징되어 있다. 이 기사에서는 IBM Industry Models 제품의 일부로서 보험 산업을 위해 정의된 IIW(Insurance Information Warehouse)에 대한 개요를 제공한다.
이 튜토리얼에서는 IBM Industry Model IIW를 사용하여 DWH(Data WareHouse)의 데이터 모델을 개발하는 방법에 대해 소개하면서 CDW(Core Data Warehouse) 모델(원자적 데이터 요소를 가지고 있는 고도로 정규화된 데이터 모델)과 DM(Data Mart) 모델(다차원 데이터 모델의 구조를 구현하는 역정규화된 데이터 모델)의 개발을 위한 접근 방법을 설명한다. 다차원 데이터 모델의 특성은 팩트 테이블에 저장되어 있는 척도의 정의와 분석의 축 또는 차원을 정의하는 차원 테이블의 정의를 사용한다는 것이다.
이 튜토리얼에서 설명하는 방법은 데이터 모델 개발을 위한 IIW 로드맵이다. IIW 로드맵은 하향식 접근 방법을 바탕으로 하며 우선적으로, 비즈니스 요구사항을 파악하고 비즈니스 모델을 정의한다. (IIW는 분석 데이터 모델로도 알려져 있다.) 비즈니스 요구사항 정의는 이후의 모든 작업을 위한 전제조건이다. 이 작업은 데이터 모델러와 비즈니스 부서의 전문가가 공동으로 수행하는 것이 이상적이다. 비즈니스 부서에서 모델을 작성하고 승인하면 논리적 모델을 작성하는 단계가 시작된다.
논리적 모델의 설계는 DWH 논리적 모델(CDW)을 설계한 후 DM 논리적 모델을 설계하는 두 단계로 진행된다. 이러한 두 작업은 순차적으로 수행해야 한다. 이전 단계를 완료하기 전에 이후 단계를 시작하게 되면 원하지 않는 결과가 발생할 수 있다. 따라서 IIW 로드맵의 구조와 이 튜토리얼은 다음과 같은 네 가지 단계로 분류되어 있다.
이러한 네 가지 단계는 각기 다른 목표를 달성하고 각기 다른 결과물을 제공한다.
- 단계 1: IIW 비즈니스 요구사항 파악하기
- BI 프로젝트에서 해결해야 하는 비즈니스 요구사항을 완벽하게 설명한다. 결과물은 개념적 모델과 분석적 요구사항 모델이다.
- 개념적 모델
- 조직 내에서 사용할 모든 개념 및 비즈니스 용어 모델이다.
- 분석적 요구사항 모델
- 특정 산업 문제를 설명하는 사전 정의된 비즈니스 요구사항 모델이다. 모델은 척도와 차원으로 표현된다.
- 단계 2: 분석 데이터 모델 정의하기
- 이상적인 비즈니스 개념과 각 개념의 상호 관계를 나타내는 개념적 모델이다. 이 모델은
플랫폼 독립적이며 물리적으로 구현하지 않아도 된다. 결과물은 분석 데이터 모델이다.
- 분석 데이터 모델
- 개념적 모델에 정의된 개념을 나타내는 데 필요한 정규화된 데이터 구조를 지정하는 데이터 모델이다.
- DWH 및 DM 설계 단계
- ER(Entity-Relationship) 논리적 모델(DWH)과 MD(Multi-Dimensional) 논리적 모델에서 맵핑된 비즈니스
개념이다. 이러한 모델은 데이터베이스에 있는 데이터의 실제 구조를 위한 기초 모델이다. 결과물은 DW 설계
데이터 모델과 DM 설계 데이터 모델이다.
- DW 설계 데이터 모델
- 정보 처리에 사용되는 원자적 및 분석 데이터의 전사적 저장소를 나타내는 데이터 모델이다.
- DM 설계 데이터 모델
- 분석적 요구사항을 구현하고 특정 차원 분석을 적용할 수 있도록 구조화된 차원 모델이다.
Figure 1에서는 이러한 결과물을 요약해서 보여 준다.
Figure 1. 그림 1. 네 가지 IIW 단계의 결과물
IIW에서는 세 가지 모델 계층도 정의한다.
- 기본 계층에는 개념적 및 분석적 요구사항 모델이 있다.
- 분석 계층에서는 분석 데이터 모델을 처리한다.
- 설계 계층에는 DW 설계 및 DM 설계 모델이 있다.
Figure 2의 다이어그램에서 이러한 계층을 보여 준다.
Figure 2. 그림 2. IIW 모델 계층
튜토리얼의 이후 섹션에서는 IDA(InfoSphere™ Data Architect)를 사용하여 각 단계의 예제와 함께 네 가지 단계를 설명한다. 예제에서는 IBM IIW Model 버전 8.2를 사용한다. IIW 모델 내용은 EME(Enterprise Model Extender) 도구를 통해 IDA로 가져온다. EME는 IBM InfoSphere Data Architect 제품에 대한 플러그인 확장 세트이다. 튜토리얼을 진행하려면 이러한 제품이 설치되어 있어야 한다.


