 |
|
난이도 : 초급 Jeff J. Li, 소프트웨어 고문 엔지니어,
Department13
2008 년 4 월 29 일 SAP® NetWeaver® Business Intelligence(이하 SAP BI)는 SAP NetWeaver 2004 애플리케이션 서버의 한 구성부분입니다. 데이터를 로드해 SAP BI에서 데이터를 추출, 변환, 로드(ETL) 디자인을 하는 것은 시간이 많이 걸리는 작업입니다. 이 글은 IBM® Information Server를 사용해 SAP BI에 데이터를 로드하는 방법을 차근차근 설명합니다. 또한 IBM Information Server를 활용해 SAP BI에서 데이터를 추출하는 방법을 자세히 소개합니다.
소개
SAP BI는 비즈니스 데이터를 통합, 분석하는 SAP 고객을 위해 기업 데이터 웨어하우스를 제공한다. 기업은 SAP BI를 사용하여 비즈니스를 읽고 시장 변화에 반응하며 경쟁력을 얻을 수 있다. SAP NetWeaver 2004에서 SAP BI는 SAP Business Information Warehouse(SAP BW)로 불렸다.
SAP BI 데이터 웨어하우스를 만드는 것은 복잡한 프로젝트다. 여기에는 계획, 데이터 모델링, 데이터 분립, ETL 업무 디자인, 성능 튜닝과 같은 다양한 활동이 포함된다. 데이터를 로드하여 SAP BI에서 데이터를 추출하는 ETL 업무를 디자인하는 것은 가장 시간이 많이 걸리는 작업이다.
IBM Information Server는 종합적인 정보 통합 플랫폼이다. 비즈니스에서 IBM Information Server를 사용해 다양한 데이터 소스에 연결하고, 데이터 컨텐츠를 찾아오거나 처리하고, 정제된 좋은 정보를 전달할 수 있다. SAP BI 프로젝트에서 IBM Information Server를 효율적인 ETL 도구로 활용하여 거대한 양의 데이터를 처리하고 기업 데이터 웨어하우스를 만들 수 있다.
부록 A는 이 글에서 사용한 용어를 설명하고, 부록 B는 이 글에서 보여준 예제를 만드는 도구 목록이다.
제품 필요 조건과 설치
IBM Information Server에는 데이터 통합과 분석 업무에 필요한 많은 소프트웨어 제품이 포함되어 있다. 여기에는 WebSphere® DataStage®, WebSphere
QualityStage®, WebSphere Information Analyzer, WebSphere Federation Server와 기타 업체의 제품들이 있다. 특정 프로젝트의 요구 사항에 따라 IBM Information Server의 제품 서브셋을 선택해 설치할 수 있다.
그림 1. SAP BI와 SAP BW를 위해 ETL 잡(job)을 디자인하는 데 필요한 소프트웨어 제품
그림 1은 SAP BI나 BW 데이터 웨어하우스를 위해 ETL 잡을 디자인하는 데 필요한 가장 최소한의 IBM Information Server 제품 세트를 보여준다.
-
WebSphere DataStage에는 다음이 포함되어 있다.
-
DataStage Client
-
DataStage Server
-
DataStage Metadata Repository
-
DataStage Domain Server
WebSphere DataStage 제품은 다른 호스트 상에 분리 설치되거나 같은 호스트에 설치할 수 있다.
-
SAP BW를 위한 WebSphere DataStage Pack(DataStage BW Pack)
DataStage BW Pack은 IBM Information Server와 같이 쓰이는 제품이다. 기본적으로 Pack은 SAP BW를 지원하기 위해 개발됐는데 현재는 SAP BW와 SAP BI를 모두 지원한다. DataStage BW Pack의 GUI는 데이터스테이지 클라이언트에 설치된다. Pack의 런타임 부분은 데이터스테이지 서버에 설치된다.
-
SAP RFC(원격 함수 호출) 라이브러리
SAP RFC 라이브러리는 IBM Information Server의 외부 컴포넌트다. DataStage BW Pack은 SAP RFC 인터페이스를 사용해 SAP BI와 SAP BW 함수를 호출한다. SAP RFC 라이브러리는 DataStage BW Pack을 사용하는 데 꼭 필요하며, 데이터스테이지 클라이언트와 서버에 모두 설치돼야 한다.
아키텍처 개요
그림 1의 소프트웨어 컴포넌트는 SAP BI를 위한 ETL 잡 디자인 및 실행에 다른 역할을 담당한다.
-
데이터스테이지 클라이언트와 DataStage BW Pack GUI 컴포넌트는 친근한 사용자 인터페이스를 제공하여 ETL 잡을 디자인하고 SAP BI 시스템 상에서 데이터를 운영하도록 설정한다.
-
데이터스테이지 서버와 DataStage BW Pack Sever 컴포넌트를 통해 사용자는 ETL 잡을 예약, 실행할 수 있다.
-
데이터스테이지 도메인 서버는 사용자 계정을 관리하고 IBM Information Server의 다른 기능을 사용하는 자격을 부여한다.
-
데이터스테이지 메타데이터 저장소는 테이블, 필드, 객체 정의를 저장, 공유하는 데이터베이스다.
DataStage BW Pack에는 다음 네 가지 주요 컴포넌트가 있다.
-
BW 로드 스테이지: SAP 데이터 소스가 아닌 곳에서 SAP BI 시스템으로 데이터를 로드한다. BW 로드 스테이지는 SAP가 인증한 데이터 로드 통합 솔루션으로 SAP 스테이징 BAPI 인터페이스를 사용하여 구현된다.
-
BW 추출 스테이지: SAP BI 시스템에서 데이터를 추출한다. SAP 인증의 데이터 추출 통합 솔루션으로 SAP 오픈 허브 서비스(Open Hub Services) 인터페이스를 기반으로 한다.
-
BW RFC 서버: SAP BI 시스템으로 호출되는 다양한 함수를 구현한다. SAP BI가 초기화한 데이터 로딩이나 데이터 추출 요청을 받고, 데이터스테이지 잡을 통해 관련 데이터를 운영한다.
-
BW RFC 매니저: BW RFC 서버 프로세스를 관리한다. 소스 시스템 당 BW RFC 서버 프로세스를 만든다. 또한 BW RFC 서버 프로세스를 시작하거나 멈추는 함수를 제공한다. 소스 시스템은 SAP BI 시스템 외부의 논리적 또는 물질적인 시스템을 나타낸다. 소스 시스템은 SAP BI 시스템에 소스 데이터를 제공하거나 SAP BI 시스템에서 추출한 데이터를 받아들인다.
SAP BI에 데이터 로드하기
데이터스테이지 잡은 SAP가 아닌 소스에서 데이터를 찾아 정제하고 통합하도록, 그리고 SAP BI 시스템에 데이터를 로드하도록 디자인할 수 있다. 예를 들어 CRM 애플리케이션에서 고객 데이터를 추출하여 구매 애플리케이션에서 고객의 구매 내역을 볼 수 있다. 통합된 구매 내역은 분석을 위해 SAP BI 시스템에 로드할 수 있다.
이번 절에서는 간단한 ETL 잡을 사용해 SAP BI 시스템에 데이터를 로드하는 데 필요한 단계를 설명할 것이다. 그림 2는 샘플 작업을 보여준다. 이 작업은 오라클(Oracle®) 데이터베이스 테이블에서 ODBC 스테이지를 사용해 고객 데이터를 추출한다. 추출한 데이터는 BW 로드 스테이지 LoadDataToSAPBI로 보내는데, 이는 처리된 데이터를 SAP BI 시스템의 CUSTOMER Characteristic(고객 특성)에 로드한다. 표 1은 오라클 데이터베이스 테이블의 샘플 데이터를 보여준다. CUSTOMER Characteristic은 그림 3, 4에서 볼 수 있는 것처럼 SAP 웨어하우징 워크벤치를 사용해 SAP BI에 만들어진다.
그림 2. SAP BI에 데이터를 로드하는 데이터스테이지 잡
표 1. 오라클 데이터베이스 테이블의 샘플 데이터
|
ID
|
NAME
|
STREET
|
CITY
|
REGION
| |
0000001
|
IBM
|
New Orchard Road
|
Armonk
|
NY
| |
0000002
|
Microsoft
|
One Microsoft Way
|
Redmond
|
WA
| |
0000003
|
SAP America
|
3999 West Chester Pike
|
Newtown Square
|
PA
|
|
POSTALID
|
COUNTRY
|
PHONE
|
FAX
|
TAXNUM
| |
10504
|
USA
|
800-426-4968
|
866-722-9226
|
000000000
| |
98052
|
USA
|
800-642-7676
|
425-936-7329
|
000000000
| |
19073
|
USA
|
610-661-1000
|
404-943-2950
|
000000000
|
그림 3. SAP BI의 CUSTOMER Characteristic
그림 4. SAP BI의 CUSTOMER Characteristic
— 속성 탭
그림 5. BI 데이터 로드 운영의 데이터 흐름
그림 5는 BI 데이터 로드 운영의 데이터 흐름을 보여준다.
-
소스 시스템은 SAP BI에 데이터를 로드하는 하나 혹은 그 이상의 데이터스테이지 잡을 나타내도록 정의된다. 데이터 전달 구조는 소스 시스템에 있는 데이터를 설명한다. 데이터스테이지의 업무는 외부 데이터 소스에서 SAP BI PSA(Persistent Staging Area) 스테이징 테이블로 데이터를 로드하는 것이다..
-
전달 규칙은 스테이징 테이블에서 InfoSource로 데이터를 전달하도록 정의된다. InfoSource는 단일 유닛으로 취급되는 데이터 필드의 컬렉션이다. 통신 구조는 InfoSource의 데이터 필드를 정의한다.
-
업데이트 규칙은 InfoSource에서 하나 혹은 그 이상의 BI 데이터 타깃(InfoObjects, DataStore 객체, 또는 BI InfoCubes)으로 데이터를 변형하도록 만들어진다.
그림 6에서 볼 수 있는 것처럼 BW 로드 스테이지는 스테이지 편집기를 제공한다. 스테이지 편집기에는 BI 로드 운영의 다양한 매개변수를 설정하는 몇 가지 탭이 있다. .
-
General 탭은 SAP BI에 RFC 연결을 만들거나 선택한다.
-
Transfer Structure 탭은 소스 시스템과 InfoSource를 만들거나 선택한다.
-
Columns 탭은 SAP BI에 보내는 데이터의 행 정의를 보여준다.
-
InfoPackage 탭은 데이터스테이지 잡이 SAP BI에 데이터를 로드하는 방법과 시기를 정의한다.
-
Process Chain 탭은 데이터 로드 운영 동작을 BI 프로세스 체인 내에서 처리할 수 있게 한다. 프로세스 체인은 작업 흐름 함수를 제공하는데, 이는 연속적인 의존 데이터 처리 프로세스를 디자인하고 예약하는 데 사용된다.
그림 6. BW 로드 스테이지 편집기
그림 2의 BW 로드 스테이지 LoadDataToSAPBI는 표 1의 데이터를 SAP BI로 로드한다. BW 로드 스테이지를 설정하는 몇 가지 단계가 있다. 이 단계는 그림 7과 같은데, 다음 절에서 상세히 설명하겠다.
그림 7. BW 로드 스테이지 LoadDataToSAPBI 설정하기
BW 연결 설정
그림 6에서 보여준 것처럼 BI 연결 속성은 General 탭에서 설정된다. Menu 아이템을 통해 BI 연결을 만들고 선택하고 수정할 수 있다.
그림 8은 새로운 연결 대화상자 창을 보여준다. 새로운 BI 연결 DEMOCONN은 데이터스테이지 서버에 저장되고, BI 데이터 운영을 수행하는 다른 데이터스테이지 잡을 디자인하는 데 재사용할 수 있다.
그림 8. 연결 속성 대화상자 창
소스 시스템 설정
그림 9처럼 소스 시스템 속성은 Transfer Structure 탭에서 설정한다. Menu 아이템으로 소스 시스템을 만들고 선택해 볼 수 있다.
SAP BI에서 소스 시스템은 플랫 파일, SAP 시스템, 데이터베이스 시스템, 다차원 데이터 소스, 웹 서비스, 스테이징 BAPI 인터페이스 기반의 외부 애플리케이션 등이 될 수 있다. BW 로드 스테이지는 스테이징 BAPI API를 사용해 메타데이터와 SAP BI를 교환하고 SAP BI로 데이터를 로드한다.
그림 9. Transfer Structure 탭
그림 9의 메뉴 아이템에서 New…는 새로운 소스 시스템을 만든다. 새로운 소스 시스템이 만들어지면 BW RFC 매니저는 새 BW RFC 서버 프로세스를 시작한다. RFC 서버 프로세스는 SAP BI에서의 데이터 로드 요청을 기다리고 관련 데이터스테이지 잡을 요청하여 데이터 로드 운영을 시작한다. 새 소스 시스템은 이후 재사용을 위해 데이터스테이지 서버에 저장된다.
그림 10은 새 소스 시스템 DEMODSSRC가 만들어지는 것을 보여준다. 새 소스 시스템을 위한 BW RFC 서버 프로세스는 데이터스테이지 서버에서 자동으로 만들어지고 <hostname>.DEMODSSRC 프로그램으로 SAP BI에 등록된다. 그림 11과 같이 SAP 트랜잭션 sm59는 새 소스 시스템을 위해 RFC 목적을 보고 테스트하는 데 사용할 수 있다.
그림 10. 소스 시스템 만들기
그림 11. RFC 목적
InfoSource 설정
그림 12처럼 InfoSource는 Transfer Structure 탭에서 설정한다. 메뉴 아이템으로 SAP BI의 특성, 주요 기능, InfoSource를 만들고 업데이트하고 보고 검색할 수 있다.
그림 12. InfoSource 메뉴 아이템
Existing Characteristic…에서 Create Master InfoSource 메뉴 아이템은 기존 특성을 기반으로 InfoSource를 만든다. 이 메뉴 아이템이 선택되면 사용자는 두 가지 작업을 해야 한다.
-
기존 Characteristic을 선택한다. BW 로드 스테이지는 검색 환경에 맞는 BI 특성을 보여주고 기존 특성을 선택할 수 있도록 한다. 그림 13은 CUSTOMER 특성을 선택한다.
그림 13. 기존 특성 선택하기
-
그림 14처럼 새로운 BI InfoSource 객체의 속성을 지정한다.
그림 14. 새 InfoSource의 속성 지정하기
그림 15에서 볼 수 있는 것처럼 BW 로드 스테이지는 SAP BI 안에 지정된 InfoSource를 만든다. 스테이지는 또한 그림 16의 Transfer Structure 탭 상의 InfoSource를 선택한다.
그림 15. 새 InfoSource
그림 16. 새 InfoSource 선택하기
데이터스테이지 테이블 정의 설정하기
Transfer Structure 탭에서 InfoSource를 선택하면 데이터스테이지 테이블 정의는 InfoSource 전달 구조를 기반으로 만들어진다. 그림 17은 테이블 정의를 보여준다. 표 2는 SAP 데이터 유형이 데이터스테이지 데이터 유형과 어떻게 매핑되는지 보여준다. 테이블 정의는 Validate Columns와 Synchronize Columns 버튼을 사용해 InfoSource 필드를 유효화, 동기화할 수 있다.
그림 17. Columns 탭
표 2. 테이블에 매핑된 데이터 유형
|
SAP data type
|
DataStage data type
| |
DATS
|
SQL DATE
| |
CURR
|
SQL CHAR
| |
TIMS
|
SQL TIME
| |
FLTP
|
SQL FLOAT
| |
CHAR (no more than 256 characters)
|
SQL CHAR
| |
CHAR (more than 256 characters)
|
SQL VARCHAR
|
InfoPackage 설정하기
그림 18처럼 InfoPackage는 InfoPackage 탭 상에서 설정된다. InfoPackage는 SAP BI의 엔트리 포인트로 소스 시스템에서 데이터를 요청한다. InfoPackage는 데이터스테이지 잡이 SAP BI 시스템에 언제, 어떻게 데이터를 로드하는지 정의한다. InfoPackage 탭은 InfoPackage를 만들고 선택한다. 그림 19처럼 이 탭을 사용해 InfoPackage 속성을 설정할 수 있다.
그림 18. InfoPackage 탭
그림 19. InfoPackage 속성 대화상자 창
BW 로드 스테이지는 세 가지 데이터 로드 메커니즘을 지원한다.
-
푸시 모드: 데이터스테이지 잡이 먼저 시작된다. 데이터스테이지 잡은 업무를 위해 InfoPackage를 예약하여 데이터 로딩 운영을 시작한다.
-
풀 모드: SAP 데이터 웨어하우징 워크벤치를 사용해 먼저 InfoPackage를 예약한다. SAP BI가 데이터를 받을 준비가 되면 이를 RFC 서버 프로세스에 알린다. RFC 서버 프로세스는 데이터스테이지 잡을 시작해 데이터를 SAP BI에 보낸다.
-
파일 모드: 데이터스테이지 잡이 먼저 작동한다. 데이터스테이지 업무는 SAP BI를 위해 데이터를 임시 파일에 저장한다. 그리고 나서 파일의 데이터를 SAP BI에 로드하도록 InfoPackage를 예약한다.
InfoPackage 써드파티 매개변수는 데이터스테이지 BW 팩 같은 써드파티 통합 도구를 지원하도록 정의된다. 그림 20처럼 데이터스테이지 잡 BILoadJob은 새 pull InfoPackage DEMO Pull InfoPacakge를 위해 써드파티 매개변수로 자동 설정된다.
그림 20. InfoPackage 써드파티 매개변수
BI 데이터 로딩 프로세스에서 써드파티 매개변수를 사용하는 것은 다음과 같이 설명할 수 있다.
-
SAP BI는 InfoPackage DEMO PULL InfoPackage를 예약하고 실행한다.
-
데이터를 받을 준비가 되면 InfoPackage는 로딩 요청을 소스 시스템 DEMODSSRC로 보낸다. 또한 써드파티 매개변수 DSJob과 이 값인 BILoadJob을 소스 시스템에 전달한다.
-
소스 시스템을 위한 RFC 서버 프로세스는 요청을 받아 데이터스테이지 잡 BILoadJob을 시작하고 데이터 패키지를 SAP BI로 보낸다.
프로세스 체인 설정하기
프로세스 체인은 Process Chain 탭에서 설정한다. 이 단계는 꼭 필요한 단계는 아니다. BW 로드 스테이지는 프로세스 체인이 있든 없든 실행할 수 있다.
프로세스 체인은 결합된 연속적인 의존 프로세스를 정의한다. InfoPackage 실행은 SAP BI가 정의하는 프로세스 속성 중 하나다. 그림 21처럼 InfoPackage DEMO Pull InfoPacakge 실행은 프로세스 체인 Demo Load Chain의 프로세스로 추가된다. 그림 22는 프로세스 체인 Demo Load Chain을 선택했다.
그림 21. 데이터 로딩 잡(job)을 프로세스 체인의 한 부분으로 실행하기
그림 22. 프로세스 체인 선택하기
데이터 로드 운영 실행하기
프로세스 체인 Demo Load Chain은 BI 데이터 로드 운영을 실행하도록 예약돼야 한다. 프로세스 체인은 두 가지 방법으로 시작할 수 있다.
예제에서 프로세스 체인을 호출하기 위해 먼저 데이터스테이지 잡을 시작한다. 그림 25는 데이터스테이지 작업이 성공적으로 실행되는 것을 보여준다. 그림 26은 소스 데이터가 SAP BI로 로드되는 것을 보여준다.
그림 25. 데이터스테이지 잡 실행하기
그림 26. SAP BI에 로드되는 데이터
SAP BI에서 데이터 추출하기
BW 추출 스테이지는 SAP BI 시스템에서 데이터를 추출한다. 추출된 데이터는 SAP 이외의 애플리케이션에 제공된다. BW 추출 스테이지는 프로세스를 익스포트하는 데이터를 제어, 모니터하도록 정의하는 SAP 오픈 허브 서비스를 기반으로 한다.
이번 절에서는 간단한 ETL 잡을 사용해 SAP BI 시스템에서 데이터를 추출하는 데 필요한 단계를 설명한다. 그림 27은 샘플 업무를 보여준다. 업무는 그림 4처럼 SAP BI의 특성 CUSTOMER에서 데이터를 추출한다. 업무는 데이터스테이지 변형 스테이지를 사용해 추출된 데이터를 처리한 후 처리 결과를 플랫 파일(flat file)에 저장한다.
그림 27. SAP BI에서 추출된 데이터를 위한 데이터스테이지 잡
BW 추출 스테이지는 그림 28처럼 스테이지 편집기를 갖고 있다. 스테이지 편집기에는 BI 데이터 추출 운영을 위해 다양한 속성을 설정하는 네 가지 탭이 있다.
그림 28. BW 추출 스테이지 GUI
-
General 탭은 SAP BI에 RFC 연결을 만들거나 선택한다.
-
Process Chain 탭은 소스 시스템과 프로세스 체인을 선택한다. BI 데이터 추출 운영은 프로세스 체인 내에서 프로세스로 작동한다.
-
Open Hub Destination 탭은 InfoSpoke나 Open Hub Destination을 선택한다.
-
Columns 탭은 SAP BI에서 추출된 데이터를 위해 행 정의를 보여준다.
그림 27의 BW 추출 스테이지 ExtractDataFromSAPBI는 SAP BI 시스템에서 데이터를 추출한다. BW 추출 스테이지를 설정하려면 몇 가지 단계를 거쳐야 한다. 이 단계들은 그림 29와 같은데 이에 관해서는 다음 절에서 상세히 설명하겠다.
그림 29. BW 추출 스테이지 ExtractDataFromSAPBI 설정하기
BI Open Hub Destination과 데이터 전송 프로세스 설정하기
BW 추출 스테이지는 데이터 추출을 위해 BW InfoSpoke와 BI Open Hub Destination을 모두 지원한다.
InfoSpoke는 SAP BW의 오픈 허브 서비스 팩에서 가장 중요하다. InfoSpoke는 다음 세 가지 속성을 지정한다.
-
원래의 데이터를 제공하는 InfoProvider. InfoProvider는 InfoCube, DataStore 객체, InfoObject 중 하나가 될 수 있다.
-
추출된 데이터를 받는 타깃을 정의하는 Open Hub Destination
-
원래의 폼에서 최종 폼으로 데이터를 바꾸는 변형
InfoSpoke는 Open Hub Destination 탭에서 선택되기 전에 먼저 만들어져야 한다. BW 추출 스테이지는 InfoSpoke를 만들고 데이터 추출을 위해 InfoSpoke를 사용하도록 지원한다.
SAP BI에서 Open Hub Destination은 새 BI 데이터 전송 프로세스로 통합되어 InfoSpoke와 완전히 묶이지 않는다. 그림 30에서 볼 수 있듯이 데이터 전송 프로세스는 InfoProvider에서 Open Hub Destination으로 데이터를 변형한다. 데이터가 Open Hub Destination에 준비되면 SAP BI는 데이터스테이지 잡을 시작해 Open Hub Destination에서 데이터를 추출하는 데이터스테이지 RFC 서버 프로세스를 알린다. 전체 데이터 추출 프로세스를 제어하기 위해 프로세스 체인을 만든다.
그림 30. BI 데이터 추출 다이어그램
그림 27의 추출 스테이지 ExtractDataFromSAPBI는 BI Open Hub Destination을 기반으로 설정한다. 여기선 전통적인 BW InfoSpoke 사용법은 다루지 않겠다. 다음은 스테이지를 위해 BI 산출물을 만드는 방법을 요약한 것이다.
-
SAP 트랜잭션 RSBO나 Data
Warehousing Workbench GUI를 사용해 새 Open Hub Destination을 만들고 활성화한다. 그림 31은 새 Open Hub Destination DEMODEST를 만들기 위한 대화상자 창을 보여준다. 새 Open Hub Destination의 필드 정의를 만들기 위해 CUSTOMER 특성 속성을 선택한다. 그림 32처럼 Open Hub Destination을 위한 데이터 수신기로 DEMODSSRC RFC 대상을 선택한다.
그림 31. 새 Open Hub Destination 만들기
그림 32. RFC 대상 선택하기
-
새로운 데이터 전송 프로세스를 만들고 활성화하여 InfoProvider에서 Open Hub Destination으로 데이터를 변형한다. 그림 33은 새로운 데이터 전송 프로세스를 만드는 대화상자 창을 보여준다. 데이터 전송 프로세스는 데이터를 Customer 속성에서 Open Hub Destination DEMODEST로 전송한다.
그림 33. 새로운 데이터 전송 프로세스 만들기
-
새로운 프로세스 체인을 만들고 활성화하여 새 데이터 전송 프로세스를 호출한다. 그림 34는 데이터 전송 프로세스인 CUSTOMER > DEMODEST가 프로세스 체인 CUSTCHAIN에 프로세스로 추가되는 것을 보여준다.
그림 34. 프로세스 체인을 만들고 활성화하기
소스 시스템과 프로세스 체인 설정하기
소스 시스템과 프로세스 체인은 Process Chain 탭 상에서 설정한다. 소스 시스템은 추출된 데이터의 대상이고, 프로세스 체인은 데이터 추출 프로세스를 제어한다.
그림 35에서 소스 시스템으로 DEMODSSRC를 선택한다. 프로세스 체인 CUSTCHAIN은 스테이지 ExtractDataFromSAPBI를 위해 선택한다.
그림 35. Process Chain 탭
Open Hub Destination 설정하기
Open Hub Destination은 그림 37처럼 Open Hub Destination 탭 상에서 설정한다. 이 때 두 가지 사용자 동작이 필요하다.
-
Open Hub Destination을 선택한다.
그림 36에서 스테이지 ExtractDataFromSAPBI로 Open Hub Destination DEMODEST를 선택한다. 스테이지는 BI에서 DEMODEST 정의를 찾아오고, 그림 37처럼 다양한 GUI 제어를 자동으로 파퓰레이트한다.
그림 37의 테이블 필드는 DEMODEST 정의의 한 부분이다. 이 필드들은 Column 탭에서 보이는 DataStage 탭 정의로 전환된다. BW 추출 스테이지를 위한 Column 탭은 그림 17의 BW 로드 스테이지를 위한 Column 탭과 같다.
그림 36. Open Hub Destination
그림 37. Open Hub Destination 탭
-
Open Hub Destination용 써드파티 매개변수를 업데이트한다.
Open Hub Destination은 InfoPackage와 같은 방식으로 써드파티 매개변수를 지원한다. 그림 37에서 Update BW을 누르면 선택한 Open Hub Destination의 써드파티 매개변수를 세팅한다. 그림 38은 버튼을 클릭했을 때 결과를 보여준다. 그림 39는 잡 이름 BIExtractJob, 프로세스 체인 CUSTCHAIN, 소스 시스템 DEMODSSRC이 Open Hub Destination DEMODEST의 써드파티 매개변수로 세팅된 것을 보여준다. BW Extract Stage에서 써드파티 매개변수를 사용하는 것은 BW Load Stage에서 매개변수를 사용하는 것과 비슷하다.
그림 38. 써드파티 매개변수 업데이트
그림 39. DEMODEST 써드파티 매개변수
데이터 추출 운영 실행하기
데이터 로드 운영과 마찬가지로 프로세스 체인 CUSTCHAIN도 데이터 추출 운영을 실행하기 위해 예약돼야 한다. 이는 BIExtractJob 데이터스테이지 잡이나 SAP 데이터 웨어하우징 워크벤치 중 하나에 의해 시작될 수 있다.
예제에서 데이터스테이지 잡은 프로세스 체인을 호출하는 것으로 시작한다. 그림 40은 데이터스테이지 잡이 성공적으로 동작하는 것을, 그림 41은 SAP BI에서 추출된 데이터를 보여준다.
그림 40. 데이터스테이지 잡 실행하기
그림 41. SAP BI에서 추출된 데이터
결론
이 글을 통해 IBM Information Server와 WebSphere DataStage SAP BW Pack을 사용해 SAP BI 데이터를 SAP가 아닌 BI 데이터와 통합하는 방법을 살펴봤다. 즉, SAP BI 데이터 로드와 추출 프로세스, 그리고 새로운 SAP BI 기능인 데이터 전송 프로세스를 설명했다. 두 예제는 단계별 디자인 프로세스를 보여준다.
IBM Information Server는 SAP BI 데이터 웨어하우스 환경에서 중요한 두 가지 문제에 최신 기술과 통합 솔루션을 제공한다.
-
데이터의 질: 데이터 웨어하우스를 만드는 데이터는 종종 다양한 데이터 소스에서 온다. 레거시 데이터의 구조가 문서화되지 않으면 데이터 질은 나쁠 수밖에 없다. WebSphere Information Analyzer 제품은 데이터를 분석하고 데이터 구조와 질을 결정한다. 이렇게 되면 데이터를 이해하는 데 도움이 된다. WebSphere QualityStage 제품은 높은 품질의 데이터를 만드는 정보 유형을 표준화하고 이에 맞춘다.
-
테이터의 양: 가끔 데이터 웨어하우스 환경에서 정기적으로 처리해야 할 대용량 데이터가 있다. 이 데이터 용량은 예상보다 커질 수 있다. 문제는 확장성 있는 ETL 아키텍처에 있다. IBM Information Server는 경로와 파티션 기술을 활용해 높은 데이터 효율을 지원한다. IBM Information Server는 SMP(대칭형 다중 프로세싱)와 MPP(대규모 병렬 처리) 컴퓨터 시스템을 배치하여 최대 확장성을 얻을 수 있다.
지금까지의 작업은 직접적인 데이터 접근과 메타데이터 관리를 포함하는 SAP BI 통합 솔루션을 끝내지 못한 상태다. 작업의 주된 관심사는 빠르고 효율적인 ETL 솔루션을 개발해 대용량 문서 수준의 데이터 아이템을 저장하는 기업 트랜잭셔널 데이터를 만드는 것이다.
감사 인사
이 글을 검토하고 피드백을 준 Wendi Nusbickel, Nicolas Cominetti, Susan Shay에게 고마움을 전한다.
부록 A: 용어
|
용어
|
설명
| |
ETL
|
Extract, Transform, Load(추출, 변형, 로드)
| |
SAP BI
|
Business Intelligence
| |
SAP BW
|
SAP Business Information Warehouse
| |
GUI
|
그래픽 사용자 인터페이스
| |
CRM
|
Customer Relationship Management(고객 관계 관리)
| |
ODBC
|
Open Database Connectivity(오픈 데이터베이스 연결성)
| |
DataStage job
|
IBM Information Server에 의해 수행되는 일련의 데이터 운영
| |
RFC
|
SAP 용어, Remote Function Call(원격 함수 호출)
| |
PSA
|
SAP BI 용어, Persistent Staging Area
| |
Staging BAPI
|
SAP BI 용어, 써드파티 ETL 도구를 위한 오픈 인터페이스
| |
Open Hub Service
|
SAP BI 용어, SAP BW/BI 데이터 익스포팅 메커니즘
| |
Source System
|
SAP BI 용어, SAP BI 시스템 외부의 논리적 또는 물질적 시스템
| |
InfoObject
|
SAP BI 용어, 최저 수준의 정보 제공자
| |
DataStore Object
|
SAP BI 용어, 통합된 트랜잭션의 저장소 위치와 문서 수준의 마스터 데이터
| |
InfoCube
|
SAP BI 용어, 스타 스키마에 정렬된 몇 가지 관계형 테이블
| |
InfoSource
|
SAP BI 용어, 논리적으로 합쳐진 정보의 양
| |
InfoPackage
|
SAP BI 용어, 소스 시스템에서 데이터를 요청하는 엔트리 포인트
| |
InfoSpoke
|
SAP BI 용어, 오픈 허브 서비스 내에서 데이터를 익스포트하는 추출 객체
| |
Process Chain
|
SAP BI 용어, 합쳐지는 일련의 프로세스
| |
Transfer Structure
|
SAP BI 용어, 소스 시스템에서의 데이터 필드 선택
|
부록 B: 도구
|
그림
|
도구
| |
그림 2, 25, 27, 40
|
데이터스테이지 디자이너
|
그림 3, 4, 11, 15, 20, 21, 26, 31, 32, 33, 34, 39
|
SAP 데이터 웨어하우징 워크벤치
| |
그림 6, 8, 9, 10, 12, 13, 14, 16, 17, 18, 19, 22
|
BW 로드 스테이지 편집기
| |
그림 28, 35, 36, 37, 38
|
BW 추출 스테이지 편집기
| |
그림 41
|
데이터스테이지 파일 스테이지 편집기
|
참고자료 교육
제품 및 기술 얻기
토론
필자소개  | 
|  | Jeff Li는 플로리다 보카 라톤에 위치한 Software Group의 소프트웨어 고문 엔지니어이자 인증된 프로젝트 관리 전문가다. 2005년 IBM과 어센셜이 합병될 때 IBM에 입사했다. 엔터프라이즈 애플리케이션과 텔레컴 시스템 영역에서 15년 동안 일했으며 현재 IBM Information Server의 ERP와 BI 어댑터를 개발 중이다. |
기사에 대한 평가
 |
| 이 문서 북마킹 하기
|
|