DataStage에서 데이터 로드
IBM® InfoSphere® DataStage® 서버를 사용하여 데이터베이스에 데이터를 로드할 수 있습니다.
DataStage를 사용하여
데이터를 로드하는 방법에 대한 학습서 비디오를 볼 수 있습니다.
다음 단계에 따라
DataStage 서버에서 데이터를 로드하십시오.
선행 조건
벌크 로드 조작을 실행 중인 사용자 ID에 다음 특권 중 하나가 부여되었는지 확인하십시오.
- BIND: DB2® 클라이언트 패키지를 바인딩할 수 있습니다.
- EXECUTE: DataStage 관리자가 Db2 클라이언트 패키지가 사전에 바인딩되어 있는 경우, 해당 패키지에 EXECUTE 특권을 부여하십시오.
DataStage의 데이터베이스 연결 정의
DataStage 및 Quality Stage Designer(DataStage Designer)에서 Db2 데이터베이스인 BLUDB에 대한 연결을 정의해야 합니다. 웹 콘솔에서 필요한 연결 정보를 찾을 수 있습니다. Db2 데이터베이스에 DataStage 연결도 참조하십시오.
데이터를 로드할 작업 정의
DataStage Designer를 사용하여 소스 데이터베이스에서 BLUDB 데이터베이스로 데이터를 로드하는 병렬 작업을 정의하고 실행하십시오.
이 태스크는 다음 전제조건을 포함합니다.
- 대상 BLUDB 데이터베이스는 행을 포함하지 않는 대상 테이블을 포함해야 합니다. 웹 콘솔의 테이블 페이지에서 해당 테이블을 작성할 수 있습니다.
- 소스 데이터베이스가 DataStage 서버에서 카탈로그되어야 하며 소스 테이블 정의가 DataStage 서버로 임포트되어야 합니다.
- DataStage Designer는 DataStage 서버에 연결되어야 하며 소스 데이터베이스에 대한 연결 오브젝트를 포함해야 합니다.
BLUDB 데이터베이스에 데이터를 로드할 DataStage 작업을 정의하려면 다음을 수행하십시오.
- DataStage Designer에서 을 클릭하여 작업 작성에 대한 작업 스페이스를 여십시오.
- 소스 및 대상 Db2 커넥터 오브젝트를
작업 창에 추가하고 그 사이의 링크를 작성하십시오.
- 데이터베이스 팔레트에서 두 Db2 커넥터 오브젝트를 작업 창으로 끄십시오(한 오브젝트는 소스 데이터베이스 연결용이며 다른 오브젝트는 대상 데이터베이스 연결용입니다).
- 일반 팔레트에서 링크를 선택하십시오.
- 한 Db2 커넥터 오브젝트에서
다른 커넥터 오브젝트로 커서를 끌어서 링크를 작성하십시오.

- 로드 프로세스에 대한 소스 데이터를 정의하십시오.
- 소스 데이터베이스에 대한 연결을 나타내는 Db2 커넥터 오브젝트를 더블 클릭하여 Db2 커넥터 창을 여십시오.
- 특성 탭에서 로드를 클릭하십시오.
- 소스 데이터베이스 연결을 선택하고 열기를 클릭하십시오.
- 인스턴스 필드에서 값이 DataStage 인스턴스의 이름인지 확인하십시오.
- 데이터베이스 필드에 소스 데이터베이스의 이름을 입력하십시오.
- 사용 영역에서 SQL 생성 옵션에 대해 예를 선택하십시오.
- 테이블 이름 필드에 로드할 데이터를 포함하는 테이블의 이름을 입력하십시오.

- 컬럼 탭에서 로드를 클릭하여 테이블 정의 창을 여십시오.
- 로드할 데이터를 포함하는 소스 테이블의 정의를 여십시오. 확인을 클릭하여 컬럼 탭에 컬럼을 표시하십시오.
- 소스 테이블에서 로드할 컬럼을 선택하십시오.
- Db2 커넥터 창에서 확인을 클릭하십시오.
- 로드 프로세스용 BLUDB 데이터베이스에서 대상 데이터를 정의하십시오.
- 대상 BLUDB 데이터베이스에 대한 연결을 나타내는 Db2 커넥터 오브젝트를 더블 클릭하여 Db2 커넥터 창을 여십시오.
- 특성 탭에서 로드를 클릭하십시오.
- 대상 데이터베이스 연결을 선택하고 열기를 클릭하십시오.
- 인스턴스 값이 DataStage 인스턴스의 이름인지 확인하십시오.
- 데이터베이스 필드에 대상 BLUDB 데이터베이스의 이름을 입력하십시오.
- 사용 영역에서 SQL 생성 옵션에 대해 예를 선택하십시오.
- 쓰기 모드 필드에서 벌크 로드를 선택하십시오.
- 테이블 이름 필드에 BLUDB 데이터베이스 내의 대상 테이블 이름을 입력하십시오.

- Db2 커넥터 창에서 확인을 클릭하십시오.
- 을 클릭하여 작업을 저장하십시오.
선택사항: 다음 단계는 데이터가 SSL 연결을 통해 대상 BLUDB로 로드되는 경우에만 필수입니다.
- 를 클릭하여 작업을 닫으십시오.
- 실행 옵션으로 DB2CLIINIPATH를 설정하십시오.
- 왼쪽 저장소 분할 영역에서 작업으로 이동하고 마우스 오른쪽 단추를 클릭하여 특성을 선택하십시오.
- 매개변수 탭에서 환경 변수 추가를 클릭하십시오.
- 환경 변수 선택 상자에서 새로 작성을 클릭하고 이름 필드에 DB2CLIINIPATH를 입력하고 프롬프트 필드에 DB2CLIINIPATH를 입력하십시오. 확인을 클릭하십시오.
- 새로 추가한 변수가 다음 특성을 가지고 있는지 확인하십시오.
Parameter name : $DB2CLIINIPATH Prompt : DB2CLIINIPATH Type : String Default Value : /home/db2inst2/sqllib/cfg/db2cli.ini
자세한 정보는 IBM Db2 커넥터를 참조하십시오.
데이터를 로드할 작업 컴파일 및 실행
데이터를 로드할 작업을 작성한 후에는 작업을 컴파일한 다음 로드 프로세스를 실행할 수 있습니다.
- DataStage Designer 작업 스페이스에서 작업이 열린 상태로 을 클릭하여 작업에서 정의된 로드 프로세스 컴파일을 시작하십시오.
- 작업을 컴파일할지 확인하는 프롬프트가 표시되면 예를 선택하십시오. 작업에 대한 오류를 수신하면 작업 스페이스를 사용하여 오류를 수정한 다음 을 클릭하여 컴파일 프로세스를 재시작하십시오. 작업이 컴파일되면 실행 옵션 창이 열립니다.
- 실행을 클릭하여 로드 프로세스를 시작하십시오.
- 로드 프로세스가 완료된 후에 작업 스페이스의 로그 보기 영역에 대상 BLUDB 데이터베이스에
삽입된 행의 수가 표시됩니다.

- 로드 프로세스가 완료되었는지 확인하십시오. 예를 들어, 소스 및 대상 테이블의 행 수를
비교하십시오. 소스 테이블의 행 수를 알려면 소스 데이터베이스에 대해 다음 명령을 실행하십시오.
select count(*) from SCHEMA.TABLENAME로드 프로세스가 성공적으로 완료된 경우, 대상 BLUDB 데이터베이스 테이블의 행 수가 소스 테이블의 행 수와 일치해야 합니다.
자세한 정보는 DataStage 문서: IBM Db2 데이터베이스를 참조하십시오.