DataStage에서 데이터 로드

IBM® InfoSphere® DataStage® 서버를 사용하여 데이터베이스에 데이터를 로드할 수 있습니다.

선행 조건

벌크 로드 조작을 실행 중인 사용자 ID에 다음 특권 중 하나가 부여되었는지 확인하십시오.
  • BIND: DB2® 클라이언트 패키지를 바인딩할 수 있습니다.
  • EXECUTE: DataStage 관리자가 Db2 클라이언트 패키지가 사전에 바인딩되어 있는 경우, 해당 패키지에 EXECUTE 특권을 부여하십시오.

DataStage의 데이터베이스 연결 정의

DataStage 및 Quality Stage Designer(DataStage Designer)에서 Db2 데이터베이스인 BLUDB에 대한 연결을 정의해야 합니다. 웹 콘솔에서 필요한 연결 정보를 찾을 수 있습니다. Db2 데이터베이스에 DataStage 연결도 참조하십시오.

데이터를 로드할 작업 정의

DataStage Designer를 사용하여 소스 데이터베이스에서 BLUDB 데이터베이스로 데이터를 로드하는 병렬 작업을 정의하고 실행하십시오.

이 태스크는 다음 전제조건을 포함합니다.

  • 대상 BLUDB 데이터베이스는 행을 포함하지 않는 대상 테이블을 포함해야 합니다. 웹 콘솔의 테이블 페이지에서 해당 테이블을 작성할 수 있습니다.
  • 소스 데이터베이스가 DataStage 서버에서 카탈로그되어야 하며 소스 테이블 정의가 DataStage 서버로 임포트되어야 합니다.
  • DataStage Designer는 DataStage 서버에 연결되어야 하며 소스 데이터베이스에 대한 연결 오브젝트를 포함해야 합니다.

BLUDB 데이터베이스에 데이터를 로드할 DataStage 작업을 정의하려면 다음을 수행하십시오.

  1. DataStage Designer에서 파일 > 새로 작성 > 병렬 작업을 클릭하여 작업 작성에 대한 작업 스페이스를 여십시오.
  2. 소스 및 대상 Db2 커넥터 오브젝트를 작업 창에 추가하고 그 사이의 링크를 작성하십시오.
    1. 데이터베이스 팔레트에서 두 Db2 커넥터 오브젝트를 작업 창으로 끄십시오(한 오브젝트는 소스 데이터베이스 연결용이며 다른 오브젝트는 대상 데이터베이스 연결용입니다).
    2. 일반 팔레트에서 링크를 선택하십시오.
    3. 한 Db2 커넥터 오브젝트에서 다른 커넥터 오브젝트로 커서를 끌어서 링크를 작성하십시오.
      DataStage 병렬 처리
  3. 로드 프로세스에 대한 소스 데이터를 정의하십시오.
    1. 소스 데이터베이스에 대한 연결을 나타내는 Db2 커넥터 오브젝트를 더블 클릭하여 Db2 커넥터 창을 여십시오.
    2. 특성 탭에서 로드를 클릭하십시오.
    3. 소스 데이터베이스 연결을 선택하고 열기를 클릭하십시오.
    4. 인스턴스 필드에서 값이 DataStage 인스턴스의 이름인지 확인하십시오.
    5. 데이터베이스 필드에 소스 데이터베이스의 이름을 입력하십시오.
    6. 사용 영역에서 SQL 생성 옵션에 대해 를 선택하십시오.
    7. 테이블 이름 필드에 로드할 데이터를 포함하는 테이블의 이름을 입력하십시오.
      소스 Db2 커넥터
    8. 컬럼 탭에서 로드를 클릭하여 테이블 정의 창을 여십시오.
    9. 로드할 데이터를 포함하는 소스 테이블의 정의를 여십시오. 확인을 클릭하여 컬럼 탭에 컬럼을 표시하십시오.
    10. 소스 테이블에서 로드할 컬럼을 선택하십시오.
    11. Db2 커넥터 창에서 확인을 클릭하십시오.
  4. 로드 프로세스용 BLUDB 데이터베이스에서 대상 데이터를 정의하십시오.
    1. 대상 BLUDB 데이터베이스에 대한 연결을 나타내는 Db2 커넥터 오브젝트를 더블 클릭하여 Db2 커넥터 창을 여십시오.
    2. 특성 탭에서 로드를 클릭하십시오.
    3. 대상 데이터베이스 연결을 선택하고 열기를 클릭하십시오.
    4. 인스턴스 값이 DataStage 인스턴스의 이름인지 확인하십시오.
    5. 데이터베이스 필드에 대상 BLUDB 데이터베이스의 이름을 입력하십시오.
    6. 사용 영역에서 SQL 생성 옵션에 대해 를 선택하십시오.
    7. 쓰기 모드 필드에서 벌크 로드를 선택하십시오.
    8. 테이블 이름 필드에 BLUDB 데이터베이스 내의 대상 테이블 이름을 입력하십시오.
      대상 Db2 커넥터
    9. Db2 커넥터 창에서 확인을 클릭하십시오.
  5. 파일 > 저장을 클릭하여 작업을 저장하십시오.

    선택사항: 다음 단계는 데이터가 SSL 연결을 통해 대상 BLUDB로 로드되는 경우에만 필수입니다.

  6. 파일 > 닫기를 클릭하여 작업을 닫으십시오.
  7. 실행 옵션으로 DB2CLIINIPATH를 설정하십시오.
    1. 왼쪽 저장소 분할 영역에서 작업으로 이동하고 마우스 오른쪽 단추를 클릭하여 특성을 선택하십시오.
    2. 매개변수 탭에서 환경 변수 추가를 클릭하십시오.
    3. 환경 변수 선택 상자에서 새로 작성을 클릭하고 이름 필드에 DB2CLIINIPATH를 입력하고 프롬프트 필드에 DB2CLIINIPATH를 입력하십시오. 확인을 클릭하십시오.
    4. 새로 추가한 변수가 다음 특성을 가지고 있는지 확인하십시오.
      Parameter name :  $DB2CLIINIPATH
      Prompt : DB2CLIINIPATH
      Type : String
      Default Value : /home/db2inst2/sqllib/cfg/db2cli.ini

자세한 정보는 IBM Db2 커넥터를 참조하십시오.

데이터를 로드할 작업 컴파일 및 실행

데이터를 로드할 작업을 작성한 후에는 작업을 컴파일한 다음 로드 프로세스를 실행할 수 있습니다.

  1. DataStage Designer 작업 스페이스에서 작업이 열린 상태로 파일 > 실행을 클릭하여 작업에서 정의된 로드 프로세스 컴파일을 시작하십시오.
  2. 작업을 컴파일할지 확인하는 프롬프트가 표시되면 를 선택하십시오. 작업에 대한 오류를 수신하면 작업 스페이스를 사용하여 오류를 수정한 다음 파일 > 실행을 클릭하여 컴파일 프로세스를 재시작하십시오. 작업이 컴파일되면 실행 옵션 창이 열립니다.
  3. 실행을 클릭하여 로드 프로세스를 시작하십시오.
  4. 로드 프로세스가 완료된 후에 작업 스페이스의 로그 보기 영역에 대상 BLUDB 데이터베이스에 삽입된 행의 수가 표시됩니다.
    작업 스페이스의 로그 뷰
  5. 로드 프로세스가 완료되었는지 확인하십시오. 예를 들어, 소스 및 대상 테이블의 행 수를 비교하십시오. 소스 테이블의 행 수를 알려면 소스 데이터베이스에 대해 다음 명령을 실행하십시오.

    select count(*) from SCHEMA.TABLENAME

    로드 프로세스가 성공적으로 완료된 경우, 대상 BLUDB 데이터베이스 테이블의 행 수가 소스 테이블의 행 수와 일치해야 합니다.

자세한 정보는 DataStage 문서: IBM Db2 데이터베이스를 참조하십시오.