Teradata 계보 구성

Teradata 에서 계보 메타데이터를 가져오려면 연결, 데이터 소스 정의 및 메타데이터 가져오기 작업을 생성하십시오.

이 정보는 서비스에 IBMManta Data Lineage 적용됩니다.

개요

Teradata는 데이터베이스 및 분석 관련 서비스와 제품을 제공합니다.

지원되는 Teradata 버전

  • Teradata : 버전 12, 13, 14, 15, 16, 17 또는 20 (Vantage(원격) 포함)

처리된 메타데이터

다음 Teradata 메타데이터가 처리되어 Lineage에 표시됩니다:

  • 데이터베이스 사전
  • 스토어드 프로시저
  • BTEQ 스크립트
  • TPT 스크립트
  • 보기
  • 매크로

제한사항

다음 데이터는 처리되지 않습니다:

  • EXECUTE IMMEDIATE 문을 통해 동적으로 실행되는 코드를 사용하는 자산.
  • Linux 셸, Windows 배치 파일 또는 기타 프로그래밍 언어로 작성된 TPT, BTEQ 또는 SQL 파일.

가져오기 프로세스 개요

의 Teradata 계보 메타데이터를 가져오려면 다음 단계를 완료하십시오:

  1. 데이터 소스 정의를 생성합니다.
  2. 프로젝트에서 데이터 소스에 대한 연결을 생성합니다.
  3. 메타데이터 가져오기를 생성합니다.

데이터 소스 정의 생성

데이터 소스 정의를 생성합니다. 데이터 소스 유형으로 를 Teradata 선택하십시오.

연결 생성 Teradata

필수 구성

연결을 설정하기 전에 다음 전제 조건이 충족되는지 확인하십시오:

  • DBC 데이터베이스(DBase, TVM, TVFields, All_RI_ChildrenV, 테이블 및 인덱스)에 대해 읽기 전용 권한이 있습니다.
  • 사용자님께는 SHOW VIEW, SHOW MACRO 및 SHOW PROCEDURE 문을 호출할 수 있는 권한이 있습니다.
  • Teradata 서버는 네트워크를 통해 접속할 수 있습니다.

연결 세부사항

프로젝트에서 데이터 소스에 대한 연결을 생성합니다.
연결에 관한 자세한 내용은 connection을 Teradata 참조하십시오.

데이터베이스 필드에는 휘발성 테이블이 생성되는 데이터베이스 이름을 입력하십시오.

메타데이터 가져오기 생성

메타데이터 가져오기를 생성합니다. 데이터 Teradata 소스에 특화된 옵션에 대해 자세히 알아보세요:

포함 및 제외 목록

데이터베이스를 포함하거나 제외할 수 있습니다. 각 부분은 정규식으로 평가됩니다. 데이터 소스에 나중에 추가하는 자산이 목록에 지정된 조건과 일치하는 경우, 해당 자산도 포함되거나 제외될 수 있습니다. 예제 값:

  • myDB/: 에 포함된 모든 myDB데이터베이스 및 자산,
  • myDB2/.*: 포함된 모든 데이터베이스 및 자산 myDB2
  • myDB3/myDB4: 데이터베이스 myDB4 from myDB3,
  • myDB5/myDB[1-5]: 이름이 로 시작하고 1에서 5 myDB 사이의 숫자로 myDB5 끝나는 데이터베이스 또는 다른 자산.

외부 입력

구성된 데이터베이스에서 작동하는 BTEQ 및 TPT 스크립트에 정의된 데이터 흐름을 분석할 수 있습니다. 외부 Teradata SQL 스크립트를.zip 파일로 압축하여 입력으로 제공할 수 있습니다. .zip 파일의 내용을 데이터베이스 이름에 해당하는 하위 폴더로 구성할 수 있습니다. 파일이 처리된 후, 각 스크립트는 폴더 위치에 따라 적절한 데이터베이스와 자동으로 연결됩니다.

외부 입력 파일은 다음 형식을 가져야 합니다:

<bteq>
    <script_name.bteq>
    <database_name> - optional
        <script_name.bteq>
<tpt>
    <script_name.tpt>
<tpt_operators>
    <tpt_operator_file_name> OR <tpt_operators.zip>
<tpt_includes>
    <included_file_name>
<tptJobVariables.txt>
<tptIncludesPathReplacements.txt>
replace.csv
connectionsConfiguration.prm

여기서,

BTEQ 스크립트:

  • BTEQ 스크립트는 파일 시스템에 독립 실행형.bteq(또는 이에 상응하는) 스크립트 파일로 존재해야 합니다.
  • 스크립트에는 BTEQ 코드만 포함되어야 합니다. Linux 셸 스크립트, PowerShell 스크립트 또는 Windows 배치 파일과 같은 래퍼는 지원되지 않습니다.
  • 스크립트에서 매개변수 자리 표시자를 사용하는 경우, 파일 시스템에 해당 매개변수 매핑 파일이 존재해야 합니다. 파일의 각 항목은 다음 형식을 따라야 합니다: placeholderName=actualValue

TPT 스크립트:

  • TPT 스크립트는 파일 시스템 상에 독립된.tpt(또는 이에 상응하는) 스크립트 파일 형태로도 존재해야 합니다.
  • 스크립트에는 셸, PowerShell, 또는 그 밖의 어떠한 배치 래퍼도 포함되지 않은 순수한 TPT 코드만 포함되어야 합니다.
tpt_연산자
프로듀서 및 컨슈머 오퍼레이터, 스키마, 속성 블록, 재사용 가능한 작업 조각을 정의하는 사용자 지정 오퍼레이터 스크립트나 오퍼레이터 템플릿이 포함된 폴더. 이 폴더에는 연산자 템플릿이 포함된 파일이 .zip 들어 있을 수도 있습니다. 연산자 템플릿은 tpt_includes 디렉터리에 있는 코드 조각을 참조할 수 있습니다.
tpt_includes
INCLUDE 문을 통해 작업에서 참조되는 파일이 포함된 폴더. 이러한 파일은 일반적으로 전체 스크립트 확장에 필요한 스키마 정의, 연산자 블록, 공유 SQL 조각 또는 구성 세그먼트를 제공합니다.
tptJobVariables.txt
스크립트에서 사용되는 TPT 작업 변수의 이름-값 매핑이 포함된 텍스트 파일.

허용되는 형식 placeholder=value. 자리 표시자 이름과 그 값에는 @ @기호를 사용할 수 없습니다.

예시DBName='WORKDB':.

tptIncludesPathReplacements.txt
INCLUDE 지시문에서 경로를 조정하는 데 사용되는 키-값 매핑이 포함된 파일. 이러한 매핑을 통해 참조된 스크립트 조각이 tpt_includes 디렉터리를 기준으로 해결되도록 보장합니다.
replace.csv
.zip 패키지에 포함된 스크립트의 자리 표시자 대체 내용을 담은 파일입니다. 이 형식에 대한 자세한 내용은 ‘자리 표시자 대체’를 참조하십시오.
connectionsConfiguration.prm
TPT 스크립트가 직접적인 로그온 문자열 대신 이름으로 연결을 참조하는 데 사용하는 연결 정의가 포함된 매개변수 파일.

고급 가져오기 옵션

확장 속성 추출
컬럼의 기본 키, 고유성 및 참조 무결성 제약 조건과 같은 확장 속성을 추출할 수 있습니다. 기본적으로 이러한 속성은 추출되지 않습니다.
성능 프로파일
선택한 데이터 소스에 대해 성능 프로필을 선택할 수 있습니다. 현재 요구 사항에 따라 계보 메타데이터 가져오기가 더 빠르거나 더 완벽할 수 있습니다. 다음 프로필 중에서 선택할 수 있습니다:
  • 빠름 : 이 프로필에서는 낮은 시간 및 메모리 소비가 최우선입니다. 입력 데이터가 크다면 계보 정보가 완전하지 않을 수 있습니다.

  • 균형 잡힌 : 성능과 계보 완결성 모두 중요합니다. 계보의 완전성과 계보 가져오기에 소요되는 시간 및 메모리 사이의 절충안이다.

  • 완결성 : 계보의 완결성이 이 프로필에서 최우선 순위입니다. 입력 데이터가 방대할 경우 계보 가져오기 작업에 상당한 리소스와 시간이 소요될 수 있습니다.

  • 사용자 지정 프로필 : 다음 속성에 값을 지정하여 자체 성능 프로필을 생성할 수 있습니다:

    • 데이터 흐름 분석 시간 초과 제한 : 단일 입력에 대한 데이터 흐름 분석이 중단되기까지 예상되는 최대 시간(초)을 지정합니다. 각 노드가 추가될 때 또는 경우에 따라 에지가 작성될 때 시간이 확인됩니다. 따라서 경우에 따라 제한시간 초과가 지정된 제한을 약간 초과할 수 있습니다. 값을 0으로 설정하면 분석이 중지되지 않습니다. 예시 값: 60.
    • 데이터 흐름 분석 에지 제한 : 데이터 흐름 분석 과정에서 단일 입력에 대해 허용되는 최대 에지 수를 지정합니다. 이 제한을 초과하면 모든 필터 에지가 제거되고 더 이상 필터 에지가 추가되지 않습니다. 그 후에도 여전히 제한을 초과하는 경우 분석이 중지되고 입력이 실패합니다. 제한을 사용 안함으로 설정하려면 값을 0으로 설정하십시오. 예시 값: 2500.
변환 논리 추출
SQL 스크립트에서 SQL 코드를 기반으로 변환 로직 설명을 생성하도록 설정할 수 있습니다.

자세히 보기