Microsoft SQL Server 계보 구성

Microsoft SQL Server 에서 계보 메타데이터를 가져오려면 연결, 데이터 소스 정의 및 메타데이터 가져오기 작업을 생성하십시오.

이 정보는 IBM Manta Data Lineage 서비스에 적용됩니다.

Microsoft SQL Server 의 계보 메타데이터를 가져오려면 다음 단계를 따르십시오:

  1. 데이터 소스 정의를 생성합니다.
  2. 프로젝트에서 데이터 소스 연결을 생성합니다.
  3. 메타데이터 가져오기를 생성합니다.

데이터 소스 정의 만들기

데이터 소스 정의를 생성합니다. 데이터 소스 유형으로 ‘ Microsoft SQL Server ’를 선택하십시오.

Microsoft SQL Server 에 연결하기

프로젝트에서 데이터 소스 연결을 생성합니다. 연결에 대한 자세한 내용은 Microsoft SQL Server connection을 참조하십시오.

메타데이터 가져오기 생성

메타데이터 가져오기를 생성합니다. Microsoft SQL Server 데이터 소스에 특화된 옵션에 대해 자세히 알아보세요:

포함 목록 및 제외 목록

스키마 레벨까지 자산을 포함하거나 제외할 수 있습니다. 데이터베이스/스키마 형식으로 데이터베이스와 스키마를 제공하십시오. 각 부분은 정규식으로 평가됩니다. 데이터 소스에서 나중에 추가되는 자산도 목록에 지정된 조건과 일치하는 경우 포함되거나 제외됩니다. 예제 값:

  • myDB/: 데이터베이스 myDB 내의 모든 스키마.
  • myDB2/.*: 데이터베이스 myDB2 내의 모든 스키마.
  • myDB3/mySchema1: mySchema1myDB3 데이터베이스의 스키마.
  • myDB4/mySchema[1-5]: myDB4 데이터베이스 내의 이름이 로 시작하고 1에서 5 mySchema 사이의 숫자로 끝나는 모든 스키마.

외부 입력

Microsoft SQL Server 에서 외부 SQL 및 T-SQL 스크립트를 사용하는 경우, 이를.zip 파일로 압축하여 외부 입력으로 추가할 수 있습니다. 데이터베이스 및 스키마를 나타내는 서브폴더로 .zip 파일의 구조를 구성할 수 있습니다. 스크립트를 스캔한 후에는 선택한 카탈로그 또는 프로젝트의 각 데이터베이스 및 스키마 아래에 추가됩니다. .zip 파일은 다음과 같은 구조를 가질 수 있습니다:

    <database_name>
        <schema_name>
           <script_name.sql>
    <database_name>
        <script_name.sql>
    <script_name.sql>
    replace.csv
    linkedServerConnectionsConfiguration.prm

replace.csv 파일에는.zip 파일에 포함된 스크립트에 대한 자리 표시자 대체 내용이 담겨 있습니다. 이 형식에 대한 자세한 내용은 ‘자리 표시자 대체’를 참조하십시오.

linkedServerConnectionsConfiguration.prm 파일에는 연결된 서버 연결 정의가 포함되어 있습니다. 다음 구조는 단일 연결을 정의합니다:

[{Shortcut_Name}] Type={connection_type}
Connection_String={connection_string}
Server_Name={server_name}
Database_Name={database_name}
Schema_Name={schema_name}
User_Name={user_name}

고급 가져오기 옵션

확장 속성 추출
열의 기본 키, 고유 제약 조건 및 참조 무결성 제약 조건과 같은 확장 속성을 추출할 수 있습니다. 기본적으로 이러한 속성은 추출되지 않습니다.
추출 모드
가져온 메타데이터에 대해 어떤 추출 모드를 사용할지 선택할 수 있습니다. 다음과 같은 옵션이 제공됩니다.
  • 프리페치: 관계형 데이터베이스에 사용하십시오.
  • 병렬 대량: 분석 처리 엔진에 사용하십시오.
  • 단일 스레드: 추출 중 병렬 처리와 대규모 쿼리를 피하기 위해 사용합니다. 이 모드를 선택하면 성능이 저하될 수 있습니다.
성능 프로파일
선택한 데이터 소스에 대해 성능 프로필을 선택할 수 있습니다. 현재 상황에 따라 계보 메타데이터 가져오기 작업이 더 빠르거나 더 완벽하게 수행될 수 있습니다. 다음 프로필 중에서 선택할 수 있습니다:
  • 고속 : 이 프로필에서는 처리 시간과 메모리 사용량을 최소화하는 것이 최우선입니다. 입력 데이터가 방대할 경우, 계보가 완전하지 않을 수 있습니다.
  • 균형 잡힌 : 성능과 계보의 완결성 모두 중요합니다. 이는 계보의 완전성과 계보 가져오기에 소요되는 시간 및 메모리 사이의 절충안입니다.
  • 완전성 : 이 프로필에서는 계보의 완전성이 최우선 순위입니다. 입력 데이터의 양이 많을 경우, 계보 가져오기 작업에 상당한 리소스와 시간이 소요될 수 있습니다.
  • 사용자 지정 프로필 : 다음 속성에 값을 입력하여 나만의 성능 프로필을 생성할 수 있습니다:
    • 데이터 흐름 분석 시간 초과 제한 : 단일 입력에 대한 데이터 흐름 분석이 중단되는 최대 예상 시간(초 단위)을 지정합니다. 각 노드가 추가될 때 또는 경우에 따라 에지가 작성될 때 시간이 확인됩니다. 따라서 경우에 따라 제한시간 초과가 지정된 제한을 약간 초과할 수 있습니다. 값을 0으로 설정하면 분석이 중단되지 않습니다. 예시 값: 60.
    • 데이터 흐름 분석 에지 제한 : 데이터 흐름 분석 시 단일 입력에 대해 허용되는 최대 에지 수를 지정합니다. 이 제한을 초과하면 모든 필터 에지가 제거되고 더 이상 필터 에지가 추가되지 않습니다. 그 후에도 여전히 제한을 초과하는 경우 분석이 중지되고 입력이 실패합니다. 제한을 사용 안함으로 설정하려면 값을 0으로 설정하십시오. 예시 값: 2500.
변환 논리 추출
SQL 스크립트에서 SQL 코드를 기반으로 변환 로직 설명을 생성하도록 설정할 수 있습니다.

자세히 보기