자주 묻는 질문

IBM Watson® Knowledge Catalog란?

IBM Watson Knowledge Catalog는 머신 러닝 모델과 정형 및 비정형 데이터를 포함한 지식 및 분석 자산을 위치에 상관없이 카탈로그화할 수 있는 클라우드 기반 엔터프라이즈 메타데이터 저장소입니다. 이를 통해 이러한 자산에 더 쉽게 액세스하고 데이터 과학 및 모든 형태의 AI를 촉진하는 데 사용할 수 있습니다.

선택한 원본 유형의 경우, IBM Watson Knowledge Catalog는 제공된 연결을 통해 데이터 자산을 자동으로 검색하고 등록할 수 있습니다. 자산이 카탈로그에 추가되면 자동으로 색인 및 분류되므로 데이터 엔지니어, 데이터 과학자, 데이터 관리자 및 비즈니스 분석가와 같은 사용자가 자산을 쉽게 발견/이해/공유/사용할 수 있습니다. AI 기반 검색 및 추천은 자산 간의 관계, 자산이 어떻게 사용되는지, 사용자 간의 사회적 연결에 대한 이해를 바탕으로 카탈로그에서 가장 관련성이 높은 자산으로 사용자를 안내합니다.

또한 IBM Watson Knowledge Catalog는 정확한 데이터가 필요한 사람에게 전달되도록 하기 위해 데이터 및 액세스 정책을 정의 및 시행할 수 있는 지능적이고 강력한 거버넌스 프레임워크를 제공합니다.

IBM Watson Knowledge Catalog 비즈니스 용어집을 통해 사용자는 공통 비즈니스 어휘를 작성하고 이를 자산, 정책 및 규칙에 연결하여 비즈니스 도메인과 기술 자산을 연결할 수 있습니다.

IBM Watson Knowledge Catalog를 배포할 수 있는 지역은 어디인가요?

지역별 데이터 제한이 있는 경우, 달라스, 런던, 프랑크푸르트 또는 도쿄 중 하나에 배포할 수 있습니다.

데이터를 IBM Watson Knowledge Catalog로 이동해야 하나요?

아니요. 기존 리포지토리에 데이터를 보관할 수 있습니다. Watson Knowledge Catalog는 자산의 메타데이터를 저장합니다.

어떤 데이터 소스 및 자산 유형이 지원되나요?

IBM은 30개 이상의 커넥터를 클라우드 또는 사내 구축형 데이터 소스에 제공하여 원격 데이터 자산에 연결할 수 있도록 해줍니다. 예를 들어, 클라우드 또는 사내 구축형의 IBM® Db2®, IBM Cloudant®, IBM Cloud® Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase 등의 커넥터를 IBM이 제공합니다.

IBM Watson Knowledge Catalog는 원격 데이터 소스의 자산 외에도 정형(행/열), 반정형 및 비정형 데이터와 같은 다른 자산 유형을 지원합니다. 예를 들어, CSV, Microsoft Excel, PDF, Text, Microsoft Word, Jupyter Notebook(IPYNB), 이미지 및 HTML 파일 등을 카탈로그에 추가하여 프로파일링하고 다른 사용자와 공유할 수 있습니다.

IBM Watson Knowledge Catalog에서 보유할 수 있는 최대 자산 수는 어떻게 되나요?

프로페셔널 플랜에서는 IBM Watson Knowledge Catalog에 보유할 수 있는 자산 수에 제한이 없습니다. 스탠다드 플랜과 라이트 플랜의 경우, 한도는 각각 자산 1,000개와 50개입니다.

IBM Watson Knowledge Catalog는 거버넌스 서비스를 제공하나요?

IBM Watson Knowledge Catalog에는 정책과 수행된 작업에 따라 결과를 결정하는 자동화된 정책 시행 엔진이 포함되어 있습니다. IBM Watson Knowledge Catalog는 중요한 내용을 마스킹하여 데이터에 대한 액세스를 제한하거나 데이터를 변환할 수 있도록 시스템 내에서 거버넌스 정책을 설정할 수 있는 기능을 제공합니다.

데이터를 마스킹하는 데이터 정책으로 원래 데이터 소스를 삭제하거나 변경할 수 있나요?

아니요. 데이터 보호 정책이 카탈로그의 중요한 데이터를 익명화하면 응용프로그램에서 관리하는 미리 보기 데이터만 변환됩니다. 소스 데이터는 수정되지 않습니다.

IBM Watson Knowledge Catalog에 거버넌스 아티팩트를 관리하기 위한 주요 사례가 있나요?

이제 IBM Cloud Pack for Data v3.5의 IBM Watson Knowledge Catalog에서 사용자와 데이터 관리자를 카테고리에 할당하여 카테고리가 소유한 거버넌스 아티팩트의 확인 및 관리할 수 있는 사용자를 지정할 수 있습니다. 카테고리 협업자 역할을 워크플로우에서 활용하여 워크플로우 단계를 자동으로 적절한 사람에게 전달하여 검토 및 승인을 획득하는 것도 가능합니다. 이 새로운 기능을 통해 비즈니스 커뮤니티는 자체 비즈니스 자산을 자율적으로 관리할 수 있습니다.

거버넌스 아티팩트의 관리 기능을 계획하고 구현할 때 중요한 몇 가지 단계에 대해 알아보세요.

 

IBM Watson Knowledge Catalog는 분류 서비스를 제공하나요?

IBM Watson Knowledge Catalog는 데이터 자산이 카탈로그에 추가될 때 데이터 자산의 열을 자동으로 분류할 수 있습니다. 내장된 구성 요소는 이름, 이메일, 우편 주소, 신용카드 번호, 운전면허 번호, 정부 식별 번호, 생년월일, 인구 통계 정보, DUNS(Data Universal Numbering System) 번호 등을 포함하여 160개 이상에 대한 속성 분류기를 제공합니다. 또한 카탈로그는 비정형 데이터 자산을 프로파일링하고 범주, 개념, 정서 및 감정과 같은 콘텐츠에서 메타데이터를 추출합니다.

IBM Watson Knowledge Catalog에 데이터 준비 기능이 있나요?

예. 데이터 준비 기능은 IBM Watson Knowledge Catalog의 일부인 IBM Data Refiner를 통해 제공됩니다. Data Refiner는 기본 제공 작업을 통해 데이터를 검색, 정리 및 변환할 수 있는 다양한 기능을 제공합니다. 또한 데이터와 상호 작용하고 이해에 도움을 주는 차트, 그래프 및 통계와 같은 강력한 프로파일링 및 시각화 툴이 제공됩니다. IBM Watson Knowledge Catalog에 정의된 데이터 액세스 및 변환 정책도 Data Refiner에서 시행되어 통제된 카탈로그에서 생성된 중요한 데이터가 지속적으로 보호될 수 있도록 보장합니다.

참조 데이터 관리 기능에는 어떻게 액세스하나요?

참조 데이터 관리 기능에 액세스하려면 IBM Cloud Pak for Data 인스턴스에 로그인해야 합니다. 왼쪽 탐색줄에서 "거버넌스" 섹션의 "참조 데이터"에 액세스하세요.

참조 데이터 페이지에 들어가면 게시된 모든 목록과 시스템에 정의된 초안 참조 데이터 세트 목록이 표시됩니다. 먼저, 목록이 비어 있고 "참조 데이터 세트 추가" > "새 참조 데이터 세트"

버튼을 통해 새로운 참조 데이터 세트를 생성할 수 있습니다.

 

다른 사업 부문의 사람들을 위한 액세스 그룹을 설정할 수 있나요?

예. IBM Cloud® Identity 및 Asset Management를 통해 액세스 그룹을 설정하는 것이 가능합니다. IBM Watson Knowledge Catalog의 Access Control 모듈에서 협업자 또는 사용자 그룹을 추가할 수 있습니다.

용량 단위 시간(CUH)이란 무엇인가요?

Data Refinery 플로우, Data Refinery 대화형 UI 및 프로파일링 작업은 각 용량 유형에 대해 시간당 필요한 전체 또는 용량 단위 수에 대해 과금됩니다.

  • Data Refinery 플로우에는 기본 Spark 환경에서 시간당 1.5 용량 단위가 필요합니다. 다른 사용자 정의 환경에서는 Spark 드라이버와 실행기에 사용되는 실행자 수와 리소스 수에 따라 계산이 달라집니다.
  • Data Refiner 대화형 UI에는 시간당 1.5 용량 단위가 필요합니다. 이는 Refiner UI가 시작될 때 시작하여 종료될 때 종료됩니다.
  • 프로파일링 작업에는 시간당 6 용량 단위가 필요합니다. 각 작업 실행에는 최소 0.96(10분에 상당)의 요금이 적용됩니다.

해당 월의 각 계획에는 정해진 수의 여유 용량 단위 시간이 포함됩니다. 표준 및 프로페셔널 플랜의 경우, 해당 달의 플랜 제한에 도달한 후에 요금이 적용됩니다. 라이트 플랜의 경우, 해당 월의 플랜 제한에 도달한 후 다음 달까지 또는 플랜이 표준 또는 프로페셔널 플랜으로 업그레이드될 때까지 Data Refinery 플로우 또는 프로파일링 작업의 실행이 불가합니다.
기본 용량 유형 3을 사용한 Data Refinery 플로우 예제:

  1. 1시간 동안 하나의 Data Refinery 플로우가 실행됩니다. 1.5 CUH
  2. 두 개의 Data Refinery 플로우가 각각 1시간 동안 실행됩니다. 2시간 * 1.5 CUH = 3 CUH
  3. 30분 동안 하나의 Data Refinery 플로우가 실행됩니다. 0.5시간 * 1.5 CUH = 0.75 CUH
  4. 대화형 Data Refiner UI가 1시간 동안 사용됩니다. 1.5 CUH

프로파일링 예제(프로파일링 작업은 자동으로 또는 수동으로 트리거될 수 있음):

  1. 프로파일링 작업이 30분 동안 실행됩니다. 0.5시간 * 6CUH = 3CUH
  2. 프로파일링 작업이 9분 동안 실행됩니다. 이 시나리오에는 최소 요금이 적용됩니다. 0.16시간 * 6CUH = 0.96CUH

 

표준 또는 프로페셔널 플랜을 구입한 후, 제품을 최대한 활용하려면 얼마나 많은 설정이 필요한가요?

IBM Watson Knowledge Catalog는 모두 셀프 서비스이므로 관리자는 카탈로그를 만든 다음 자산을 즉시 추가하고 큐레이션할 수 있습니다. 추가 작업에는 다음이 포함될 수 있습니다.

  • 비즈니스 용어집 구축
  • 데이터 액세스를 제어하는 데이터 보호 정책 정의
  • 카탈로그에 사용자 초대

IBM Cloud Pak® for Data에서 사용할 수 있나요?

예. IBM의 통합 데이터 및 AI 플랫폼에 대해 자세히 알아보세요.

IBM Watson Knowledge Catalog 사용해 보기

지능형 카탈로그로 AI 및 분석을 위한 비즈니스 준비 데이터를 활성화하세요.