데이터 품질을 구축하고 이를 모니터할 수 있는 풍부한 기능을 제공

InfoSphere QualityStage 인터페이스의 스크린샷

IBM InfoSphere® QualityStage®는 데이터 품질과 정보 거버넌스 이니셔티브를 지원하도록 설계되었습니다. 이를 활용하면 데이터의 조사, 정리 및 관리가 가능하므로, 이는 고객, 벤더, 위치 및 제품을 포함한 주요 객체들의 일관된 뷰를 유지하는 데 도움이 됩니다. 이 솔루션은 빅데이터, 비즈니스 인텔리전스, 데이터 웨어하우징, 애플리케이션 마이그레이션 및 마스터 데이터 관리 프로젝트를 위한 고품질 데이터를 제공하는 데 도움이 됩니다. 이는 IBM System z®에도 사용 가능합니다.

"인라인 주소 데이터 품질이 AI를 위한 비즈니스용 데이터를 제공하는 방법"

"인라인 주소 데이터 품질이 AI를 위한 비즈니스용 데이터를 제공하는 방법" 블로그 게시물 읽기(IBM 외부 링크)

IBM InfoSphere QualityStage의 이점

고품질 데이터

데이터 프로파일링, 표준화, 확률적 일치 및 데이터 보강을 포함한 기능을 제공합니다.

통합 플랫폼

전체 정보 통합 플랫폼의 일부로서 데이터 품질 기능을 제공합니다.

정보 거버넌스에 대한 지원

조직간 기능을 통해 정보 거버넌스 정책을 지원할 수 있도록 지원합니다.

InfoSphere QualityStage의 주요 기능

심층 데이터 프로파일링

심층 데이터 프로파일링과 분석을 사용하여 테이블과 파일의 콘텐츠, 품질 및 구조를 보다 잘 이해할 수 있도록 합니다. 여기에는 컬럼 분석, 데이터 분류, 데이터 품질 점수, 관계 분석, 다중 컬럼 기본 키 분석 및 오버랩 분석이 포함됩니다.

200개 이상의 내장형 데이터 품질 규칙

데이터를 변환할 때와 이를 데이터 웨어하우스, 데이터 레이크 또는 애플리케이션에 로드하기 전에 데이터 품질 규칙을 실행하여 "오류" 데이터의 수집을 통제합니다. 200개 이상의 내장형 제공 규칙을 사용함으로써 데이터의 신뢰성 보장을 위해 수정될 수 있도록 올바른 사용자에게 데이터를 라우팅합니다.

250개 이상의 내장형 데이터 클래스

개인 식별 정보(PII), 민감한 기타 클래스의 데이터가 저장된 위치를 식별합니다. 또한 신용카드, 납세자 ID 및 전화번호(미국)를 포함한 250개 이상의 내장형 데이터 클래스를 사용하여 컬럼 내에 포함된 데이터의 유형을 식별할 수도 있습니다. 유효값 목록, 정규식(regex) 및 Java 클래스 등 세 가지 유형의 데이터 클래스를 작성하고 이를 사용자 정의합니다.

데이터 표준화 및 레코드 일치

다양한 소스에서 가져온 모든 데이터를 대상 환경의 공통 형식 또는 표준으로 합성합니다. 중복을 제거하고 다수의 시스템을 단일 뷰로 병합함으로써 신뢰할 수 있는 정확한 데이터를 구축합니다.

내장형 거버넌스

예외 관리를 위한 데이터 규칙의 적용을 지원하기 위해 정보 거버넌스에 링크되지 않은 규칙들도 보여주는 "데이터 규칙별 상태 요약" 보고서를 활용합니다.

온프레미스 또는 클라우드 배치

유연한 배치 옵션과 구독 가격 책정을 통해 프라이빗 또는 퍼블릭 클라우드로 전환합니다. 온프레미스 용량을 확장하거나 클라우드로 바로 이동할 수 있습니다. 보다 빠른 가치 구현 시간을 실현하고, 관리 비용을 절감하며, 구독 비용 리스크를 낮춥니다.

머신 러닝을 통한 자동 비즈니스 용어 지정

컬럼 이름과 데이터 클래스를 사용하여 해당 컬럼에 대한 용어를 지정하고 제안함으로써 가속화된 메타데이터 분류 프로세스(자동 태깅)에 머신 러닝을 활용합니다.

관심을 가질만한 내용

IBM InfoSphere Information Server for Data Quality

통합 환경에서 데이터를 정리하고 데이터 품질을 모니터합니다.

IBM BigQuality

Hadoop 빅데이터 스토리지 클러스터를 위한 데이터 품질, 프로파일링, 정리 및 모니터링 기능의 다양한 세트를 제공합니다.

IBM Watson® Knowledge Catalog

데이터 관리자가 비즈니스용 데이터를 빠르게 찾고 이를 정리, 분류, 통제, 분석 및 공유할 수 있도록 지원하는 거버넌스 플랫폼과 통합되고 Watson™으로 구동되는 엔터프라이즈 데이터 카탈로그입니다.