정의

데이터 관리의 개념

데이터 거버넌스는 엔터프라이즈 데이터 관리를 지원하기 위한 정책, 프로세스 및 조직 구조로 구성됩니다. 데이터 거버넌스 프로그램의 구조는 특히 회사 규모가 확장되면서 더 많은 데이터 소스와 자산이 축적됨에 따라 이해관계자 사이에서 조직의 데이터에 관한 이해, 보안 및 신뢰를 제공합니다. 새로운 데이터가 기하급수적으로 증가하는 상황에서, 기업은 데이터 레이크와 같은 스토리지 및 액세스 목적에 적합한 빅 데이터 환경을 결정해야 하며, 그와 같은 소스를 관리하고 통합하여 조직 전체에서 사용할 수 있도록 할 데이터 아키텍처를 설계해야 합니다. 이 데이터 통합은 다양한 팀의 워크플로우와 의사결정에 영향을 미치므로 점점 더 중요해지고 있습니다.

데이터 거버넌스는 데이터 관리를 위한 조직의 전반적인 전략과 완전한 DataOps 실행의 일부로서 필수적입니다. 또한, 보유한 데이터, 데이터 위치, 데이터 용도를 파악하는 데 도움이 됩니다. 데이터 거버넌스는 분석 및 성장 이니셔티브를 가속화하기 위해 정의된 규칙 및 프로세스 준수를 통해 비즈니스에 적합한 데이터의 토대가 됩니다.

데이터 거버넌스와 IBM

통합 데이터 카탈로그가 있는 데이터 거버넌스 플랫폼은 조직에서 AI 이니셔티브를 지원하기 위해 데이터 찾기, 큐레이팅, 분석, 준비, 공유에 도움을 줄 수 있습니다. IBM 데이터 거버넌스 솔루션은 데이터 파이프라인이 민감한 데이터를 카탈로그, 보호, 관리하는 데 도움이 되고 데이터 계보를 추적할 준비가 되도록 보장해 줍니다.

IBM을 선택해야 하는 이유

IBM Watson Knowledge Catalog

활성 메타데이터 및 정책 관리로 뒷받침되는 데이터 카탈로그를 사용하여 AI 및 분석을 위해 비즈니스용으로 준비된 데이터를 활성화합니다. 동료가 큐레이팅, 분류, 관리, 분석, 사용할 데이터를 찾도록 돕습니다.

데이터 거버넌스에 관한 자세한 내용

데이터 거버넌스의 이점

이해관계자는 데이터를 보호하면서 보다 깊은 인사이트를 얻을 수 있는 강력한 데이터 거버넌스 방식으로 교차 조직의 성공을 달성할 수 있습니다.

데이터 보안 및 규제 준수 향상

다양한 유형의 데이터가 데이터를 둘러싼 다양한 권한이나 규칙을 가질 수 있는데, 특히 그 데이터에 개인 식별 정보(PII)가 포함된 경우 더욱 그러합니다. 데이터 거버넌스 실행은 보안 및 규제 준수를 촉진하여 기업에서 위반 및 벌금의 위험을 줄이는 데 도움이 되고 고객의 신뢰를 보호하는 데 도움이 될 수 있습니다. 데이터 거버넌스 실행은 어떤 PII가 어디에 존재하는지 파악하는 데 도움이 되고, 정책 및 메타데이터 관리를 통해 규제 준수를 자동화할 수 있습니다.  

개인정보 보호 규정은 유럽 시민들에게 특히 인터넷상에서의 데이터 개인정보 보호를 보장하는 유럽 개인정보보호규정(GDPR)과 같이 세계적으로 적용되는 규제와 함께 점점 더 강화되는 방향으로만 나아가고 있습니다. 그 밖에도, 환자와 그들의 개인 건강 정보를 보호하기 위한 HIPAA(Health Insurance Portability and Accountability Act)와 같이 더 많은 산업별, 지역별 규정이 있습니다. 점점 증가하는 데이터 중심의 마케팅과 원격 작업으로 더욱 박차가 가해지고 있는 규제 준수 규정은 고객이 데이터 권리를 더 잘 알게 되고 기업이 점점 가중되는 평판 훼손 위험에 대응하면서 점점 더 보편화되고 있습니다.

향상된 데이터 품질

비즈니스 인텔리전스 도구는 이런 도구에 제공되는 데이터의 품질만큼만 좋을 뿐입니다. 기본 데이터가 올바르게 정리 및 관리되지 않았으면 사용자가 정보에 입각한 비즈니스 의사결정을 내리는 능력이 제한을 받을 수 있습니다. 또한, 데이터는 종종 다양한 데이터 소스에서 풀링되며 이 경우 불일치가 분석 및 기타 중요 프로젝트를 방해할 수 있습니다. 데이터 거버넌스는 시스템 전체에서 정보를 연결하여 의미 있는 관계를 식별해 조직의 데이터를 최대한 활용하고 중요한 데이터가 남겨지지 않도록 보장하는 데 도움이 됩니다.

가속화된 자동화

분석 팀은 데이터 구성과 품질을 유지하는 방법과 도구를 사용하여 머신 러닝 알고리즘으로 특정 작업과 프로세스를 혁신하고 자동화하기 시작할 수 있습니다. 예를 들어, 고객 데이터를 모델에 제공하여 영업 파이프라인 내에서 가망 고객의 우선순위를 지정할 방법을 결정할 수 있습니다. 데이터 거버넌스 실행은 고객 데이터가 정확하고 보호되도록 보장하므로 팀은 큰 성장과 더 많은 타겟 판매를 달성할 수 있습니다.

데이터 거버넌스 관련 역할

몇 가지 역할이 데이터 거버넌스의 실행에 관건입니다. 시간이 지나면서 표준을 만들고 유지 관리하여 데이터 규제 준수, 보안, 데이터 품질 및 자동화 목표를 뒷받침하도록 보장하는 세 가지 역할이 있습니다.

최고 데이터 책임자

경영진에 최고 데이터 책임자(CDO)와 같은 멤버가 포진해 있다는 것은 우선순위 지정을 통해 조직에 대한 데이터 거버넌스 프로그램의 중요성을 잘 말해줍니다. CDO는 교차 기능 위원회의 발전에 핵심적 역할을 하는데, 이 위원회는 보통 다양한 분야나 제품 포트폴리오의 필요성과 관심사를 대변하는 다양한 사업 단위의 멤버로 구성됩니다. 이 위원회는 새로운 데이터 거버넌스 이니셔티브를 전달하고 합의된 일정과 결과를 달성하기 위한 책임을 할당하는 포럼의 역할을 합니다.

데이터 소유자

데이터 소유자는 데이터의 상태를 담당합니다. 데이터 소유자는 보통 고객 또는 재무 데이터와 같이 자신이 관리하는 데이터 유형에 따라 지정되며, 그들의 역할은 데이터 정확성 및 유용성을 유지하는 것입니다. 특히 규제 요구 사항과 관련된 경우 일반적인 작업에는 데이터 문제 해결, 데이터 정의 승인, 데이터 권장 사항 제공이 포함됩니다.

데이터 담당자

데이터 분야 관련 주제 전문가(SME)로, 조직 전반에 걸쳐 데이터 정책에 영향을 미치고 데이터 거버넌스를 옹호합니다. 그들은 비즈니스 프로세스 또는 의사결정을 위한 특정 데이터 요소의 중요성을 전달할 수 있으므로, 보고 목적으로 올바른 데이터가 표시되도록 보장하기 위해 데이터베이스 테이블의 구조에 영향을 줄 수도 있습니다. 하지만 전체적으로, 데이터 관리는 데이터 품질 유지에 있어 이해관계자가 자신의 역할에 계속 책임을 지도록 하는 데 도움이 됩니다.

데이터 거버넌스 프레임워크

특히 디지털 변환 프로젝트의 성장으로 인해 데이터 거버넌스 실행의 채택률이 수년간에 걸쳐 증가해왔습니다. 데이터 거버넌스 이니셔티브에서 성공적인 결과를 달성할 수 있도록, 다음과 같은 여러 구성요소를 포함해야 합니다.

데이터 표준

비즈니스 및 데이터 정의를 명확히 하기 위해 데이터 사전, 분류법 및 비즈니스 용어집을 개발해야 합니다. 이 문서는 대화, 특히 메트릭 및 보고를 포함하는 대화의 혼동을 줄이는 데 도움이 됩니다. 또한 이해관계자에게 데이터 아키텍처에 대한 가시성을 제공하여 팀이 자체적으로 혁신하여 해당 분야 프로세스를 자동화할 수 있도록 합니다.

데이터 프로세스 및 조직 구조

데이터 거버넌스 프로세스는 조직 내에서 데이터가 처리되는 방식과 관련된 최종 사용자에게 투명성을 제공합니다. 이는 데이터 새로 고침 케이던스, PII 제한, 규제 데이터 정책 또는 데이터 액세스만큼 단순한 것까지도 포함할 수 있습니다. 또한, 이 유형의 문서는 데이터의 관리와 유지보수에 관련되어 있으므로 다양한 역할의 책임을 명확히 함으로써 조직 구조도 지원합니다.

기술

메타데이터 관리 플랫폼과 같은 다양한 데이터 거버넌스 도구는 데이터 관련 프로세스와 표준을 지원합니다. 이러한 도구는 조직이 관리하는 데이터에 관한 정보를 저장하고 보호할 수 있습니다. 여기에는 비즈니스 정의, 데이터 로그, 데이터 소유자, 데이터베이스 정보(예: 데이터베이스 및 테이블 이름, 서버 위치, 데이터 형식 등)에 관한 문서가 포함될 수 있습니다. 또한 셀프서비스 데이터 분석 도구로 피드하여 분석가가 보고 또는 혁신 프로젝트를 위한 다양한 데이터 세트를 쿼리하고 시각화하도록 할 수 있습니다.

추천 데이터 거버넌스 리소스

사용 후기

관심을 가질만한 제품

IBM Cloud Pak® for Data

온프레미스 또는 클라우드 상에서 데이터를 통합하고 소스에서 보다 안전하게 유지하는 유연한 멀티클라우드 데이터 플랫폼입니다.

IBM® DataStage®

데이터를 이동 및 변환하는 작업을 설계, 개발 및 실행하는 데 사용되는 고도로 확장 가능한 데이터 통합 도구로서, 온프레미스 환경과 모든 클라우드에 배치할 수 있습니다.

IBM InfoSphere Advanced Data Preparation

데이터에 셀프서비스 액세스를 제공하는 소프트웨어. 자동화된 변환으로 데이터 분석을 보다 신속하게 시작합니다.

다음 단계