데이터 거버넌스의 개념
데이터 거버넌스를 통해 기업이 데이터 자산을 최대한 활용할 수 있는 방법을 알아봅니다.
임상 환경에서 태블릿 컴퓨터를 사용 중인 의료진
데이터 거버넌스의 개념

데이터 거버넌스는 다양한 정책과 표준을 통해 조직 데이터의 가용성, 품질 및 보안성을 높입니다. 이러한 프로세스는 데이터 소유자, 데이터 보안 조치, 데이터의 의도된 용도를 결정합니다. 종합적으로 볼 때, 데이터 거버넌스의 목표는 심도 있는 비즈니스 인사이트를 도출하기 위해 안전한 방식으로 손쉽게 액세스 가능한 고품질의 데이터를 유지 관리하는 것입니다.

빅데이터 및 디지털 혁신을 위한 노력은 데이터 거버넌스 프로그램의 주요 동인입니다. 사물 인터넷(IoT) 기술과 같은 새로운 데이터 소스에서 생성되는 데이터의 양이 증가함에 따라 조직은 비즈니스 인텔리전스를 확장하기 위해 데이터 관리 방식을 재고해야 합니다. 효과적인 데이터 거버넌스 프로그램은 데이터 품질을 개선하고, 데이터 사일로를 해소하며, 규정 준수 및 보안을 보장하고, 데이터 액세스 권한을 적절하게 배포할 수 있어야 합니다.

데이터 거버넌스와 데이터 관리 비교

데이터 관리의 범위가 데이터 거버넌스보다 더 넓습니다. 데이터 관리는 조직의 데이터를 수집, 처리, 보안 및 저장한 다음 비즈니스 성과를 개선하기 위해 전략적 의사결정에 활용하는 방식으로 정의할 수 있습니다. 여기에는 데이터 거버넌스가 포함되지만 데이터 처리, 데이터 저장 및 데이터 보안과 같은 데이터 관리 수명주기의 다른 영역도 포함됩니다. 이처럼 데이터 관리의 다른 영역도 데이터 거버넌스에 영향을 줄 수 있으므로 관련 팀은 데이터 거버넌스 전략에 따라 운영되도록 협력해야 합니다. 예를 들어 데이터 거버넌스 팀은 서로 다른 데이터 세트에서 공통점을 식별할 수 있지만, 이들을 통합하려면 데이터 관리 팀과 협력하여 이러한 연결을 용이하게 하는 데이터 모델 및 데이터 아키텍처를 정의해야 합니다. 또 다른 예로 데이터 액세스를 들 수 있는데, 여기서는 데이터 거버넌스 팀이 특정 유형의 데이터(예: 개인 식별 정보(PII))에 대한 데이터 액세스 정책을 설정할 수 있지만, 데이터 관리 팀이 해당 액세스를 직접 제공하거나 이를 제공하기 위한 메커니즘을 설정합니다(예: 액세스를 승인하기 위해 내부적으로 정의된 사용자 역할 활용).  

데이터 거버넌스의 이점

데이터 거버넌스 프레임워크를 구현하면 조직 내 데이터의 가치를 높일 수 있습니다. 데이터 거버넌스는 데이터 정확성을 전반적으로 개선하는 데 도움이 되므로 단순하고 일상적인 비즈니스 의사결정부터 복잡한 자동화 이니셔티브에 이르기까지 다양한 데이터를 기반으로 하는 성과에도 영향을 미칩니다. 기타 주요 이점은 다음과 같습니다.

  • 확장성 및 데이터 활용 능력 향상 - 조직 전반의 데이터 액세스를 제한하면 혁신을 제한하고 비즈니스 프로세스에서 각 분야 전문가(SME)에 대한 종속성을 야기할 수 있습니다. 데이터 거버넌스 관행은 여러 기능 팀이 함께 시스템 전반의 데이터를 분명하게 이해하고 공유할 수 있는 방식을 만듭니다(예: 도메인에 구애받지 않는 데이터의 차이 조정). 이러한 공유된 이해는 데이터 정의와 메타데이터가 중앙의 한 곳(예: 데이터 카탈로그)에서 문서화되는 데이터 표준을 통해 나타날 수 있습니다. 이러한 문서화는 결과적으로 API와 같은 셀프 서비스 솔루션의 기반이 되어 조직 전체에서 데이터의 일관성을 높이고 액세스를 통합할 수 있습니다.   
  • 보안, 데이터 개인정보 보호 및 규정 준수 보장 – 데이터 거버넌스 정책은 EU 일반 개인 정보 보호법(GDPR), 미국 건강 보험 이동성 및 책임법(HIPAA), 지불 카드 산업 데이터 보안 표준(PCI DSS)과 같은 업계 요구사항 등 민감한 데이터 및 개인정보 보호와 관련된 정부 규제의 요구사항을 충족하는 방법을 제공합니다. 이러한 규제 요구사항을 위반하면 정부에서 무거운 벌금을 부과하거나 대중의 반발을 받을 수 있습니다. 이를 피하기 위해 기업은 데이터 거버넌스 도구를 도입하여 데이터 침해 및 데이터 오용을 방지하는 가드레일을 설정합니다.
  • 고품질 데이터 – 데이터 거버넌스는 데이터 무결성, 데이터 정확성, 완전성 및 일관성을 보장합니다. 고품질의 데이터를 통해 기업은 워크플로우와 고객은 물론 전반적인 비즈니스 성과를 최적화하는 방법을 보다 정확하게 이해할 수 있습니다. 그러나 성과 지표의 오류는 조직을 잘못된 방향으로 이끌 수 있지만 데이터 거버넌스 도구는 잠재적인 부정확성을 해결할 수 있습니다. 예를 들어 데이터 계보 도구는 데이터 소유자가 수명주기 동안 데이터를 추적하는 데 도움이 될 수 있습니다. 여기에는 ETL 또는 ELT 프로세스 중에 적용된 소스 정보 또는 데이터 변환이 포함됩니다. 이를 통해 데이터 오류의 근본 원인을 면밀히 검사할 수 있습니다.
  • 데이터 분석 촉진 – 고품질의 데이터는 고급 데이터 분석 및 데이터 사이언스 이니셔티브의 기반을 마련합니다. 여기에는 비즈니스 인텔리전스 보고 또는 복잡한 예측 머신 러닝 프로젝트가 포함될 수 있습니다. 이들은 주요 이해 관계자가 기본 데이터를 신뢰하는 경우에만 우선순위를 지정할 수 있으며, 그렇지 않은 경우 활용되지 않을 수 있습니다.
데이터 거버넌스의 당면 과제

데이터 거버넌스의 이점은 명확하지만 데이터 거버넌스의 몇 가지 장애 요소를 극복해야 성공을 거둘 수 있습니다. 이러한 당면 과제 중 일부는 다음과 같습니다.

  • 조직적 조정: 데이터 거버넌스 프로그램을 시작할 때 가장 큰 문제 중 하나는 핵심 데이터 자산이 무엇이고 각각의 정의 및 형식이 어떠해야 하는지를 중심으로 조직 전체의 이해 관계자 간의 의견을 조정하는 것입니다. 규제 정책은 고객 데이터에 대한 대화를 중심으로 어느 정도 구조화할 수 있지만 제품별 데이터가 더 많은 경우 등 마스터 데이터 관리(MDM)에 해당하는 다른 데이터 세트에 대해서는 합의하기가 더 어려울 수 있습니다.
  • 적절한 후원 부족: 우수한 데이터 거버넌스 프로그램에는 일반적으로 경영진 수준과 개별 기여자 수준의 두 가지 수준에서 후원이 필요합니다. 최고 데이터 책임자(CDO)와 데이터 관리자는 조직 내 데이터 거버넌스에 관한 의사소통 및 우선순위 지정 시 중요한 역할을 합니다. CDO는 데이터 거버넌스 정책이 효과적으로 적용될 수 있도록 전체 데이터 팀을 감독하고 책임을 강화할 수 있습니다. 데이터 관리자는 데이터 생산자와 데이터 소비자가 이러한 정책에 대한 인식을 제고하도록 하여 조직 전체의 규정 준수를 장려할 수 있습니다.
  • 관련 데이터 아키텍처 및 프로세스 - 올바른 도구와 데이터 아키텍처가 없으면 기업은 효과적인 데이터 거버넌스 프로그램을 배포하는 데 어려움을 겪을 것입니다. 예를 들어 팀은 여러 기능 간에 중복 데이터를 발견할 수 있지만 데이터 설계자는 스토리지 시스템 전체에서 데이터를 병합하고 통합하기 위해 적절한 데이터 모델과 데이터 아키텍처를 개발해야 합니다. 또한 팀은 데이터 카탈로그를 적용하여 전사적으로 데이터 자산 인벤토리를 생성해야 할 수도 있고, 데이터 자산 인벤토리가 이미 있는 경우 메타데이터 관리 프로세스를 설정하여 기본 데이터가 관련성이 있고 최신 상태인지 확인해야 할 수도 있습니다.
IBM 솔루션
IBM Cloud Pak for Data

데이터 패브릭 아키텍처로 구축된 플랫폼을 사용하여 결과를 보다 빠르게 예측합니다. 데이터가 있는 위치에 관계없이 데이터를 수집, 구성 및 분석할 수 있습니다.

IBM Cloud Pak for Data
IBM Watson Knowledge Catalog

활성 메타데이터 및 정책 관리에서 지원하는 지능형 카탈로그를 사용하여 AI 및 분석을 위한 비즈니스용 데이터를 활성화합니다.

IBM Watson Knowledge Catalog
다음 단계

IBM Cloud Pak for Data는 마이크로서비스와 선도적인 데이터 및 AI 기능을 활용하여 분산 시스템 전반의 데이터에 대한 지능적인 통합을 자동화하여 기업이 비즈니스 성과를 종합적으로 볼 수 있도록 해 줍니다. 이를 기반으로 기업은 엔터프라이즈 데이터를 더 빠르게 수집하고 구성한 후 인사이트를 도출하여 대규모 의사결정을 내릴 수 있습니다. 또한 데이터 관리 팀은 IBM의 경쟁력 있는 보안 프레임워크 덕분에 데이터의 안전성을 신뢰할 수 있으므로 규제 정책을 준수하고 규정 준수 위험을 줄일 수 있습니다. IBM Cloud Pak® for Data 및 IBM Streams가 여러 환경에서 비즈니스의 데이터 거버넌스를 이해하고 관리하는 데 어떻게 도움이 되는지 알아봅니다.

IBM Cloud Pak for Data 자세히 보기