데이터 스튜어드십이란 무엇인가요?

두 사람이 함께 책상에 앉아 대형 컴퓨터 화면과 태블릿을 보고 있는 모습

작성자

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

데이터 스튜어드십이란 무엇인가요?

데이터 스튜어드십은 높은 데이터 품질과 접근성을 보장하기 위해 고안된 데이터 관리 관행의 모음입니다. 데이터 스튜어드십 프로그램은 일반적으로 조직의 데이터 거버넌스 정책에 따라 운영됩니다.
 

데이터 관리자는 데이터 스튜어드십 프로그램을 운영하는 일을 담당합니다. 구체적인 데이터 관리자의 책임에는 데이터 품질 메트릭 정의, 메타데이터 및 참조 데이터 관리, 데이터 리니지 추적, 민감한 데이터 분류 등이 포함됩니다.

인공 지능(AI), 데이터 카탈로그, 관계형 데이터베이스, 데이터 품질 플랫폼, 데이터 거버넌스 소프트웨어 등 다양한 기술과 툴이 데이터 관리자의 워크플로를 지원할 수 있습니다.

트랙에서 굴러가는 공의 3D 디자인

최신 AI 뉴스+인사이트


주간 Think 뉴스레터에서 전문가들이 선별한 AI, 클라우드 등에 관한 인사이트와 소식을 살펴보세요. 

데이터 관리가 중요한 이유는 무엇인가요?

오늘날 기업들은 가치 있는 인사이트를 얻기 위해 그 어느 때보다 많은 데이터를 수집하고 분석하고 있습니다. 그러나 데이터 수집 및 분석만으로는 성공적인 결과를 확보하기에 충분하지 않습니다. 데이터 스튜어드십과 데이터 관리자는 데이터 기반 문화 내에서 효과적인 데이터 사용을 지원하고 안내할 수 있습니다.

최근 몇 년 동안 AI의 도입이 증가하면서 데이터 관리의 중요성이 더욱 커지고 있습니다. AI 시스템은 방대한 양의 데이터를 소비하고 생산합니다. 데이터 스튜어드십은 데이터의 품질과 무결성을 보장하여 AI 기반 비즈니스 프로세스가 효과적이고 정부 규정을 준수하며 거버넌스 및 윤리적 AI 표준에 부합할 수 있도록 지원합니다.

우수한 데이터 관리 프로그램은 데이터 품질, 접근성, 유용성, 보안을 개선하여 성공적인 데이터 큐레이션을 가능하게 합니다. 데이터 관리자는 직원들이 유용하고 정확한 비즈니스 데이터에 액세스하여 데이터 기반 의사 결정과 AI 기반 생산성 향상을 지원할 수 있도록 지원합니다. 데이터 스튜어드십의 추가 이점으로는 보다 일관된 데이터 해석과 향상된 감사 준비 등이 있습니다.

데이터 관리자는 이러한 이점을 달성하기 위해 데이터 소유자, 데이터 분석가, 데이터 과학 전문가, 일반 비즈니스 사용자 등 다양한 이해관계자와 협력하는 경우가 많습니다.

공식적으로 '데이터 관리자'로 인정받지 못한 직원도 데이터 관리 책임이 있으며 데이터 인벤토리 작성, 데이터 품질 평가 등 조직의 데이터 요구 사항을 충족하는 데 상당한 시간을 할애할 수 있습니다. 그러나 일부 데이터 관리 전문가들은 데이터 관리 역할을 공식화하는 것이 중요하다고 말하는데, 이는 기업이 데이터 품질 관리에 대해 진지하게 고민하고 있다는 것을 의미하기 때문입니다.1

AI 아카데미

데이터 관리가 생성형 AI 구현의 비결일까요?

생성형 AI를 성공적으로 사용하기 위해 고품질 데이터가 필수적인 이유를 알아보세요.

데이터 스튜어드십과 데이터 거버넌스의 차이점은 무엇인가요?

데이터 거버넌스와 데이터 스튜어드십은 별개의 개념이지만 서로 연관된 개념입니다. 기업의 데이터 거버넌스 프로그램은 데이터 수집, 소유, 스토리지, 처리 및 사용에 대한 정책, 표준 및 절차를 통해 데이터 무결성 데이터 보안을 보장하는 데 도움이 됩니다. 많은 데이터 관리 책임에는 데이터 거버넌스 프레임워크에 명시된 규칙을 구현하는 것이 수반됩니다. 따라서 데이터 스튜어드십은 데이터 거버넌스의 '운영 측면'으로 간주할 수 있습니다.2

데이터 관리자에는 어떤 유형이 있나요?

보다 성숙한 데이터 스튜어드십 프로그램을 갖춘 회사는 다음과 같은 다양한 유형의 데이터 관리자 역할을 가질 수 있습니다.

  • 비즈니스 데이터 관리자: 비즈니스 데이터 관리자는 마케팅 또는 고객 서비스와 같은 특정 비즈니스 기능 내에서 데이터를 관리하는 것을 전문으로 합니다.

  • 기술 데이터 관리자: 직책에서 알 수 있듯이 기술 데이터 관리자는 추출, 변환 및 로드(ETL) 프로세스데이터 웨어하우스를 포함한 데이터 프로세스 및 시스템에 대한 기술적 전문 지식을 보유하고 있습니다.

  • 엔터프라이즈 데이터 관리자: 엔터프라이즈 데이터 관리자는 조직 내의 데이터 관리자 커뮤니티를 이끌고 다른 비즈니스 리더와의 연락 담당자 역할을 합니다.3

데이터 스튜어드십의 사용 사례에는 어떤 것이 있나요?

데이터 스튜어드십의 사용 사례는 다음과 같습니다.

  • Master Data Management
  • 데이터 품질 개선
  • 메타데이터 관리
  • 참조 데이터 관리
  • ID 확인
  • 정보 보안 및 데이터 개인정보 보호
  • 데이터 리니지 추적
  • 비즈니스 프로세스 위험 관리

Master Data Management

데이터 스튜어드십은 기술, 툴 및 프로세스를 통해 조직의 중요 데이터를 관리하는 접근 방식인 Master Data Management(MDM)의 핵심인 경우가 많습니다. 조직에서는 MDM을 사용하여 다양한 소스의 데이터를 통합하는 신뢰할 수 있는 단일 소스를 구축하고 모든 데이터 사용자가 동일한 정보로 작업할 수 있도록 합니다.

회사와 데이터 관리자는 조직의 데이터 자산 전체에 걸쳐 작업을 확장하기 전에 단일 데이터 도메인(고객 데이터나 직원 데이터와 같은 유사한 데이터의 논리적 그룹)에서 MDM 이니셔티브 구현을 시작하는 경우가 많습니다.4

데이터 품질 개선

데이터 관리자는 데이터베이스의 콘텐츠를 검토하여 데이터 품질을 개선할 수 있으며, 이를 데이터 프로파일링이라고 합니다. 또한 데이터 이해관계자와 협력하여 데이터 정의를 만들고, 데이터 품질 메트릭을 설계하며, 유효하거나 유효하지 않은 것으로 간주되는 값과 같은 데이터에 대한 비즈니스 규칙을 설정합니다.

예를 들어, '데이터 스튜어드십'이라는 책에서 설명한 것처럼 수집된 데이터가 고객의 결혼 상태인 경우 '미혼', '기혼', '사별' 또는 '이혼'은 유효한 값으로, 공란 응답은 유효하지 않은 것으로 간주하는 규칙이 있을 수 있습니다.5 또한 데이터 관리자는 데이터 품질 문제가 발생할 때 해결 방법에 대한 정보를 제공할 수 있습니다.

메타데이터 관리

메타데이터는 데이터의 생성 날짜나 작성자 세부 정보 등 데이터 포인트나 데이터 세트를 설명하는 정보입니다. 데이터 관리자는 고품질 메타데이터를 생성하고 기존 메타데이터의 품질을 평가할 수 있습니다. 일반적인 데이터 품질과 마찬가지로 데이터 관리자는 메타데이터 품질 문제를 해결해야 합니다.

참조 데이터 관리

데이터 관리자는 기업 내의 다른 데이터를 분류하는 데이터인 참조 데이터를 유지 관리하는 경우가 많습니다. 참조 데이터의 예로는 국가 코드, 통화 정보, 제품 코드 등이 있습니다. 데이터 관리자는 데이터 문서를 통해 참조 데이터의 유효한 값을 기록하고, 새로운 유효한 값이 필요한지 평가하고, 여러 시스템에서 참조 데이터 값을 조정할 수 있습니다.

후자의 경우 결혼 상태를 예로 들면, 데이터 관리자는 어떤 시스템에서는 '사별'과 '이혼'을 결혼 상태 데이터로 허용하고 다른 시스템에서는 '기혼'과 '미혼'만 허용하는 경우 어떤 조치를 취해야 할지 결정해야 할 수 있습니다.6

ID 확인

여러 데이터 인스턴스가 동일한 엔티티를 나타내는 경우가 많습니다. 예를 들어 한 고객이 여러 매장에서 서로 다른 처방전을 받아 약국 체인의 데이터베이스에 여러 번 나타난다고 가정해 보겠습니다.

데이터 관리자는 ID 확인이라는 프로세스를 통해 서로 다른 데이터 인스턴스가 동일한 엔티티를 참조하는 경우를 결정합니다. 예를 들어 약국 고객의 경우 ID 확인은 고객의 처방전을 조제할 때 잠재적으로 위험한 약물 상호 작용을 감지하는 데 도움이 될 수 있습니다.7

정보 보안 및 데이터 개인정보 보호

정보 보안은 무단 액세스, 공개, 사용, 변경 또는 중단으로부터 중요한 정보를 보호하는 것입니다. 데이터 개인정보 보호 규정에 따라 기업은 의료 데이터와 같은 민감한 정보에 대해 강화된 보호 조치를 시행해야 합니다. 또한 데이터 공유, 데이터 수집 제한 등을 관리하는 규칙을 준수해야 합니다. 데이터 관리자는 다양한 유형의 데이터에 대한 보안 분류를 만들고 설정하여 데이터 보호 및 규정 준수에 중요한 역할을 할 수 있습니다.

데이터 리니지 추적

데이터 리니지는 데이터 수명 주기를 추적하는 프로세스로, 데이터가 어디에서 발생했고, 어떻게 변경되었는지, 그리고 최종 목적지를 명확하게 파악하는 데 도움이 됩니다. 데이터 관리자는 리니지를 추적할 수 있으므로 조직이 규제 보고 목적으로 데이터 무결성을 확인하는 데 도움이 됩니다.

비즈니스 프로세스 위험 관리

데이터 품질이 좋지 않으면 비즈니스 프로세스가 위험에 빠질 수 있습니다. 데이터 관리자는 비즈니스 프로세스 리더와 협력하여 프로세스의 데이터 사용과 데이터 품질이 좋지 않은 경우 프로세스가 실패에 얼마나 취약한지를 파악할 수 있습니다.8

데이터 스튜어드십을 지원하는 기술 및 툴에는 어떤 것이 있나요?

조직은 데이터 관리 활동을 지원하기 위해 다음과 같은 다양한 솔루션과 툴을 구현할 수 있습니다.

  • 인공 지능(AI)
  • 데이터 카탈로그
  • 데이터 프로파일링 및 분석 툴
  • 관계형 데이터베이스 관리 시스템(RDBMS)
  • 데이터 거버넌스 소프트웨어

AI

AI와 데이터 스튜어드십은 공생 관계라고 할 수 있습니다. 데이터 스튜어드십은 AI 시스템이 고품질 데이터로 작동하도록 하는 데 도움이 되지만, AI 기반 툴은 데이터 스튜어드십 작업을 최적화할 수 있습니다. 예를 들어, AI 기반 데이터 준비 툴은 유효성 검사를 수행하고 부적절한 형식 등의 오류를 표시할 수 있으며, AI 기반 데이터 손실 방지 툴은 민감한 정보를 감지하고 필요에 따라 보안 제어를 적용할 수 있습니다.

데이터 카탈로그

데이터 카탈로그는 조직의 모든 데이터 자산을 목록으로 정리한 것입니다. 이는 데이터 관리자와 기타 데이터 전문가가 쉽고 빠르게 정보를 찾을 수 있도록 설계되었습니다. 각 데이터 자산과 관련된 메타데이터를 통해 카탈로그를 검색할 수 있습니다.

데이터 프로파일링 및 분석 툴

데이터 프로파일링 및 분석 툴은 데이터의 일관성과 품질을 평가할 수 있습니다. 이러한 툴의 기능에는 이상 징후를 식별하고, 데이터 소스를 검증하고, 사용자 지정 보고서를 통해 분석 결과를 요약하는 능력이 포함될 수 있습니다.

관계형 데이터베이스 관리 시스템

데이터 관리자가 데이터를 구성하는 한 가지 방법은 관계형 데이터베이스를 사용하는 것입니다. 관계형 데이터베이스(RDB)는 데이터가 행과 열로 구성된 데이터베이스 유형입니다. 결과 테이블을 함께 연결하여 데이터 포인트 간의 관계를 보여줄 수 있습니다. 관계형 데이터베이스 관리 시스템(RDBMS)은 데이터 관리자 및 기타 사용자가 RDB를 유지 관리하고 업데이트하는 데 사용할 수 있는 소프트웨어 솔루션입니다.

데이터 거버넌스 소프트웨어

데이터 거버넌스 소프트웨어 프로그램에는 데이터 프로파일링 및 분석 툴과 AI 기반 능력이 통합되어 있는 경우가 많습니다. 이러한 기능에는 AI 기반 메타데이터 강화, 데이터 카탈로그 생성, 데이터 리니지 추적 및 역할 기반 데이터 접근 제어 설정이 포함될 수 있습니다.

각주

모든 링크는 ibm.com 외부에 있습니다.

1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 2015년 4월 10일.

2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, 제2판.” Academic Press. 2020년 11월 20일.

관련 솔루션
데이터 관리 소프트웨어 및 솔루션

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기
IBM watsonx.data™

watsonx.data를 사용하면 오픈, 하이브리드 및 관리형 데이터 저장소를 통해 데이터의 위치와 관계없이 모든 데이터로 분석과 AI를 확장할 수 있습니다.

watsonx.data 알아보기
데이터 및 분석 컨설팅 서비스

IBM Consulting을 통해 엔터프라이즈 데이터의 가치를 실현하여 비즈니스 이점을 제공하는 인사이트 중심의 조직을 구축하세요.

분석 서비스 알아보기
다음 단계 안내

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기 watsonx.data 알아보기