데이터 관리 계획(DMP)이란 무엇인가요?

경제 보고서 작업에 몰두하고 있는 젊은 여성

DMP란 무엇인가요?

데이터 관리 계획(DMP)은 프로젝트의 라이프사이클, 즉 데이터의 수집부터 보관까지 데이터를 처리하는 방법을 정의하는 문서입니다.

이러한 문서는 일반적으로 연구 프로젝트에서 자금 제공자의 요구 사항을 충족하는 데 사용되지만, 기업 환경에서도 이해관계자 간의 구조와 조율을 만드는 데 활용할 수 있습니다.

DMP는 프로젝트 내에서 사용될 데이터의 유형을 강조하고 데이터 라이프사이클 전반에 걸쳐 데이터 관리를 다루기 때문에 거버넌스 팀과 같은 이해관계자는 프로젝트 시작 시 개인 식별 정보(PII)와 같은 민감한 데이터의 저장 및 배포에 대해 명확한 피드백을 제공할 수 있습니다. 이러한 문서를 통해 팀은 규정 준수 및 규제 위험을 피할 수 있으며 향후 프로젝트를 위해 데이터에 접근하고 관리하는 방법에 대한 템플릿 역할을 할 수 있습니다.

트랙에서 굴러가는 공의 3D 디자인

최신 AI 뉴스+인사이트


주간 Think 뉴스레터에서 전문가들이 선별한 AI, 클라우드 등에 관한 인사이트와 소식을 살펴보세요. 

데이터 관리 계획의 구성 요소

데이터 관리 계획에는 일반적으로 다음과 같은 다섯 가지 구성 요소가 있습니다.

1. 목적 선언문
2. 데이터 정의
3. 데이터 수집 및 액세스
4. 자주 묻는 질문(FAQ)
5. 연구 데이터의 한계

이러한 각 중점 영역을 통해 연구 기관 및 연구 자금 제공자(또는 데이터 관리 팀)는 주어진 프로젝트와 관련된 위험의 양을 평가할 수 있습니다. 데이터 관리 계획에서는 이러한 위험을 관리하는 방법도 다룹니다. 예를 들어, 프로젝트 내에서 민감한 데이터가 사용되는 경우 해당 데이터를 향후 프로젝트에 재사용하는 것이 적절한가요? 해당 데이터의 민감도에 따라 적절하지 않거나 추가 사용자 동의가 필요할 수 있습니다.

데이터 관리 계획의 각 구성 요소는 특정 정보에 초점을 맞추며, 각 정보에 대해 더 자세히 살펴볼 것입니다.

1. 목적 선언문: 프로젝트가 진행되는 동안 팀이 특정 유형의 데이터를 획득해야 하는 이유를 설명합니다. 팀이 이 데이터 세트로 답변하려고 하는 질문을 명확하게 설명해야 합니다.

2. 데이터 정의: 데이터 설명은 최종 사용자와 대상 고객이 명명 규칙과 특정 데이터 세트와의 대응 관계를 이해하는 데 도움이 됩니다. 이 정보 중 일부는 메타데이터 내에 보유될 수도 있으며, 일반적으로 데이터 소스 및 파일 형식별로 데이터에 레이블을 지정합니다. 데이터 수집 프로세스 전반에 걸쳐 사전 정의된 메타데이터 표준을 만들고 준수하면 보다 일관된 수집과 보다 원활한 통합 프로세스를 보장할 수 있습니다.

3.데이터 수집 및 액세스: DMP의 이 섹션에서는 데이터 리포지토리에서 데이터를 수집, 저장 및 액세스하는 방법을 설명합니다. 기존 데이터의 데이터 소스 또는 실험과 같은 새 데이터를 생성하기 위해 취하게 될 접근 방식을 다룰 가능성이 높습니다. 또한 얼마나 자주 그리고 어떤 기간 동안 업데이트되는지 데이터 타이밍에 대한 정보도 포함해야 합니다. 데이터의 유형과 타이밍은 일반적으로 데이터의 스토리지 및 제3자에 대한 액세스를 알려줍니다. 예를 들어, 비정형 데이터에는 관계형 시스템보다 비관계형 시스템이 필요하며, 큰 데이터 세트는 작은 데이터 세트에 비해 더 많은 컴퓨팅 파워를 필요로 합니다. 또한 개인 정보 보호 또는 지적 재산권으로 인해 데이터 공유에 제한이 있을 수 있습니다. 프로젝트 이해관계자들은 개인 식별 정보(PII) 와 같은 민감한 데이터를 최대한의 주의와 보안으로 취급하기를 기대하므로 데이터 소유자는 특히 이 영역에서 데이터 관리 관행을 명확히 파악하는 것이 중요합니다. 여기에는 데이터 보관 또는 데이터 재사용과 같은 데이터의 장기 보존과 관련된 질문에 대한 답변이 포함됩니다. 본질적으로 민감하지 않은 데이터의 경우 제3자가 원시 데이터 및 연구 결과에 액세스할 수 있는 경로를 제공할 것으로 기대됩니다.

4. 자주 묻는 질문: 이 섹션은 공유 계획, 인용 기본 설정, 데이터 백업 방법 등 데이터 관리 프로젝트 내에서 자주 묻는 다른 질문의 '총정리'라고 할 수 있습니다. 연구자 또는 데이터 소유자는 인접 프로젝트 또는 관련 프로젝트의 소유자를 위해 디지털 개체 식별자(DOI)를 강조 표시할 수 있습니다. 또한 프로젝트 소유자가 데이터를 보관하는 경우 아카이브의 존재 기간도 고려해야 합니다. 1년, 5년, 아니면 무기한으로 존재할 수 있을까요?

5. 연구 데이터의 한계: 이 섹션에서는 데이터 세트의 사전 제한 사항으로 인해 모집단에 대한 일반화 기능이 제한될 수 있는 점을 설명합니다. 예를 들어, 데이터는 지리, 성별, 인종, 연령 그룹 등과 같은 특정 인구 통계에 초점을 맞출 수 있습니다.

Mixture of Experts | 12월 12일, 에피소드 85

AI 디코딩: 주간 뉴스 요약

세계적인 수준의 엔지니어, 연구원, 제품 리더 등으로 구성된 패널과 함께 불필요한 AI 잡음을 차단하고 실질적인 AI 최신 소식과 인사이트를 확인해 보세요.

데이터 관리 계획은 누가 사용하나요?

데이터 관리 계획은 주로 미국 국립보건원(NIH) 및 국립과학재단(NSF)과 같은 연방 정부 지원 프로그램과 같은 학술적인 환경에서 주로 사용되지만, 기업에서도 연구 또는 데이터 거버넌스 기능에 활용할 수 있습니다. 학자와 연구자는 보조금 신청서에서 자금 제공자의 요구 사항을 준수해야 하지만, 많은 연구 기관에서는 연구 참여자에게 연구 프로젝트에 필요한 관련 템플릿을 제공하기 위해 DMP 도구를 만듭니다. 조직 내의 데이터 거버넌스 팀은 새로운 데이터 이니셔티브를 옹호하는 이해 관계자의 데이터 요청을 수집하기 위해 유사한 프로토콜을 설정할 수 있습니다.

데이터 관리 사용 사례

보조금 신청

민간 및 공공 부문의 연구자들은 연구 및 혁신 이니셔티브를 후원하기 위해 다양한 자금 지원 기관을 찾고 있습니다. DMP는 데이터 소유자가 데이터 관리에 대한 자신의 개인적인 책임(예: 보안 및 재해 복구 조치)뿐만 아니라 가치를 평가하여 양측 모두의 위험을 완화합니다.

데이터 거버넌스 이니셔티브

데이터 관리 계획은 또한 비즈니스 환경에서 새로운 데이터 이니셔티브에 매우 유용하며, 모든 이해 관계자가 새로운 데이터 소스의 중요성과 비즈니스 결과와 어떻게 연결될 수 있는지 이해하는 데 도움이 됩니다. 하이브리드 클라우드, 인공 지능 , 사물인터넷(IoT) 및 엣지 컴퓨팅의 발전으로 빅데이터의 성장이 계속됨에 따라 기업은 데이터 시스템 내에서 빅데이터의 복잡성을 관리할 방법을 찾아야 합니다.

관련 솔루션
데이터 관리 소프트웨어 및 솔루션

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기
IBM watsonx.data™

watsonx.data를 사용하면 오픈, 하이브리드 및 관리형 데이터 저장소를 통해 데이터의 위치와 관계없이 모든 데이터로 분석과 AI를 확장할 수 있습니다.

watsonx.data 알아보기
데이터 및 분석 컨설팅 서비스

IBM Consulting을 통해 엔터프라이즈 데이터의 가치를 실현하여 비즈니스 이점을 제공하는 인사이트 중심의 조직을 구축하세요.

분석 서비스 알아보기
다음 단계 안내

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기 watsonx.data 알아보기