데이터 마트란 무엇인가요?

2021년 10월 21일

데이터 마트란 무엇인가요?

데이터 마트는 특정 사업부, 부서 또는 주제 영역에 초점을 맞춘 데이터 웨어하우스의 하위 집합입니다. 데이터 마트는 팀 효율성을 높이고 비용을 절감하며 보다 스마트한 전술적 비즈니스 의사 결정을 지원합니다.

데이터 마트는 특정 사용자 그룹에 특화된 데이터를 제공하므로, 사용자는 전체 데이터 웨어하우스를 검색하는 데 시간을 낭비하지 않고 중요한 인사이트에 빠르게 접근할 수 있습니다. 예를 들어 많은 기업에서 재무, 영업, 마케팅과 같은 특정 부서에 맞춘 데이터 마트를 운영하고 있습니다.

트랙에서 굴러가는 공의 3D 디자인

최신 AI 뉴스 + 인사이트

주간 Think 뉴스레터에서 전문가들이 선별한 AI, 클라우드 등에 관한 인사이트와 소식을 살펴보세요. 

데이터 마트 vs 데이터 웨어하우스 vs 데이터 레이크

데이터 마트, 데이터 웨어하우스, 데이터 레이크는 모두 중요한 중앙 데이터 저장소이지만, 조직 내에서 각각 다른 요구를 충족합니다.

데이터 웨어하우스는 여러 소스에서 데이터를 집계하여 단일 중앙의 일관된 데이터 저장소로 통합하는 시스템으로, 데이터 마이닝, 인공 지능(AI), 머신 러닝을 지원하며 고급 분석 및 비즈니스 인텔리전스를 강화할 수 있습니다. 이러한 전략적 수집 과정을 통해 데이터 웨어하우스 솔루션은 다양한 소스의 데이터를 통합하여 하나의 통합된 형태로 제공합니다.

(위에서 언급했듯이) 데이터 마트는 조직 내 단일 팀 또는 선택된 사용자 그룹에 중요하고 필요한 데이터의 더 작은 하위 집합을 포함하는 데이터 웨어하우스의 중점 버전입니다. 데이터 마트는 물리적 데이터베이스를 설계 및 구성하고, 데이터로 채우고, 복잡한 액세스 및 관리 프로토콜을 설정하기 위한 여러 기술과 도구가 포함된 복잡한 절차를 통해 기존 데이터 웨어하우스(또는 기타 데이터 소스)에서 구축됩니다.

까다로운 과정이기는 하지만 이를 통해 사업부는 광범위한 데이터 웨어하우스 데이터 세트를 사용하는 것보다 더 빠르게 집중적인 인사이트를 발견할 수 있습니다. 예를 들어, 마케팅 팀은 기존 창고에서 데이터 마트를 만드는 것이 유익할 수 있습니다. 왜냐하면 데이터 마트의 활동은 일반적으로 나머지 비즈니스와 독립적으로 수행되기 때문입니다. 따라서 팀은 모든 기업 데이터에 액세스할 필요가 없습니다.

데이터 레이크 또한 데이터 저장소입니다. 데이터 레이크는 다양한 소스로부터 유입된 비정형 또는 원시 데이터를 대규모로 저장하지만, 분석을 위한 처리나 준비는 되어 있지 않습니다. 원시 형식으로 데이터를 저장할 수 있기 때문에 데이터 레이크는 데이터 웨어하우스보다 더 접근하기 쉽고 비용 효율적입니다. 데이터를 수집하기 전에 정제하거나 처리할 필요가 없습니다.

예를 들어 정부는 교통 행동, 전력 사용량, 수로에 대한 데이터를 추적하고 이를 데이터 레이크에 저장한 후, 이러한 데이터를 어떻게 활용할지 검토하여 더 효율적인 서비스를 갖춘 ‘스마트 시티’를 구축할 수 있습니다.

AI 아카데미

데이터 관리가 생성형 AI 구현의 비결일까요?

생성형 AI를 성공적으로 사용하기 위해 고품질 데이터가 필수적인 이유를 알아보세요.

데이터 마트의 이점

데이터 마트는 비교적 좁은 데이터 주제를 가짐으로써 특정 그룹의 요구 사항을 충족하도록 설계되었습니다. 데이터 마트에는 여전히 수백만 개의 레코드가 포함될 수 있지만, 그 목표는 비즈니스 사용자에게 가장 짧은 시간 내에 가장 관련성이 높은 데이터를 제공하는 것입니다.

더 작고 집중된 설계를 통해 데이터 마트는 최종 사용자에게 다음과 같은 몇 가지 이점을 제공합니다.

  • 비용 효율성: 데이터 마트를 구축할 때는 범위, 통합, ETL(추출, 변환, 로드) 프로세스 등 다양한 요소를 고려해야 합니다. 그러나 데이터 마트는 일반적으로 데이터 웨어하우스보다 훨씬 적은 비용으로 구축할 수 있습니다.

  • 간소화된 데이터 접근: 데이터 마트는 데이터의 작은 하위 집합만 보관하므로 사용자는 데이터 웨어하우스에서 더 광범위한 데이터 세트로 작업할 때보다 적은 작업으로 필요한 데이터를 빠르게 검색할 수 있습니다.

  • 더 빠른 인사이트 접근: 데이터 웨어하우스에서 얻은 인사이트는 엔터프라이즈 차원의 전략적 의사 결정을 지원하며, 이는 전체 비즈니스에 영향을 미칩니다. 데이터 마트는 부서 차원에서의 의사 결정을 지원하는 비즈니스 인텔리전스 및 분석 기능을 제공합니다. 팀은 자신의 목표에 맞는 특화된 데이터 인사이트를 활용할 수 있습니다. 팀이 더 짧은 시간 안에 가치 있는 데이터를 식별하고 추출함으로써, 조직은 더 빠른 비즈니스 프로세스와 더 높은 생산성의 혜택을 누릴 수 있습니다.

  • 더욱 간편한 데이터 유지 관리: 데이터 웨어하우스는 다양한 사업 분야에 적용할 수 있는 풍부한 비즈니스 정보를 보관합니다. 데이터 마트는 100GB 미만을 수용하는 단일 회선에 집중하므로 혼란이 적고 유지 관리가 더 쉽습니다.

  • 더욱 쉽고 빠른 구현: 데이터 웨어하우스는 특히 대규모 기업의 경우 내부 및 외부의 다양한 소스에서 데이터를 수집하므로 구현에 상당한 시간이 소요됩니다. 반면에 데이터 마트를 설정할 때는 데이터의 작은 하위 집합만 필요하므로 구현이 더 효율적이고 설정 시간이 덜 걸리는 경향이 있습니다.

데이터마트의 유형

데이터 마트는 데이터 웨어하우스와의 관계 및 각 시스템의 데이터 소스에 따라 세 가지 유형으로 나뉩니다.

  • 종속형 데이터 마트는 엔터프라이즈 데이터 웨어하우스 내에 분할된 세그먼트입니다. 이러한 하향식 접근 방식에서는 모든 비즈니스 데이터를 하나의 중앙 위치에 저장하는 것부터 시작합니다. 새로 생성된 데이터 마트는 분석이 필요할 때마다 기본 데이터의 정의된 하위 집합을 추출합니다.

  • 독립형 데이터 마트는 데이터 웨어하우스에 의존하지 않는 독립적인 시스템으로 운영됩니다. 분석가는 특정 주제나 비즈니스 프로세스에 대한 데이터를 내부 또는 외부 데이터 소스에서 추출하고, 이를 처리한 후 팀이 필요할 때까지 데이터 마트 저장소에 보관할 수 있습니다.

  • 하이브리드 데이터 마트는 기존 데이터 웨어하우스와 기타 운영 소스의 데이터를 결합합니다. 이 통합 접근 방식은 하향식 접근 방식의 속도와 사용자 친화적인 인터페이스를 활용하며, 독립적인 방식의 엔터프라이즈급 통합도 제공합니다.

데이터 마트의 구조

데이터 마트는 주제 지향적인 관계형 데이터베이스로, 트랜잭션 데이터를 행과 열에 저장하여 데이터에 쉽게 접근하고 구성하며 이해할 수 있도록 합니다. 데이터 마트는 과거 데이터를 포함하고 있어 분석가가 데이터 트렌드를 파악하는 데 용이합니다. 일반적인 데이터 필드에는 숫자 순서, 시간 값, 하나 이상의 객체에 대한 참조가 포함됩니다.

기업은 분석 작업을 위해 데이터베이스를 사용하는 사용자들의 요구를 충족하기 위해 데이터 마트를 다차원 스키마로 구성합니다. 스키마의 주요 유형은 스타(Star), 스노우플레이크(Snowflake), 볼트(Vault)입니다.

스타

스타 스키마는 별 모양과 유사한 다차원 데이터베이스 내 테이블의 논리적 구성입니다. 이 설계에서는 하나의 사실 테이블(특정 비즈니스 이벤트 또는 프로세스와 관련된 측정값 집합)이 스타의 중심에 위치하고 여러 개의 관련 차원 테이블이 이를 둘러싸고 있습니다.

차원 테이블 간에는 종속성이 없으므로 스타 스키마는 쿼리를 작성할 때 더 적은 조인이 필요합니다. 이 구조를 사용하면 쿼리가 더 쉬워지므로 스타 스키마는 대규모 데이터 세트에 액세스하고 탐색하려는 분석가에게 매우 효율적입니다.

Snowflake

눈송이 스키마는 스타 스키마의 논리적 확장으로, 추가 차원 테이블로 청사진을 구축합니다. 차원 테이블은 데이터 무결성을 보호하고 데이터 중복을 최소화하기 위해 정규화됩니다.

이 방법은 차원 테이블을 저장하는 데 필요한 공간이 적지만 구조가 복잡하여 유지 관리가 어려울 수 있습니다. 스노우플레이크 스키마의 주요 장점은 디스크 공간 요구가 적다는 점이지만, 추가 테이블로 인한 성능 저하가 단점입니다.

볼트

데이터 볼트는 IT 전문가가 민첩한 엔터프라이즈 데이터 웨어하우스를 설계할 수 있도록 지원하는 최신 데이터베이스 모델링 기법입니다. 이 접근 방식은 계층화된 구조를 적용하며, 다른 스키마 모델에서 발생하는 민첩성, 유연성, 확장성 문제를 해결하기 위해 개발되었습니다.

데이터 볼트는 스타 스키마에서 필요한 데이터 정제 작업을 제거하고 기존 스키마를 변경하지 않고 새로운 데이터 소스를 손쉽게 추가할 수 있도록 합니다.

누가 데이터 마트를 사용하나요(그리고 어떻게 사용하나요)?

데이터 마트는 부서 수준에서 중요한 비즈니스 의사 결정을 안내합니다. 예를 들어, 마케팅 팀은 데이터 마트를 사용하여 소비자 행동을 분석할 수 있고, 영업 직원은 데이터 마트를 사용하여 분기별 판매 보고서를 컴파일할 수 있습니다. 이러한 작업은 해당 부서 내에서 발생하기 때문에 팀은 모든 엔터프라이즈 데이터에 액세스할 필요가 없습니다.

일반적으로 데이터 마트는 이를 사용할 특정 비즈니스 부서에서 생성하고 관리합니다. 데이터 마트를 설계하는 과정은 일반적으로 다음 단계로 구성됩니다.

  1. 데이터 마트의 비즈니스 및 기술적 요구 사항을 이해하기 위한 필수 요구 사항을 문서화하세요.

  2. 데이터 마트가 참조할 데이터 소스를 식별합니다.

  3. 주제에 대한 모든 정보 또는 더 세부적인 수준의 특정 필드 중 어떤 데이터 하위 집합을 사용할지 결정합니다.

  4. 더 큰 데이터 웨어하우스와 연관된 스키마를 선택하여 데이터 마트의 논리적 레이아웃을 설계하세요.

기초 작업이 완료되면 Qlik 또는 SiSense와 같은 전문 비즈니스 인텔리전스 툴을 사용하여 데이터 마트에서 최대한의 가치를 얻을 수 있습니다. 이러한 솔루션은 대시보드와 시각화 기능을 제공하여 데이터를 쉽게 인사이트로 전환할 수 있으며, 이는 궁극적으로 회사에 이익이 되는 보다 스마트한 의사 결정으로 이어집니다.

데이터 마트 및 클라우드 아키텍처

데이터 마트는 기업에게 효율성과 유연성 향상이라는 이점을 제공하지만, 데이터의 끝없는 증가는 온프레미스 솔루션을 계속 사용하는 기업에게는 문제가 됩니다.

데이터 웨어하우스가 클라우드로 이동함에 따라 데이터 마트도 클라우드로 전환될 것입니다. 모든 데이터 마트를 포함하는 단일 저장소로 데이터 리소스를 통합하면 기업은 비용을 절감하고 모든 부서가 필요한 데이터에 실시간으로 자유롭게 접근할 수 있습니다.

클라우드 기반 플랫폼을 사용하면 대규모 데이터 세트를 쉽게 생성, 공유 및 저장할 수 있으므로 보다 효율적이고 효과적인 데이터 액세스 및 분석을 위한 기반을 마련할 수 있습니다. 클라우드 시스템은 지속 가능한 비즈니스 성장을 위해 구축되었습니다. 현대의 많은 SaaS(Software-as-a Service) 공급업체는 데이터 쿼리 시 확장성을 개선하기 위해 데이터 스토리지를 컴퓨팅과 분리합니다.

관련 솔루션
IBM watsonx.data

watsonx.data를 사용하면 오픈, 하이브리드 및 관리형 데이터 저장소를 통해 데이터의 위치와 관계없이 모든 데이터로 분석과 AI를 확장할 수 있습니다.

watsonx.data 알아보기
데이터 웨어하우스 솔루션

조직 전반에 걸쳐 관리형 데이터에 대해 상시 가동되는 고성능 분석 및 AI 워크로드를 확장하세요.

데이터 웨어하우스 솔루션 살펴보기
데이터 및 분석 컨설팅 서비스

IBM Consulting으로 엔터프라이즈 데이터의 가치를 극대화해 비즈니스에 이득을 가져다주는 인사이트 중심의 조직을 구축하세요.

분석 서비스 알아보기
다음 단계 안내

IBM watsonx.data를 통해 AI 및 분석을 위한 모든 데이터를 통합하세요. AI 및 분석을 위한 하이브리드 오픈 데이터 레이크하우스를 통해 데이터가 어디에 있든 효과적으로 활용하세요.

watsonx.data 알아보기 데이터 웨어하우스 솔루션 살펴보기