데이터 모델링은 데이터 포인트와 구조 간의 연결을 전달하기 위해 전체 정보 시스템 또는 그 일부를 시각적으로 표현하는 프로세스입니다.
데이터 모델링의 목표는 시스템 내에서 사용 및 저장되는 데이터 유형, 이러한 데이터 유형 간의 관계, 데이터를 그룹화하고 구성하는 방법, 형식 및 속성을 설명하는 것입니다.
데이터 모델은 비즈니스 요구 사항을 중심으로 구축됩니다. 규칙과 요구 사항은 비즈니스 이해관계자의 피드백을 통해 미리 정의되므로, 새 시스템 설계에 통합하거나 기존 시스템을 반복하면서 조정할 수 있습니다.
데이터는 다양한 추상화 수준에서 모델링할 수 있습니다. 이 프로세스는 이해관계자 및 최종 사용자로부터 비즈니스 요구 사항에 대한 정보를 수집하는 것으로 시작됩니다. 그런 다음 이러한 비즈니스 규칙을 데이터 구조로 변환하여 구체적인 데이터베이스 설계를 공식화합니다. 데이터 모델은 로드맵, 아키텍트의 청사진 또는 설계 중인 내용을 더 깊이 이해할 수 있는 공식적인 다이어그램에 비유할 수 있습니다.
데이터 모델링은 표준화된 스키마와 공식적인 기법을 사용합니다. 이는 조직 전체 또는 그 밖의 영역에서 데이터 리소스를 정의하고 관리할 때 공통적이고 일관되며 예측 가능한 방법을 제공합니다.
이상적으로 데이터 모델은 변화하는 비즈니스 요구 사항에 따라 진화하고 살아있는 문서입니다. 이러한 모델은 비즈니스 프로세스를 지원하고 IT 아키텍처 및 전략을 계획하는 데 중요한 역할을 합니다. 데이터 모델은 공급업체, 파트너 및/또는 업계 동료와 공유할 수 있습니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
모든 설계 프로세스와 마찬가지로 데이터베이스 및 정보 시스템 설계는 높은 수준의 추상화에서 시작하여 점점 더 구체적이고 명확하게 변합니다. 데이터 모델은 일반적으로 추상화 정도에 따라 세 가지 카테고리로 나눌 수 있습니다. 이 프로세스는 개념적 모델로 시작하여 논리적 모델로 진행하고 물리적 모델로 마무리됩니다. 각 데이터 모델 유형에 대해서는 다음 섹션에서 자세히 설명합니다.
도메인 모델이라고도 하며, 시스템에 무엇이 포함될지, 어떻게 구성될지, 어떤 비즈니스 규칙이 포함될지 등에 대한 전반적인 관점을 제공합니다. 개념적 모델은 일반적으로 초기 프로젝트 요구 사항을 수집하는 프로세스의 일부로 만들어집니다. 일반적으로 엔티티 클래스(비즈니스에서 데이터 모델에 표현하는 데 중요한 사물의 유형을 정의), 특성 및 제약 조건, 엔티티 클래스와 관련 보안 및 데이터 무결성 요구 사항 간의 관계를 포함합니다. 모든 표기법은 일반적으로 간단합니다.
덜 추상적이며, 고려 중인 도메인의 개념과 관계에 대한 더 자세한 정보를 제공합니다. 여러 공식 데이터 모델링 표기법 시스템 중 하나를 따릅니다. 데이터 유형 및 해당 길이와 같은 데이터 속성을 나타내며 엔티티 간의 관계를 보여줍니다. 논리적 데이터 모델은 기술 시스템 요구 사항을 지정하지 않습니다. 애자일 또는 DevOps 방식에서는 이 단계가 생략되는 경우가 많습니다. 논리적 데이터 모델은 고도로 절차적인 구현 환경이나 본질적으로 데이터 지향적인 프로젝트(예: 데이터 웨어하우스 설계 또는 보고 시스템 개발)에 유용할 수 있습니다.
이는 데이터베이스 내에서 데이터가 물리적으로 저장되는 방식에 대한 스키마를 제공합니다. 따라서 가장 추상성이 적습니다. 엔티티 간의 관계를 설명하는 연관 테이블과 이러한 관계를 유지하는 데 사용되는 기본 키 및 외래 키를 포함하여 관계형 데이터베이스로 구현할 수 있는 최종 설계를 제공합니다. 물리적 데이터 모델에는 성능 튜닝을 포함한 데이터베이스 관리 시스템(DBMS) 관련 속성이 포함될 수 있습니다.
하나의 분야로서 데이터 모델링은 이해관계자가 데이터 처리 및 스토리지를 매우 상세하게 평가하도록 유도합니다. 데이터 모델링 기술에는 데이터를 나타내는 데 사용되는 기호, 모델 배치 방식, 비즈니스 요구 사항을 전달하는 방식을 지정하는 다양한 규칙이 있습니다. 모든 접근 방식은 반복적인 방식으로 수행할 일련의 작업을 포함하는 공식화된 워크플로를 제공합니다. 이러한 워크플로는 일반적으로 다음과 같습니다.
데이터 모델링은 데이터베이스 관리 시스템과 함께 발전해 왔으며, 기업의 데이터 스토리지 요구 사항이 증가함에 따라 모델 유형이 점점 더 복잡해지고 있습니다. 다음은 몇 가지 모델 유형입니다.
관계형 데이터베이스는 데이터 관리를 위해 구조화된 쿼리 언어(SQL)를 사용하는 경우가 많습니다. 이러한 데이터베이스는 데이터 무결성을 유지하고 중복성을 최소화하는 데 효과적이며, POS 시스템뿐만 아니라 다른 유형의 거래 처리에도 자주 사용됩니다.
널리 사용되는 두 가지 차원 데이터 모델은 별 스키마로, 데이터가 팩트(측정 가능한 항목)와 차원(참조 정보)으로 구성하고 각 팩트는 별 모양 패턴의 관련 차원으로 둘러싸여 있습니다. 다른 하나는 눈송이 스키마로, 별 스키마와 비슷하지만 관련 차원의 추가 계층을 포함하기 때문에 분기 패턴이 더 복잡해집니다.
데이터 모델링을 사용하면 개발자, 데이터 아키텍트, 비즈니스 분석가 및 기타 이해관계자가 데이터베이스 또는 데이터 웨어하우스에 있는 데이터 간의 관계를 더 쉽게 보고 이해할 수 있습니다. 또한 다음을 수행할 수 있습니다.
오늘날 다양한 데이터 모델링, 다이어그램 작성, 시각화 도구를 포함하여 수많은 상용 및 오픈 소스 컴퓨터 지원 소프트웨어 엔지니어링 (CASE) 솔루션이 널리 사용되고 있습니다. 몇 가지 예는 다음과 같습니다.
데이터 과학 도구와 솔루션을 활용하여 패턴을 파악하고 데이터, 알고리즘, 머신 러닝, AI 기술을 활용하여 예측을 구축합니다.
더 나은 의사 결정을 위한 AI 기반 인사이트인 Cognos Analytics 12.0을 소개합니다.
IBM Consulting을 통해 엔터프라이즈 데이터의 가치를 실현하여 비즈니스 이점을 제공하는 인사이트 중심의 조직을 구축하세요.