데이터 모델링은 데이터 포인트 간의 연결 관계 및 구조를 알리기 위해 정보 시스템 전체나 그 일부를 시각적으로 표현하는 프로세스입니다. 시스템 내에서 사용되고 저장되는 데이터의 유형, 이 데이터 유형 간의 관계, 데이터를 그룹화하고 조직화하는 방식, 그 형식과 특성을 나타내는 데 그 목적이 있습니다.
데이터 모델은 비즈니스 요구 사항을 중심으로 빌드됩니다. 초기에 비즈니스 이해 관계자의 피드백을 바탕으로 규칙과 요구 사항을 정의합니다. 따라서 신규 시스템의 설계에 적용하거나 기존 시스템의 새 버전에 변경하여 적용할 수 있습니다.
데이터는 다양한 추상화 수준에서 모델링할 수 있습니다. 이 프로세스는 이해 관계자 및 최종 사용자로부터 비즈니스 요구 사항에 관한 정보를 수집하면서 시작합니다. 그런 다음 이 비즈니스 규칙을 데이터 구조로 변환하면서 구체적인 데이터베이스 설계를 완성합니다. 데이터 모델은 도로 지도, 건축가의 청사진, 또는 설계 대상을 더 정확히 이해하는 데 도움이 될 기타 공식적인 다이어그램에 비유할 수 있습니다.
데이터 모델링에서는 표준화된 스키마 및 공식적인 기법을 사용합니다. 그러면 전사적 범위에서 또는 그 이외의 영역에서도 공통적이고 일관성 있는, 그리고 예측 가능한 방식으로 데이터 리소스를 정의하고 관리할 수 있게 됩니다.
이상적으로, 데이터 모델은 비즈니스 요구 사항의 변화에 따라 진화하는 살아 있는 문서라 할 수 있습니다. 이는 비즈니스 프로세스를 지원하고 IT 아키텍처 및 전략을 계획하는 데 중요한 역할을 합니다. 데이터 모델은 벤더, 파트너, 또는 동종 업계 기업과도 공유할 수 있습니다.
AI를 기반으로 하는 더 나은 가상 상담사 구축
데이터베이스 및 정보 시스템 설계는 여느 설계 프로세스와 마찬가지로, 고도의 추상화 수준에서 시작했다가 점점 더 구체화되고 특화됩니다. 일반적으로 데이터 모델은 3가지 범주로 나눌 수 있는데, 이는 추상화 수준에 따라 달라집니다. 이 프로세스는 개념 모델에서 시작하고 논리적 모델로 진화하며 물리적 모델로 마무리됩니다. 데이터 모델의 각 유형에 관해서는 아래에서 더 자세히 살펴보겠습니다.
원칙적으로 데이터 모델링에는 이해 관계자가 참여하여 데이터 처리 및 저장을 매우 상세히 평가해야 합니다. 데이터 모델링 기법에서는 저마다 다른 규칙을 통해 어떤 기호를 사용하여 데이터를 나타낼지, 어떤 식으로 모델을 배치할지, 어떻게 비즈니스 요구 사항을 전달할지를 결정합니다. 모든 접근 방식에서는 공식화된 워크플로우가 있습니다. 이는 반복적으로 수행할 일련의 태스크로 구성됩니다. 일반적으로 이 워크플로우는 다음과 같습니다.
데이터 모델링은 데이터베이스 관리 시스템과 함께 진화했습니다. 비즈니스의 데이터 스토리지 요구 사항이 늘면서 모델 유형도 더욱 복잡해졌습니다. 몇 가지 모델 유형을 소개합니다.
관계형 데이터베이스에서는 대개 데이터 관리를 위해 SQL(structured query language)을 사용합니다. 이 데이터베이스는 데이터 무결성을 유지하고 중복성을 최소화하는 데 효과적입니다. POS(point-of-sale) 시스템 및 그 밖의 트랜잭션 처리 유형에 많이 쓰입니다.
특히 많이 쓰이는 2가지 차원 데이터 모델 중 하나가 스타(star) 스키마입니다. 여기서는 데이터를 사실(측정 가능한 항목)과 차원(참조 정보)으로 구성합니다. 각 사실은 연관된 차원에 둘러싸여 별 모양의 패턴으로 나타납니다. 다른 하나는 스노우플레이크(snowflake) 스키마입니다. 스타 스키마와 비슷하지만, 추가적인 연관 차원 계층이 있어 분기 패턴이 더 복잡해집니다.
데이터 모델링 덕분에 개발자, 데이터 아키텍트, 비즈니스 분석가, 기타 이해 관계자가 데이터베이스나 데이터 웨어하우스의 데이터 간 관계를 더 쉽게 조회하고 이해할 수 있습니다. 그와 더불어 다음과 같은 이점을 제공합니다.
오늘날 수많은 상용 및 오픈 소스 CASE(computer-aided software engineering) 솔루션이 광범위하게 사용되고 있습니다. 여기에는 다양한 데이터 모델링, 다이어그램, 시각화 툴이 포함됩니다. 그중 몇 가지 예를 들면 다음과 같습니다.
고성능 분석과 AI를 위해 구축된 완벽히 관리되는 탄력적 클라우드 데이터 웨어하우스입니다.
하이브리드. 하이브리드 접근 방식을 갖췄으며 우수한 복원성을 제공하는 디지털 혁신을 위한 플랫폼이자 파트너입니다.
AI 기반 하이브리드 클라우드 소프트웨어