SOR과 SOT의 차이점은 기술적인 차이라기보다는 기능적인 차이입니다. 이들은 서로 다른 종류의 정보 시스템이 아니라 조직 내에서 서로 다른 역할을 수행하는 정보 시스템입니다.
기록 시스템의 주요 기능은 특정 도메인에서 비즈니스 데이터를 캡처하여 비즈니스 운영을 지원하는 것입니다. 예를 들어 고객 관계 관리 (CRM) 툴은 조직의 고객 데이터에 대한 기록 시스템 역할을 하여 이름 및 연락처 세부 정보와 같은 정보를 수집합니다.
신뢰할 수 있는 소스의 주요 기능은 여러 시스템의 데이터 요소를 상호 연결하여 고객, 제품 또는 프로세스와 같은 데이터 객체에 대한 총체적인 그림을 만드는 것입니다. 이해관계자들은 데이터 분석 및 의사 결정에 이 총체적인 그림을 사용하는 경우가 많습니다. 예를 들어, 데이터 웨어하우스는 CRM 전사적 자원 관리(ERP) 툴, 재고 관리 시스템과 같은 여러 비즈니스 앱의 데이터를 하나로 모을 수 있습니다. 이 집계를 통해 비즈니스 분석가는 다양한 고객 세그먼트에서 어떤 유형의 제품이 더 나은 성과를 내는지와 같은 광범위한 추세를 파악할 수 있습니다.
다시 말해, SOR과 SOT는 서로 다른 문제점을 해결합니다.
SOR은 각 비즈니스 도메인에 대한 권위 있는 데이터 저장소를 생성하므로 개별 팀원, 사업부 및 앱이 중복되고 일관성이 없는 자체 데이터 세트를 유지 관리할 필요가 없습니다.
SOT는 데이터 사일로를 방지하고 조직이 도메인 전반의 데이터 객체를 종합적으로 파악할 수 있도록 지원합니다.
기록 시스템과 신뢰할 수 있는 소스는 기업의 요구 사항과 데이터 아키텍처에 따라 전문 소프트웨어, 기본 데이터베이스, 클라우드 파일 시스템 또는 다른 스토리지 시스템 등 다양한 형태를 취할 수 있습니다. 대부분의 조직에서는 SOR과 SOT가 서로 다른 용도로 사용되기 때문에 둘 다 운영합니다.
Think 뉴스레터
Think 뉴스레터를 통해 AI, 사이버 보안, 데이터 및 자동화에 대한 선별된 뉴스를 제공하는 보안 리더들과 함께하세요. 받은 편지함으로 직접 제공되는 전문가 튜토리얼과 설명서를 통해 빠르게 배울 수 있습니다. IBM 개인정보 보호정책을 참고하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책 을 참조하세요.
기록 시스템(SOR)은 원본 비즈니스 데이터의 권위 있는 소스입니다. SOR에는 고객, 직원, 제품, 공급 업체 또는 일상적인 비즈니스 프로세스와 관련된 기타 자산 및 엔티티에 대한 데이터가 포함될 수 있습니다.
기록 시스템은 핵심 비즈니스 데이터가 처음 생성되고 이후 계속해서 관리되는 곳입니다. 각 SOR은 일반적으로 하나의 특정 비즈니스 운영 또는 도메인과 관련된 데이터를 수집하는 데 중점을 둡니다.
예를 들어, 많은 조직에서 인적 자원 정보 시스템(HRIS)을 사용하여 직원 기록을 관리합니다. 일반적으로 이러한 기록은 다른 곳에서 옮겨오는 것이 아니라 HRIS 시스템에서 처음 생성됩니다. 다른 시스템이 직원 기록에 액세스해야 하는 경우 HRIS에서 이를 가져옵니다.
일부 SOR은 실시간 데이터를 수집합니다. 다른 SOR은 일괄 업데이트를 사용하기도 합니다.
기록 시스템은 권위 있는 데이터의 소스입니다. 이는 두 가지를 의미합니다.
SOR은 다른 시스템에 데이터를 제공하는 데이터 소스입니다. 이해관계자는 데이터 웨어하우스나 데이터 레이크하우스와 같은 다른 포털을 통해 데이터에 액세스할 수 있지만, 해당 포털로 유입되는 데이터는 궁극적으로 관련 SOR에서 비롯됩니다.
정보와 관련하여 질문이나 불일치가 발생하는 경우 SOR 버전이 올바른 버전으로 취급됩니다.
각 데이터 유형에 권위 있는 출처를 지정하면 데이터 일관성을 보장하는 데 도움이 됩니다. 데이터를 다루는 모든 사람이 자신의 개인 데이터 세트를 사용하는 대신 동일한 데이터 세트를 사용하는데, 이로 인해 사일로, 단편화, 오류, 가시성 격차 및 기타 문제가 발생할 수 있습니다.
데이터 품질에 중점을 두었기 때문에 많은 SOR에는 데이터 검증을 위한 자동화 워크플로가 내장되어 있습니다. 예를 들어 CRM은 전화번호로 분류된 모든 데이터 요소가 XXX-XXX-XXXX의 적절한 형식을 따르는지 확인할 수 있습니다.
SOR은 또한 좁은 그룹의 사람들이나 시스템에 쓰기 권한을 제한하는 경향이 있습니다. 이는 악의적이거나 부주의한 변조를 방지하여 데이터 무결성을 보장하는 데 도움이 됩니다.
SOR은 신뢰할 수 있는 데이터 저장소를 유지 관리하기 때문에 데이터 거버넌스 및 규정 준수 노력에서 중요한 역할을 하는 경우가 많습니다. SOR은 올바른 사람만 올바른 이유로 데이터를 읽거나 쓸 수 있도록 하는 데 도움이 될 수 있습니다. 또한 감사 추적 및 액세스 기록을 유지하여 규정 준수를 증명하고 위반 사항을 발견하여 수정할 수 있도록 도와줍니다.
레코드 시스템은 단순한 SQL Database 또는 클라우드 파일 스토리지 시스템일 수 있습니다. 그러나 일반적으로 조직은 전문 앱과 소프트웨어를 사용하며, 이러한 툴은 데이터의 정확성과 일관성을 보장하는 내장 기능을 가지고 있습니다.
SOR의 일반적인 예로는 고객 관계 관리(CRM) 데이터베이스, 인적 자본 관리(HCM) 소프트웨어, 전사적 자원 관리(ERP) 소프트웨어, 제조 실행 시스템(MES), 구성 관리 데이터베이스(CMDB) 및 프로젝트 관리 플랫폼이 있습니다.
신뢰할 수 있는 소스는 엔터프라이즈 데이터 아키텍처의 다양한 소스에서 데이터 흐름을 집계하거나 조화시켜 도메인 전반에 걸쳐 조직의 데이터 객체에 대한 완전한 보기를 생성하는 정보 시스템입니다.
'데이터 객체'는 데이터가 참조하는 대상, 즉 고객, 제품, 프로세스 또는 기타 엔티티나 자산을 의미합니다.
기록 시스템은 정확한 데이터의 저장소를 유지하는 데 매우 뛰어납니다. 그러나 각 기록 시스템은 단일 도메인에 한정되어 있습니다. 따라서 단일 기록 시스템에는 여러 도메인에 존재하는 데이터 객체에 대한 전체 그림이 포함되어 있지 않습니다.
신뢰할 수 있는 소스는 여러 시스템에서 데이터를 가져와 조정하고 상호 연관시켜 조직 데이터에 대한 총체적인 관점을 생성함으로써 이 문제를 해결하도록 돕습니다.
고객을 예로 들어 보겠습니다. 조직의 CRM은 이름과 관련 계정 소유자와 같은 식별 데이터를 추적합니다. 회계 소프트웨어는 고객의 모든 인보이스와 결제를 추적합니다. 지원 티켓 시스템은 이 고객이 어떤 문제에 대해 얼마나 많은 지원 시간을 필요로 했는지 추적합니다.
CRM, 회계 소프트웨어, 지원 티켓 시스템 등 각 개별 SOR은 고객의 한 측면에 대한 인사이트만 제공할 수 있습니다. 그러나 신뢰할 수 있는 소스는 이러한 SOR을 소스 시스템으로 사용하여 모든 데이터를 집계해 식별 정보, 재무 데이터 및 지원 요구 사항을 포함하는 단일 고객 기록을 생성합니다.
데이터 객체에 대한 총체적인 관점을 만들 때, 신뢰할 수 있는 소스는 데이터 사일로를 없애고 분석가, 비즈니스 사용자 및 기타 이해관계자가 조직의 데이터를 사용하여 정보에 입각한 의사 결정, 예측 및 전망을 할 수 있도록 합니다.
예를 들어, CRM, 회계 및 지원 데이터와 지표를 통합하는 총체적인 고객 기록을 생각해 보세요. 이렇게 완전한 관점을 가지고 데이터 분석가는 '이 고객이 수익성 있는가?'와 같은 질문에 이제 답할 수 있습니다.
모든 SOT가 분석 포털 또는 플랫폼 역할을 하는 것은 아니라는 점에 주목할 필요가 있습니다.
SOR과 마찬가지로 SOT는 특정 정보 시스템이 수행하는 역할이지, 별개의 기술 범주가 아닙니다. 따라서 SOT는 다양한 형태를 취할 수 있습니다. 일반적인 예는 다음과 같습니다.
데이터 웨어하우스 및 데이터 마트는 다양한 소스의 데이터를 쿼리와 분석에 최적화된 중앙 데이터 저장소로 집계합니다.
마스터 데이터 관리(MDM) 플랫폼은 고객 정보, 제품 세부 사항, 위치 데이터와 같은 주요 기업 데이터 자산을 통합합니다.
데이터 레이크하우스는 데이터 레이크의 유연한 데이터 스토리지 기능과 데이터 웨어하우스의 고성능 분석 기능을 결합합니다.
어떤 형태를 취하든 대부분의 신뢰할 수 있는 소스는 공통된 프로세스를 통해 구축됩니다.
통합이 필요한 관련 기록 시스템을 파악합니다.
MDM 규칙을 수립하여 데이터가 어떻게 구조화되고 조정되며 연관되는지를 규정합니다.
추출, 로드, 변환(ELT) 파이프라인 또는 가상화를 통해 SOR을 공통 리포지토리에 통합합니다.
신뢰할 수 있는 단일 소스(SSOT)는 조직 전반의 비즈니스 데이터를 통합하여 데이터 객체에 대한 전체적인 관점을 생성하는 신뢰할 수 있는 정보 소스로, 신뢰할 수 있는 소스와 거의 같은 개념입니다.
하지만 '단일'이라는 단어를 추가함으로써 데이터 아키텍처 설계에 대한 특별한 접근 방식, 즉 모든 이해관계자와 앱이 참조하는 신뢰할 수 있는 소스가 하나만 있어야 한다는 생각을 강조하고 있습니다.
일부 조직에는 요구 사항과 아키텍처에 따라 여러 신뢰할 수 있는 소스가 있을 수 있습니다. 그러나 신뢰할 수 있는 단일 소스를 보유한 조직은 이러한 모든 이질적인 SOT를 조직 전체의 데이터에 대한 하나의 조정된 중앙 집중식 보기로 통합하는 것을 목표로 합니다.
- 기록 시스템은 단일 도메인에서 원본 비즈니스 데이터를 수집합니다.
- 신뢰할 수 있는 소스는 여러 도메인의 비즈니스 데이터를 조화시키고 상호 연관시킵니다.
- 기록 시스템은 특정 도메인에 대한 포괄적이고 권위 있는 데이터베이스입니다.
- 신뢰할 수 있는 소스는 여러 도메인의 데이터를 통합한 관점입니다.
- 기록 시스템은 소스에서 데이터를 수집하고 생성합니다.
- 신뢰할 수 있는 소스는 다른 시스템의 데이터를 집계하고 통합합니다.
- 기록 시스템은 신뢰할 수 있는 소스에 데이터를 제공합니다.
- 신뢰할 수 있는 소스는 기록 시스템에서 데이터를 가져옵니다.
SOR과 SOT는 유사하고 상호 보완적이지만, 서로 다른 요구 사항을 가진 서로 다른 역할을 수행하기 때문에 데이터 아키텍처에서 별개의 구성 요소로 취급됩니다.
SOR은 데이터의 생성과 해당 도메인 내에서의 무결성을 소유합니다. SOT는 도메인 전반의 데이터 일관성을 소유합니다. SOR에는 모든 데이터 객체에 대한 총체적인 관점이 필요하지 않습니다. 해당 도메인에서 중요한 데이터만 기록하면 됩니다. 그러나 다른 사용자와 시스템에는 총체적인 관점이 필요할 수 있으며, 이때 SOT가 필요합니다.