IBM 데이터 패브릭 아키텍처 가이드

개요

데이터 패브릭은 데이터 형식, 데이터 소스, 데이터 위치 및 데이터 사용 방식에 관계없이 조직 전반에서 데이터 활용을 확대하기 위한 아키텍처 패턴입니다. 데이터 패브릭은 데이터 액세스부터 소비까지 데이터 라이프사이클의 다양한 측면을 다루며 데이터 검색, 데이터 거버넌스, 데이터 품질, 데이터 분류, 비즈니스 컨텍스트 연결, 데이터 계보, 셀프 서비스 및 데이터 운영화를 통해 적절한 데이터를 적절한 위치와 시점에 제공할 수 있도록 합니다. 추가 지침을 보려면 클릭하세요.

데이터 패브릭에 대한 참조 아키텍처는 기업이 자체 환경에서 Data Fabric의 다양한 구성 요소를 구현하는 데 도움이 되는 지침으로 사용할 수 있는 템플릿입니다. 데이터 패브릭 참조 아키텍처에는 다섯 가지 핵심 모듈이 있으며 메타데이터 가져오기, 메타데이터 보강, 메타데이터 카탈로그화, 데이터 정제 및 변환, 데이터 소비가 포함됩니다. 이 모듈은 앞서 설명한 데이터 패브릭의 이점을 실현하는 데 핵심적인 역할을 합니다.

참조 아키텍처는 다섯 개 모듈의 목표를 실현하는 데 도움이 되는 핵심 구성 요소, 관련 단계 및 각 모듈에 대한 아키텍처 결정을 다룹니다. 또한 이러한 구성 요소와 단계를 구현하기 위해 IBM 기술 환경에서 사용할 수 있는 다양한 기술 옵션을 다룹니다. 데이터 소비 모듈의 경우 일반적인 소비 패턴을 다루며 각 소비 사용 사례의 세부 사항은 해당 사용 사례의 참조 아키텍처에서 다루어진다는 가정을 기반으로 합니다.

또한 전체 데이터 및 AI 참조 아키텍처도 참고할 수 있습니다.

IBM Z 개요

IBM Z systems 데이터 패브릭 참조 아키텍처는 데이터 형식, 데이터 소스, 데이터 위치 및 데이터 사용 방식에 관계없이 조직 전반에서 데이터 활용을 확대하도록 설계된 더 광범위한 IBM® Data and Analytics 데이터 패브릭 아키텍처 패턴을 IBM Z 시스템에 맞게 특화한 것입니다. 데이터 패브릭은 데이터 액세스부터 소비까지 데이터 라이프사이클의 다양한 측면을 다루며 데이터 검색, 데이터 거버넌스, 데이터 품질, 데이터 분류, 비즈니스 컨텍스트 연결, 데이터 계보, 셀프 서비스 및 데이터 운영화를 통해 적절한 데이터를 적절한 위치와 시점에 제공할 수 있도록 합니다. 추가 지침을 확인하세요.

IBM Z 시스템에 맞게 더 광범위한 데이터 패브릭 아키텍처 패턴을 특화하면서 다음 두 가지 측면을 중점적으로 다룹니다.

• IBM Z Systems의 다양한 데이터 소스(VSAM, IMS, DB2 등)에 대한 거버넌스와 액세스 관리
• IBM Z 또는 LinuxONE의 Linux(MongoDB 등)
• IBM Z Systems 및 IBM® Z/LinuxONE의 Linux에서 엔터프라이즈 전반의 데이터 패브릭 아키텍처 구성 요소 구현 이 솔루션에는 zSystems / LinuxONE에서 실행되는 구성 요소와 외부 시스템에서 실행되는 구성 요소가 포함됩니다.
데이터 패브릭 참조 아키텍처는 기업이 자체 환경에서 데이터 패브릭의 다양한 구성 요소를 구현하는 데 도움이 되는 지침으로 사용할 수 있는 템플릿입니다. 데이터 패브릭 참조 아키텍처에는 다섯 가지 핵심 모듈이 있으며 메타데이터 가져오기, 메타데이터 보강, 메타데이터 카탈로그화, 데이터 정제 및 변환, 데이터 소비가 포함됩니다. 이 모듈은 앞서 설명한 데이터 패브릭의 이점을 실현하는 데 핵심적인 역할을 합니다.
참조 아키텍처는 다섯 개 모듈의 목표를 실현하는 데 도움이 되는 핵심 구성 요소, 관련 단계 및 각 모듈에 대한 아키텍처 결정을 다룹니다. 또한 이러한 구성 요소와 단계를 구현하기 위해 IBM 기술 환경에서 사용할 수 있는 다양한 기술 옵션을 다룹니다. 데이터 소비 모듈의 경우 일반적인 소비 패턴을 다루며 각 소비 사용 사례의 세부 사항은 해당 사용 사례의 참조 아키텍처에서 다루어진다는 가정을 기반으로 합니다.

IBM Z 아키텍처를 위한 애플리케이션 현대화는 IBM Z 및 LinuxONE에서 시스템 오브 레코드(SOR) 데이터에 현대적이고 보다 쉽게 액세스하기 위한 아키텍처 패턴과 다양한 데이터 통합 중심 패턴을 추가로 설명합니다. 이는 애플리케이션이 직접 액세스, 복제, 캐싱 또는 기업 전반의 데이터 자산을 결합하는 데이터 가상화 개념을 통해 시스템 오브 레코드(SOR) 데이터를 공유하면서 데이터 기반 비즈니스 가치를 위한 인사이트를 확보하는 데 필수적입니다.
또한 전체 데이터, 분석 및 AI 참조 아키텍처도 참고할 수 있습니다.

이름

이슈 또는 문제 정의

가정

동기

데이터 위치, 데이터 중력 및 데이터 주권

AD01

가용성과 규제 요구 사항을 지원하기 위해 적절한 통제 및 데이터 액세스 방법이 마련되어야 합니다.

단순성, 거버넌스, 비용 및 규제 측면을 개선하는 동시에 분석(딥 분석, 의사 결정 최적화 및 AI 워크로드 포함)을 위한 효과적이고 복원력 있으며 유연한 플랫폼을 제공하기 위해 데이터 이동과 복제를 최소화해야 합니다.

선택한 구현 방법은 비용, 지연 시간 요구 사항 지원 가능성, 규제 준수 및 전반적인 고객 만족도에 직접적인 영향을 미칩니다.

가용성과 규제 요구 사항을 지원하기 위해 적절한 통제 및 데이터 액세스 방법이 마련되어야 합니다.

단순성, 거버넌스, 비용 및 규제 측면을 개선하는 동시에 분석(딥 분석, 의사 결정 최적화 및 AI 워크로드 포함)을 위한 효과적이고 복원력 있으며 유연한 플랫폼을 제공하기 위해 데이터 이동과 복제를 최소화해야 합니다.

선택한 구현 방법은 비용, 지연 시간 요구 사항 지원 가능성, 규제 준수 및 전반적인 고객 만족도에 직접적인 영향을 미칩니다.

데이터 위치를 기반으로 워크로드, 지연 시간 및 규제 고려 사항에 따라 데이터를 이동할지 또는 가상 방식으로 액세스할지를 적시에 결정합니다.

지식 카탈로그 조직 및 관계

AD02

조직은 하이브리드 멀티 클라우드 에코시스템과 같이 카탈로그를 가상으로 연결해야 하는 환경을 포함하여 다양한 요구 사항에 따라 여러 개의 카탈로그를 지원해야 할 수 있습니다. 또한 카탈로그 구조는 프로젝트, 사업 부문(LOB) 및 기업 차원의 고려 사항을 기반으로 구성될 수 있습니다. 또한 조직 내에서 실험용 또는 샌드박스 환경, 개발 인스턴스가 필요할 수 있습니다.

카탈로그 인스턴스화는 관리와 탐색이 지나치게 복잡해지지 않으면서 조직의 요구 사항을 지원하는 방식으로 구현되어야 합니다.

카탈로그 선택은 조직이 기업 에코시스템 전반과 잠재적으로 비즈니스 파트너 에코시스템 전반에서 데이터를 활용하는 능력에 영향을 미칩니다.

메타데이터 수집 및 보강을 포함한 데이터 자산 및 관계

AD03

데이터 자산은 점점 더 빠른 속도로 생성되고 소비되고 있습니다. 조직은 데이터 자산과 관련 메타데이터의 수집 및 카탈로그화를 지원하기 위해 더 이상 수동 또는 부분 자동화된 프로세스에 의존할 수 없습니다.

자동화는 다양한 데이터 자산에 대해 생성되는 메타데이터를 적시에 수집하고 보강하는 데 핵심 요소입니다.

자동화가 없다면 조직은 최신 상태이면서 활용 가능한 데이터 자산 카탈로그를 유지할 수 없으며 이는 데이터 기반 조직으로 발전하기 위해 데이터 자산을 활용하는 능력을 저해하게 됩니다.

현재 워크로드와 비기능 요구 사항을 고려하여 적절한 데이터 변환 및 정제 방법 보장

AD04

조직은 변환 및 정제 처리가 필요한 소규모, 중규모, 대규모 및 초대규모 워크로드를 위해 실시간, 준실시간(스트리밍), 배치(마이크로, 미니, 대규모)와 같은 다양한 구현 방식을 필요로 합니다.

구현 방식과 관계없이 데이터 변환과 정제는 일관성을 유지해야 하며 그래야 데이터 과학, 분석 및 보고 기능이 정확하게 작동할 수 있습니다.

적절한 데이터 변환 및 정제 방법을 선택하면 신뢰 가능한 AI, Customer 360 및 인사이트 개발과 같은 다양한 사용 사례에서 조직의 목표를 달성할 수 있습니다.

리소스

데이터 패브릭 아키텍처란 무엇인가

이 블로그 게시물에서 데이터 패브릭 아키텍처의 여섯 가지 핵심 기능에 대해 확인하세요.

데이터 및 분석 데이터 패브릭