현대적 데이터 아키텍처 구축

데이터 아키텍처의 계층을 추상적으로 표현한 일러스트
목적에 맞는 데이터 아키텍처가 비즈니스에 꼭 필요한 이유

데이터 리더는 손끝으로 만날 수 있는 엄청난 양의 데이터로 인해 많은 기회와 도전 과제가 발생할 수 있다는 것을 알고 있습니다. AI 모델을 학습시키고 중요한 사용 사례를 처리하기 위해 더 많은 데이터를 확보해야 하지만, 데이터 자산 전반의 복잡성 증가와도 싸워야 합니다.

목적에 맞는 최신 데이터 아키텍처는 임박한 데이터 증가를 처리하는 데 필요한 확장성을 제공하여 AI 기술을 운영하고 데이터 자산을 최적화하는 데 도움을 줍니다. 이는 엔터프라이즈급 AI를 확장하는 핵심 요소이며, 가장 큰 경쟁 차별화 요소가 될 수 있습니다.

데이터 아키텍처의 필요성

데이터 아키텍처란 무엇인가요?

데이터 아키텍처는 수집에서 소비에 이르는 과정에서 조직에서 설정한 모델, 정책, 규칙 및 표준을 사용하여 데이터를 관리하는 방법을 설명합니다. 데이터가 어디에 있든 데이터 분석가가 데이터를 진정으로 이해하는 데 도움을 주고, 비즈니스 성장에 따른 새로운 배포 및 애플리케이션 요구 사항을 염두에 두도록 지원합니다.

데이터 아키텍처는 현대 조직의 특수한 요구 사항을 충족하고, 고급 분석을 적용하고, 데이터와 AI를 대규모로 사용하는 데 필수적입니다.

40~90%

기업에서 제어하는 데이터 중 사용되지 않는 비율1

데이터 아키텍처가 비즈니스 필수 요소인 이유는 무엇인가요?
 
IBV가 보고한 바에 따르면, 아무리 뛰어난 AI라도 신뢰할 수 있고 안정적인 데이터가 없으면 오류가 생기거나, 편향되거나, 위험한 결과를 제공할 수 있습니다. 하지만 데이터 하우스를 정리하는 일은 결코 쉬운 일이 아니며, 많은 기업에서 아직 완료하지 못한 과제입니다.2

즉, 데이터의 품질, 보안 및 접근성이 그 어느 때보다 중요해졌습니다.

효과적인 데이터 아키텍처는 변화하는 조직 요구의 속도, 규모, 방향을 지원할 수 있는 유연성과 높은 수준의 프레임워크를 갖추고 있으며, 생성형 AI를 통한 프로세스 자동화부터 데이터 최적화에 이르는 다양한 사용 사례를 지원합니다.

성공적인 데이터 아키텍처를 위한 네 가지 기준:
간소화

단순할수록 좋습니다. 명확성과 접근성을 염두에 두고 아키텍처를 설계하세요.

확장성

성장을 고려하세요. 증가하는 수요를 수용할 수 있는 아키텍처를 구축하세요.

유연성

변화는 피할 수 없습니다. 확장 및 새로운 기술에 적응할 수 있는 아키텍처를 선택하세요.
 

조화

잘 어울리면 더 좋습니다. 데이터 아키텍처는 달성하려는 비즈니스 성과에 부합해야 합니다.

최신 데이터 아키텍처의 요소

데이터 관리에 필요한 기술, 프로세스, 인력을 정의하는 상세한 데이터 전략을 개발하는 것은 목적에 맞는 아키텍처, 즉 모든 사용 사례에 대해 일관성 있고 고품질의 데이터를 제공하는 아키텍처를 만드는 첫 번째 단계입니다.

최신 데이터 아키텍처를 구축할 때 다음 요소를 고려하세요.

데이터 레이크하우스

데이터 레이크하우스 아키텍처를 사용하면 단일 진입 지점에서 하이브리드 클라우드 전반의 데이터에 액세스할 수 있어 AI 모델을 위한 데이터를 통합, 큐레이션 및 준비할 수 있습니다. 이 아키텍처는 데이터 레이크의 유연성과 데이터 웨어하우스의 성능 및 구조를 결합한 것입니다. 대부분의 레이크하우스 솔루션에는 비정형 데이터를 보다 쉽게 분류하고 정리할 수 있는 지능형 메타데이터 계층이 있습니다.

또한 데이터 레이크하우스는 조직이 데이터와 실제 비즈니스 요구 사항에 대한 정확한 이해를 바탕으로 가성비가 우수한 워크플로우를 구축하는 데 도움이 됩니다. 이를 통해 워크플로우를 최적화하여 비용과 성능을 개선하고 데이터의 숨겨진 연관성을 발견할 수 있습니다.

데이터 레이크하우스에서 최적화되고 관리되는 데이터에 대한 액세스를 민주화하려면 데이터 패브릭을 구현하는 것을 고려해야 합니다.

영상 보기(13:33)

데이터 패브릭

데이터 패브릭은 데이터 아키텍처 및 관리 도구 진화에 있어 다음 단계입니다. 다양한 데이터 파이프라인과 클라우드 환경에서 유동성을 높여 최종 사용자가 데이터에 안전하게 액세스하고 셀프서비스 데이터 소비를 촉진할 수 있도록 설계되었습니다.

데이터 패브릭 아키텍처는 데이터 파이프라인에서 학습하는 지능적이고 자동화된 시스템을 사용하여 엔드투엔드 통합을 간소화합니다. 데이터 과학자는 다양한 데이터 소스를 통합하여 고객에 대한 전체적인 뷰를 만들고 하나의 대시보드에서 액세스 가능하게 만들 수 있습니다. 그런 후 아키텍처가 데이터의 가치를 더 잘 포착하고 생산성을 높이기 위한 권장 사항을 제시하여 모든 데이터 제품의 가치 실현 시간을 단축합니다.

데이터 패브릭 작동 방식 간략히 보기
다운로드 데이터 패브릭 집중 분석 데이터 패브릭은 중점 영역 내에서 개발되며 사용자, 페르소나 및 디바이스의 특수한 데이터 요구 사항을 지원하도록 설계됩니다. 데이터 지속성과 워크로드 배치를 극대화하여 관리되지 않는 중복을 방지하고, 데이터 이동을 최적화 및 축소하여 최종 사용자의 데이터 흐름을 개선합니다. 다이어그램을 다운로드하여 이 아키텍처 접근 방식이 데이터 접근을 어떻게 간소화하는지 알아보세요.
데이터 패브릭 작동 방식 간략히 보기

데이터베이스



데이터베이스는 데이터 세트를 저장, 관리 및 보호하기 위한 디지털 저장소이며 데이터 아키텍처의 필수 요소입니다.

애플리케이션은 고급 분석 및 AI 사용 사례를 지원하기 위해 하이브리드 클라우드 환경에서 방대한 양의 정형 및 비정형 데이터를 저장, 관리 및 제어할 수 있어야 합니다.

조직은 AI를 성공적으로 운영하려면 워크로드에 적합한 데이터베이스를 적절한 가격에 찾아야 합니다. 모든 데이터베이스는 신뢰할 수 있고, 안전하고, 응답성이 뛰어나야 하며, 특정 워크로드 및 요구 사항에 맞도록 목적에 따라 구축되어야 합니다.

고객은 최대 9개의 서로 다른 데이터베이스 유형과 각 데이터베이스의 여러 인스턴스를 갖고 있을 수 있습니다. 데이터 패브릭은 이러한 데이터 사일로에 질서를 부여합니다.
에드워드 칼베스버트(Edward Calvesbert) watsonx 플랫폼 소프트웨어 제품 관리 담당 부사장 IBM
현대화를 통한 최적화

인프라에서 데이터에 액세스하고 관리하는 만큼, 데이터에 액세스하고 관리하는 방법을 계획할 때 인프라에 특별히 신경써야 합니다.

AI를 확장하고 데이터 엔지니어가 최신 워크로드와 수요에 대응할 수 있도록 인프라를 현대화해야 할 수도 있습니다. 비즈니스 목표에 맞춰 기술을 조정하고, 확장성을 강화하며, 전반적인 비즈니스 성과를 개선하는 데 중점을 둔 하이브리드 클라우드 방식으로 전환하는 조직이 많아지고 있습니다.

하이브리드 클라우드 플랫폼은 환경, 워크플로우 및 팀 전반에 걸쳐 일관된 경험을 제공합니다.

데이터가 기업의 길을 안내하는 북극성이라면, 해당 데이터에 액세스하고 관리하는 데 사용되는 인프라가 중요한 것은 당연합니다. 특히 환경 전반에서 요구되는 신뢰와 투명성 수준이 중요합니다.
Ric Lewis 인프라 부문 수석 부사장 IBM
다음 단계

잘 설계된 아키텍처는 조직이 데이터를 사용하는 방식에 대한 강력한 토대가 되어줍니다. 의도적인 아키텍처 결정은 하이브리드 클라우드 및 AI 기능을 최대한 활용하여 비즈니스 성과를 창출하는 데 도움이 됩니다.

다른 장 읽기 뉴스레터 구독하기
데이터 관리 솔루션

데이터 관리 솔루션이 데이터의 가치를 실현하는 데 어떻게 도움이 되는지 알아보세요.

자세히 보기
하이브리드 중심 설계

데이터를 활용하는 하이브리드 클라우드로 ROI를 극대화하세요.

하이브리드 클라우드 솔루션 살펴보기
데이터와 관련하여 도움이 필요하세요?

데이터 전략, 아키텍처 등을 설계하는 데 IBM이 어떤 도움을 드리는지 알아보세요.

 

IBM Consulting 살펴보기
각주

1 How Strong Is Your Data Balance Sheet?, Scott A. Snyder, Knowledge at Warton, 2022년 11월.
2 CEO decision-making in the age of AI, Global C-suite Series, IBM Institute for Business Value, 2023년 6월.