2026년까지 80% 이상(ibm.com 외부 링크) 기업이 AI API 또는 생성형 AI 애플리케이션을 배포할 예정입니다. AI 모델과 이를 훈련하고 세부적으로 조정하는 데 사용되는 데이터는 일반적인 애플리케이션을 영향력 있는 애플리케이션으로 격상시켜 고객과 기업에 실질적인 가치를 제공할 수 있습니다.
예를 들어, 마스터스 토너먼트 생성형 AI 기반 골프 팬 경험은 실시간 및 과거 데이터를 사용하여 20,000개가 넘는 비디오 클립에 대한 통찰력과 해설을 제공합니다. 데이터의 질과 양이 AI의 성공을 좌우할 수 있으므로 데이터를 효과적으로 활용하고 관리하는 조직은 최대의 이점을 얻을 수 있습니다. 하지만 이는 그렇게 간단하지 않습니다. 데이터의 양과 종류가 폭발적으로 증가하고 있습니다.
IDC(International Data Corporation)에 따르면 2025년까지 저장된 데이터는 온프레미스 및 클라우드 플랫폼 전반에서 250% 증가할 것으로 예상됩니다(ibm.com 외부 링크). 성장에는 복잡성이 수반됩니다. 다양한 데이터 애플리케이션과 형식으로 인해 조직이 AI를 위한 모든 데이터에 효과적으로 액세스, 관리, 사용하기가 더 어려워집니다. 선두 주자라면 금지된 온프레미스 접근 방식과 모놀리식 데이터 에코시스템을 재고하는 동시에 비용을 절감하고 서로 다른 데이터 소스에서 더 많은 데이터에 대한 적절한 데이터 거버넌스와 셀프서비스 접근을 보장해야 합니다.
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
데이터를 AI의 차별화 요소로 활용하려면 기술, 인력, 프로세스의 균형이 필요합니다. 확장형 AI 사용 사례에서는 먼저 생성형 AI로 인해 변경되었을 수 있는 데이터에 대한 전략적 목표를 이해해야 합니다. 기존 기술 투자, 거버넌스 및 자율 관리를 고려하여 데이터 전략을 미래 지향적인 아키텍처에 맞춰 조정하세요. 데이터 온보딩, 데이터 분류, 조직 및 태그 지정과 같은 작업을 자동화하는 데 AI를 활용하세요. 이를 위해서는 데이터 관리 프로세스를 발전시키고 학습 경로를 업데이트해야 합니다.
조직은 AI의 신뢰할 수 있는 데이터에 액세스하기 위해 개방적이고 신뢰할 수 있는 데이터 기반을 구축하는 데 집중해야 합니다. Open은 하이브리드 클라우드, 데이터 스토리지, 데이터 형식, 쿼리 엔진, 거버넌스 및 메타데이터를 포괄하는 개방적이고 상호 운용 가능한 능력을 기반으로 데이터를 저장, 관리, 통합 및 액세스하기 위한 기반을 만들고 있습니다. 이를 통해 데이터 사일로를 제거하고 데이터 기반 혁신을 가속화하는 동시에 기존 기술 투자와 쉽게 통합할 수 있습니다.
신뢰할 수 있는 데이터 기반을 구축하면 고품질, 안정적이고 안전한 관리형 데이터 및 메타데이터 관리가 가능해져 분석 및 AI 애플리케이션에 제공될 수 있으며, 데이터 개인 정보 보호 및 규정 준수 요구 사항도 충족할 수 있습니다. 다음 네 가지 구성 요소는 개방적이고 신뢰할 수 있는 데이터 기반을 구축하는 데 도움을 줍니다.
멀티클라우드 및 하이브리드 전략 도입은 필수가 되어, 하이브리드 클라우드 전반에 걸쳐 유연한 배포를 지원하는 데이터베이스가 필요합니다. Gartner는 새로운 디지털 이니셔티브의 95%(ibm.com 외부 링크)가 대규모 데이터 스토리지와 확장성을 필요로 하는 AI 기술에 필수적인 클라우드 네이티브 플랫폼에서 개발될 것으로 예측합니다.
데이터를 저장하고 분석하려면 워크로드, 데이터 유형 및 가격 성능에 적합한 데이터베이스를 사용해야 합니다. 이를 통해 데이터가 어디에 있든 데이터 요구 사항에 따라 확장되는 데이터 기반을 확보할 수 있습니다. 데이터 전략에는 개방형 및 통합 구성 요소로 설계된 데이터베이스를 포함해야 하며, 이를 통해 데이터 플랫폼 내에서 고급 분석 및 AI 애플리케이션을 위한 데이터의 원활한 통합 및 접근이 가능합니다. 이를 통해 조직은 귀중한 통찰력을 추출하고 정보에 입각한 의사 결정을 내릴 수 있습니다.
예를 들어, 조직은 가장 중요한 운영 데이터를 관리하기 위해 고성능의 안전하고 회복력이 있는 트랜잭션 데이터베이스가 필요합니다. 하이브리드 클라우드를 활용하면 조직은 데이터베이스를 통해 레거시 애플리케이션을 현대화하고, 새로운 클라우드 네이티브 애플리케이션을 구축하며, AI 어시스턴트와 엔터프라이즈 애플리케이션을 구동할 수 있습니다.
데이터 유형과 애플리케이션이 발전함에 따라 다양한 데이터 구조와 특정 애플리케이션 요구 사항을 처리하기 위해 특화된 NoSQL 데이터베이스가 필요할 수 있습니다. 여기에는 IoT, 콘텐츠 관리, 지리공간 애플리케이션 등 다양한 요구 사항을 충족하는 시계열, 문서, 메시징, 키-값, 전체 텍스트 검색 및 메모리 내 데이터베이스가 포함됩니다.
거래 및 목적형 데이터베이스 전반에 걸쳐 AI 및 분석 워크로드를 구동하려면, 중복이나 추가적인 추출, 변환, 로드(ETL) 프로세스 없이 데이터 레이크하우스 아키텍처와 원활하게 통합될 수 있도록 해야 합니다. 오픈 데이터 레이크하우스를 사용하면 데이터가 어디에 있든 단일 데이터 사본에 액세스할 수 있습니다.
오픈 데이터 레이크하우스는 클라우드 오브젝트 스토리지를 통한 Apache Iceberg와 같은 여러 오픈 포맷을 처리하며, 하이브리드 클라우드 전반에 걸쳐 다양한 소스와 기존 저장소의 데이터를 결합합니다. 가장 가성비 높은 데이터 레이크하우스도 여러 오픈 소스 쿼리 엔진과 함께 스토리지와 컴퓨팅을 분리하고, 다른 분석 엔진과의 통합을 통해 워크로드를 최적화하여 우수한 가격 성능을 제공합니다.
여기에는 데이터 웨어하우스 엔진과의 통합이 포함되며, 이제는 실시간 데이터 처리 및 의사 결정과 비용 효율적인 오브젝트 저장, 오픈 소스 기술, 데이터 레이크하우스와 원활하게 데이터를 공유하는 공유 메타데이터 계층을 갖춘 통합을 통해 균형을 맞춰야 합니다. 오픈 데이터 레이크하우스 아키텍처를 통해 이제 데이터 웨어하우스 워크로드를 가격 경쟁력 최적화하고, 전통적인 데이터 레이크를 더 나은 성능과 AI용 거버넌스로 현대화할 수 있습니다.
기업에는 엑사바이트는 아니더라도 페타바이트급의 귀중한 독점 데이터 저장소가 메인프레임에 있을 수 있으며, 새로운 인사이트와 ML/AI 모델을 위해 잠금 해제해야 할 수도 있습니다. 조직은 메인프레임과 Iceberg와 같은 오픈 포맷 간의 데이터 동기화를 지원하는 오픈 데이터 레이크하우스를 통해 사기를 더 잘 식별하고, 구성원 행동을 이해하며, 예측 AI 모델을 구축하여 고급 비즈니스 결과를 이해, 예측, 영향을 미칠 수 있습니다.
비즈니스를 위한 신뢰할 수 있는 생성형 AI를 구축하려면 먼저 이질적인 데이터를 준비하고 양질의 데이터로 변환할 수 있는 올바른 데이터 아키텍처가 필요합니다. 생성형 AI의 경우 올바른 데이터 기반에는 대화를 위한 NoSQL 데이터베이스, 컨텍스트 데이터를 위한 트랜잭션 데이터베이스, AI 및 분석을 위해 데이터에 액세스하고 준비하기 위한 데이터 레이크하우스 아키텍처, 임베딩을 저장하고 검색하기 위한 벡터 임베딩 기능, 분석 및 검색 증강 생성(RAG)가 포함될 수 있습니다. 공유 메타데이터 계층, 데이터를 카탈로그화하는 거버넌스 및 데이터 리니지를 통해 신뢰할 수 있는 AI 아웃풋을 얻을 수 있습니다.
중요한 의사 결정을 내리는 데 인공 지능(AI)에 점점 더 의존하는 조직이 늘어남에 따라 데이터 품질과 거버넌스의 중요성은 아무리 강조해도 지나치지 않습니다. Gartner에 따르면 2025년까지 데이터 품질 저하, 부적절한 리스크 관리, 비용 증가 또는 불분명한 비즈니스 가치로 인해 30%의 생성형 AI 프로젝트가 중단될 것으로 예상됩니다. 품질이 낮은 데이터를 사용하면 고객 신뢰 약화, 규정 미준수, 재정 및 평판 손상 등 그 결과는 광범위합니다.
이러한 위험을 완화하려면 효과적인 데이터 품질 관리가 중요합니다. 이 목표를 달성하려면 잘 설계된 데이터 아키텍처 전략이 필수적입니다. 데이터 패브릭은 데이터 리더가 데이터 프로파일링, 데이터 품질 규칙 설계 및 적용, 데이터 품질 위반 발견, 데이터 정리 및 데이터 보강을 수행할 수 있는 강력한 프레임워크를 제공합니다. 이러한 접근 방식은 데이터 품질 이니셔티브가 정확성, 접근성, 적시성 및 관련성을 보장합니다.
더불어, 데이터 패브릭은 데이터 관측 기능을 통해 데이터 품질 수준을 지속적으로 모니터링할 수 있게 하여, 조직이 데이터 문제를 더 큰 문제로 확대하기 전에 식별할 수 있게 합니다. 또한 데이터 흐름에 대한 이러한 투명성을 통해 데이터 및 AI 리더는 잠재적 문제를 식별하여 올바른 데이터가 의사 결정에 사용되도록 할 수 있습니다.
조직은 데이터 품질 및 거버넌스를 우선시함으로써 AI 시스템에 대한 신뢰를 구축하고 위험을 최소화하며 데이터의 가치를 극대화할 수 있습니다. 데이터 품질은 단순한 기술적인 문제가 아니라 관심과 투자가 필요한 중요한 비즈니스 필수 요소라는 점을 인식하는 것이 중요합니다. 올바른 데이터 아키텍처 전략을 채택함으로써 조직은 AI 이니셔티브의 잠재력을 최대한 활용하여 비즈니스 성공을 이룰 수 있습니다.
올바른 데이터 세트로 AI 모델을 구축하는 것부터 산업별 엔터프라이즈 데이터로 AI 모델을 조정하는 것, 벡터화된 임베딩을 사용하여 RAG AI 애플리케이션(챗봇, 개인화된 추천 시스템 및 이미지 유사성 검색 애플리케이션 포함)을 구축하는 것까지 데이터는 AI의 기본이 됩니다.
신뢰할 수 있고 관리형 데이터는 AI의 정확성, 관련성, 정밀성을 보장하는 데 필수적입니다. AI에서 데이터의 완전한 가치를 실현하려면, 기업은 복잡한 IT 환경을 탐색하여 데이터 사일로를 허물고, 데이터를 통합하며, AI 모델과 애플리케이션에 신뢰할 수 있고 관리형 데이터를 준비하고 제공할 수 있어야 합니다.
데이터 웨어하우스, 데이터 레이크, 메인프레임 환경 등 기존 데이터 자산의 중요한 데이터에 연결하고 액세스할 수 있는 개방형 포맷 기반의 개방형 데이터 레이크하우스 아키텍처를 사용하면 엔터프라이즈 데이터의 단일 복사본을 사용하여 AI 모델과 애플리케이션을 구축하고 조정할 수 있습니다.
시맨틱 계층을 사용하면 고객이 시맨틱 검색을 통해 데이터 자산 전반에서 이전에 암호화된, 효과적으로 구조화된 데이터를 자연어로 찾고 이해할 수 있는 데이터 보강을 생성하여 SQL 없이도 데이터 디스커버리를 가속화하고 데이터 인사이트를 더 빠르게 확보할 수 있습니다.
레이크하우스에 직접 내장된 벡터 데이터베이스를 사용하면 RAG 사용 사례를 위해 데이터를 벡터화된 임베딩으로 원활하게 저장하고 쿼리하여 AI 아웃풋의 관련성과 정확도를 향상시킬 수 있습니다.
개방적이고 신뢰할 수 있는 데이터 기반을 구축하면 데이터의 잠재력을 최대한 활용하고 데이터에서 가치를 창출할 수 있습니다. 이는 신뢰할 수 있는 데이터를 사용하는 AI 제품 포트폴리오를 기반으로 하는 데이터 제품, AI 어시스턴트, AI 애플리케이션, 비즈니스 인텔리전스 솔루션을 구축함으로써 달성할 수 있습니다.
예를 들어 데이터 제품은 예측 모델, 데이터 시각화 또는 데이터 API와 같이 비즈니스 가치를 창출하는 데 사용할 수 있는 재사용 가능한 패키지 데이터 자산입니다. AI 어시스턴트, 애플리케이션 및 AI 기반 비즈니스 인텔리전스는 인사이트, 추천 및 예측을 제공하여 사용자가 더 나은 의사 결정을 내릴 수 있도록 도와줍니다. 올바른 데이터를 활용하면 비즈니스 가치와 혁신을 주도하는 데이터 중심 조직을 만들 수 있습니다.
AI를 위한 데이터 기반 구축을 시작하려면 IBM 데이터베이스인 watsonx.data 및 데이터 패브릭을 통한 데이터 관리 솔루션을 살펴보고 신뢰할 수 있는 데이터로 AI를 확장하세요.
IBM과 함께하는 웨비나에 참여하여 산업 전반의 사례, 사용 사례, IBM의 자체 성공 사례를 살펴보며 에이전틱 AI 이니셔티브를 통해 ROI를 실현하는 방법을 알아보세요.
IBM이 2025년 Gartner Magic Quadrant™ 데이터 과학 및 머신 러닝 플랫폼 부문에서 리더로 선정된 이유를 알아보세요.
조직이 서로 다른 파일럿을 통해 AI를 도입하는 것에서 AI를 사용하여 조직의 중심에서 혁신을 추진하는 것으로 전환하는 방법을 알아보세요.
IBM® Granite는 비즈니스에 맞게 맞춤화되고 AI 애플리케이션 확장에 최적화되었으며 개방적이고 성능이 뛰어나며 신뢰할 수 있는 AI 모델 제품군입니다. 언어, 코드, 시계열 및 가드레일 옵션을 살펴보세요.
IBM은 2,000개 조직을 대상으로 AI 이니셔티브에 대한 설문조사를 실시해 효과적인 전략과 효과적이지 못한 전략, 그리고 앞서나갈 수 있는 방법을 알아보았습니다.
다음 다섯 가지 사고 전환을 실행하여 불확실성을 극복하고 비즈니스 혁신을 촉진하며 에이전틱 AI를 통해 성장을 가속화하세요.
AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.
업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.
IBM Consulting AI 서비스는 기업이 AI 활용 방식을 재구상하여 혁신을 달성하도록 지원합니다.
IBM Concert는 AI를 사용하여 운영에 관한 중요한 인사이트를 발견하고 개선을 위한 애플리케이션별 권장 사항을 제공합니다. Concert를 통해 비즈니스를 발전시키는 방법을 알아보세요.