에이전트형 AI의 비정형 데이터 문제: IBM에서 솔루션 공개

watsonx.data 그래픽

작가

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

이번 주 Think에서 IBM은 AI용 데이터 스택을 획기적으로 간소화하고 있습니다.

IBM은 watsonx.data의 대대적인 진화를 예고하고 있으며, 이는 조직이 데이터를 AI에 대비하고 개방형 하이브리드 데이터 기반과 엔터프라이즈급 정형 및 비정형 데이터 관리를 제공하는 데 도움이 될 수 있습니다.

그 결과는 어떨까요? IBM watsonx.data로 테스트한 결과, 기존 RAG보다 AI 정확도가 40% 더 높습니다.1 6월에 출시될 예정인 제품과 기능은 다음과 같습니다.

  • Watsonx.data 통합, 유연성과 확장성을 핵심으로, 단일 인터페이스에서 다양한 통합 스타일과 형식에 걸쳐 데이터 접근 및 엔지니어링을 조정하는 소프트웨어
  • Watsonx.data 인텔리전스, 조직이 의미 있는 데이터를 큐레이션, 관리 및 활용하는 방식을 혁신하고 AI의 힘을 활용하여 데이터 거버넌스를 간소화하는 소프트웨어
  • watsonx를 Meta의 Llama Stack에 API 공급자로 추가하여, 기업이 개방성을 핵심으로 생성형 AI를 대규모 배포할 수 있는 역량 향상

Watsonx.data 통합 및 Watsonx.data 인텔리전스는 독립형 제품으로 제공되며, 일부 기능은 Watsonx.data를 통해서도 제공되어 고객의 선택권과 모듈성을 극대화할 수 있습니다.

이러한 제품을 보완하기 위해 IBM은 최근 비정형 데이터를 생성형 AI에 활용하는 데 탁월한 DataStax를 인수하겠다는 의사를 발표했습니다. DataStax를 통해 고객은 추가 벡터 검색 능력에 액세스할 수 있습니다.

선택된 오픈 소스 상품 추론, 판단, 임베딩 모델과 추가 변수의 동일한 세트를 사용하는 IBM 독점 데이터 세트를 활용한 세 가지 일반적인 사용 사례에서 watsonx.data Premium Edition 검색 계층을 사용한 AI 모델 아웃풋의 응답 정확도를 벡터 전용 RAG와 비교한 내부 테스트를 기반으로 합니다. 결과는 상황에 따라 달라질 수 있습니다.

이러한 대대적인 진화의 배경

기업들은 정확하고 성능이 뛰어난 생성형 AI, 특히 에이전틱 AI에 대한 주요 장벽에 직면해 있습니다. 하지만 그 장벽은 대부분의 비즈니스 리더들이 생각하는 것과는 다릅니다.

문제는 추론 비용이나 파악하기 어려운 '완벽한' 모델이 아닙니다. 문제는 바로 데이터입니다.

조직이 에이전틱 AI가 진정한 가치를 창출하기 위해서는 신뢰할 수 있는 회사별 데이터, 즉 이메일, 문서, 프레젠테이션, 동영상 등에 포함된 비정형 데이터가 필요합니다.  2022년에는 기업에서 생성된 데이터의 90%가 비정형 데이터인 것으로 추정되지만, IBM은 LLM에서 차지하는 데이터의 비율은 1%에 불과할 것으로 예상하고 있습니다.

비정형 데이터는 활용하기가 매우 어려울 수 있습니다. 매우 분산되어 있고, 동적이며, 다양한 형식 안에 갇혀 있고, 깔끔한 레이블이 부족하며, 완전히 해석하기 위해 추가 컨텍스트가 필요한 경우가 많습니다. 기존의 검색 증강 생성(RAG)은 가치를 추출하는 데는 효과적이지 않으며 비정형 데이터와 정형 데이터를 적절하게 결합할 수 없습니다.

한편, 연결되지 않은 다양한 도구로 인해 AI용 데이터 스택이 복잡하고 번거로워질 수 있습니다. 기업은 데이터 웨어하우스, 데이터 레이크, 데이터 거버넌스, 데이터 통합 도구를 동시에 사용하고 있습니다. 데이터 스택은 관리해야 하는 비정형 데이터만큼이나 혼란스럽게 느껴질 수 있습니다.

많은 조직은 근본적인 문제를 해결하지 못하고 있습니다. 그 아래에 있는 필수 데이터 계층이 아닌, 생성형 AI 애플리케이션 계층에만 집중합니다. 조직이 데이터 기반을 개선하지 못하면 AI 에이전트 및 기타 생성형 AI 이니셔티브는 그 잠재력을 최대한 발휘하지 못할 것입니다.

조직이 데이터를 AI에 대비할 수 있도록 지원

IBM의 새로운 기능을 통해 조직은 비정형(및 정형) 데이터를 수집, 관리, 검색하고 이를 통해 정확하고 성능이 뛰어난 생성형 AI를 확장할 수 있습니다.

업데이트 소식 구독하기

IBM의 최신 제품 뉴스

제품에 관한 최신 화상 채팅을 포함한 중요 제품 및 기능 발표와 IBM 및 IBM의 교육 파트너가 제공하는 교육 오퍼링을 받아보세요. IBM 개인정보 보호정책을 참조하세요.

감사합니다! 구독이 완료되었습니다.