데이터는 AI 엔진을 작동하게 하는 원동력입니다. 그리고 많은 기업들이 어떻게 데이터 탱크를 채울지 몰라 손쉽게 확보할 수 있는 비정형 데이터의 보물창고를 최대한 활용하지 못하고 있습니다.

이것이 바로 비정형 데이터를 처리할 수 있는 툴을 갖춘 기업이 투자자들의 관심을 끄는 이유입니다. 지난달, Salesforce는 최근 비정형 데이터 관리 공급업체에 대한 여러 투자 중 하나로, Agentforce 플랫폼을 강화하기 위한 대규모 인수를 단행했습니다.

“생성형 AI는 머신 러닝, 비즈니스 인텔리전스, 데이터 엔지니어링을 위한 LLM 미세 조정 및 기존 분석뿐만 아니라 RAG를 위한 비정형 데이터, 즉 문서의 중요성을 높였습니다”라고 IBM watsonx 제품 관리 부문 부사장이자 IBM의 상주 데이터 전문가 중 한 명인 Edward Calvesbert는 말합니다. “매일 생성되는 대부분의 데이터는 비정형 데이터이며, 이는 가장 큰 새로운 기회를 제공합니다.”

우리는 비정형 데이터의 AI 활용 가능성에 대해 자세히 알아보고 싶었습니다. 그래서 지난 3월 IBM, Nvidia, Databricks와 4천만 달러의 투자를 성사시킨 데이터 과학 회사 Unstructured의 전략 책임자인 Dave Donahue는 Calvesbert와 함께 비정형 데이터의 중요성과 앞으로 나아갈 방향에 대해 이야기를 나누었습니다.