2025년 6월 11일, IBM은 데이터 통합에 대한 새로운 접근 방식인 watsonx.data integration을 출시했습니다. 이 솔루션은 기본 제공 관측 가능성을 기반으로 배치, 실시간 스트리밍 및 데이터 복제 파이프라인을 작성할 수 있는 단일 컨트롤 플레인을 제공합니다.

팀은 동일한 솔루션 내에서 정형 데이터 파이프라인과 함께 재사용 가능한 비정형 데이터 파이프라인을 구축하여 이전에는 접근할 수 없었던 데이터의 금광을 발굴하여 새로운 사용 사례를 구축하고 현대 데이터 환경의 변화하는 요구 사항을 충족할 수 있습니다. watsonx.data Integration의 비정형 데이터 통합(UDI) 기능을 통해 사용자는 문서, PDF, PPT 등을 비롯한 대량의 비정형 데이터를 단 몇 분 만에 수집, 변환 및 처리하는 파이프라인을 직관적으로 구축할 수 있습니다.

이 제품은 IBM Research의 획기적인 오픈 소스와 독점적 혁신을 결합한 제품입니다. 동급 최고의 제품 기능은 다음과 같습니다.

사전 구축된 커넥터를 사용하여 광범위한 비즈니스 소스에서 다양한 비정형 데이터 유형을 원활하게 수집

AI를 위한 비정형 콘텐츠 정리, 정규화 및 준비를 위한 사전 구축된 IBM Research 지원 연산자를 사용한 드래그 앤 드롭 변환

검색 증강 생성(RAG) 및 기타 AI 사용 사례를 위해 지원되는 벡터 데이터베이스에 임베딩을 저장할 수 있는 자동화된 벡터 스토어 채우기

전통적으로 활용도가 낮았던 기업 데이터를 처리하도록 설계된 watsonx.data integration은 AI 및 분석을 위해 비정형 데이터를 활용하는 데 있어 큰 진전을 의미합니다.