두 개의 다채로운 아이콘이 DNA 가닥처럼 화면에 수평으로 얽혀 있는 디지털 일러스트

watsonx.data에서 출시 예정: OpenRag를 사용하여 비정형 데이터를 AI컨텍스트로 전환

비정형 데이터에 갇혀 있는 지식을 AI용 컨텍스트로 전환합니다. OpenRAG는 보다 정확하고 신뢰할 수 있는 AI를 위해 안전한 에이전트 검색을 제공합니다.

IBM이 출시하는 OpenRAG는 기업 지식을 신뢰할 수 있는 AI용 컨텍스트로 대규모로 안전하게 전환하도록 설계된 개방형 에이전트 검색 프레임워크입니다. AI 지원 데이터 접근, 전처리, 제공을 위한 IBM의 개방형 하이브리드 데이터 플랫폼 watsonx.data에서 곧 OpenRAG를 이용하실 수 있습니다.

많은 RAG 솔루션이 검색, 오케스트레이션, 모델을 폐쇄형 시스템에 번들로 제공합니다. OpenRAG를 사용하면 공급업체가 제어하는 단일 스택에 얽매이지 않고 데이터를 수집, 검색 및 추론하는 방식을 제어할 수 있습니다.

OpenRAG는 동급 최고의 오픈 소스 기술 세 가지를 구성 가능한 기반으로 통합합니다. 이 도구들은 종합적으로 20만 개 이상의 GitHub 별과 수백만 건의 다운로드를 축적했습니다.

  • Docling - 복잡한 파일을 AI 지원 데이터로 변환
  • OpenSearch - 하이브리드 검색과 조회용
  • Langflow - 워크플로 오케스트레이션용

OpenSearch는 watsonx.data에 내장형 검색과 검색 엔진 형태로 곧 추가될 예정이며, AI가 적절한 시점에 적절한 컨텍스트를 얻을 수 있도록 검색 품질을 개선합니다. watsonx.data에서 OpenSearch와 OpenRag는 오픈 소스 환경을 보존하는 동시에 보안 및 모니터링 기능이 내장된 완전 관리형 SaaS 제품을 제공합니다.

기업 지식을 AI용 컨텍스트로 전환

AI가 실험 단계에서 광범위한 배포 단계로 이동함에 따라 AI의 가치가 컨텍스트에 따라 달라진다는 사실이 더욱 분명해지고 있습니다. 신뢰할 수 있는 의사 결정에 도움이 되기 위해, AI는 기반이 되는 데이터는 물론 데이터가 나타내는 내용과 사용 방법도 이해해야 합니다.

다행히도 모든 조직은 AI로 운영할 수 있는 방대한 지식 저장소를 갖췄습니다. 유일한 문제는 이 데이터가 이메일, 지원 티켓, 통화 기록, PDF 같은 형식에 갇혀 있다는 것입니다. 기업 데이터의 약 90% 를 차지하는 비정형 데이터는 AI에 있어 중요하지만 거의 활용되지 않은 자원입니다. 이러한 자원을 AI가 수백만 개의 파일과 시스템에서 안정적으로 검색하고 활용할 수 있는 형태로 전환하는 것이 관건입니다.

많은 팀이 AI가 기업 데이터에 기반을 두게 만들고자 검색 증강 생성(RAG)을 도입합니다. 그러나 기존 RAG는 프로덕션 측면에서 부족한 경우가 많습니다. 싱글샷 검색, 고정 파이프라인 로직에 의존하고 복잡한 질문에 어려움을 겪으며, 특히 워크로드가 증가하고 사용량이 증가하면 운영이 어려워집니다.

에이전틱 RAG를 활용한 답변의 신뢰도 향상

OpenRAG on watsonx.data는 에이전트의 방식으로 RAG에 접근합니다. 사용자의 의도를 이해하고 다단계 추론과 도구 호출을 활용하여 일관성 있게 정확하고 신뢰할 수 있으며 안정적인 아웃풋을 도출합니다.

기존 RAG 시스템과 watsonx.data 에이전틱 RAG의 차이를 보여주는 그래픽

OpenRag를 사용하면 watsonx.data에서든 Google Drive, Microsoft OneDrive, Microsoft SharePoint AWS S3 같은 클라우드 스토리지 시스템에서든 AI 워크플로를 지식 기반에 쉽게 연결할 수 있습니다. 또한 모델 선택이 중요하기 때문에 OpenAI와 Anthropic의 프론티어 모델을 사용하거나, watsonx.ai에 연결하여 자체 맞춤형 모델을 포함한 수천 개의 모델 중 원하는 것을 선택할 수 있습니다.

데이터, 모델, 도구와 연결되면 검색은 추론 과정의 일부가 됩니다. 에이전트는 검색 시점을 결정하고, 올바른 도구를 호출하고, 추가 컨텍스트를 검색하고, 근거 있는 답변을 제공하기에 충분한 정보를 얻을 때까지 반복적으로 응답을 개선할 수 있습니다.

이 접근 방식을 취하면 광범위한 워크플로가 구현됩니다. 고객 지원 담당자는 관련 티켓과 문서를 조회하고 내부 API를 호출하여 주문 상태를 확인할 수 있습니다. 영업 사원은 연결된 CRM에서 인사이트를 추출하고 통화 기록을 호출해서 맞춤형 계정 개요를 구성할 수 있습니다. 규정 준수 담당자는 정책 전반을 검색 및 추론하고, 관련 조항을 추출하고, 규제 지침에 대한 권장 사항을 검증할 수 있습니다.

OpenRag는 watsonx.data에서 실행되기 때문에 이러한 애플리케이션은 단일 저장소에 국한되지 않고 어디서든 정형 데이터와 비정형 데이터에 안전하게 접근할 수 있습니다. OpenRag는 PDF, 이미지, PowerPoint, Excel 파일을 비롯한 20개 이상의 파일 형식을 지원하므로 AI 워크플로가 직원들이 쿼리하기 가장 쉬운 데이터뿐만 아니라 매일 의존하는 지식에 접근할 수 있습니다.

에이전틱 검색의 엔진

OpenSearch는 내부에서 OpenRag의 핵심 검색 기능인 인덱싱, 하이브리드 키워드 및 벡터 검색, 쿼리 파이프라인 및 검색을 제공하며, 그 자체로도 강력한 오픈 소스 엔터프라이즈 검색 도구입니다.

OpenSearch on watsonx.data는 장기간 실행되고 처리량이 많은 프로덕션 워크로드용으로 개발되었습니다. 팀은 여러 도구를 함께 사용하지 않고도 엔터프라이즈급 검색과 조회를 수행할 수 있습니다.

OpenSearch는 본질적으로 고급 전체 텍스트 검색에 최신 시맨틱 조회를 결합합니다. 기존 키워드 검색은 정확한 일치와 세밀한 관련성 조정을 보장하는 반면, 네이티브 벡터 검색은 임베딩 전반에 걸쳐 유사성을 기반으로 검색하여 의미와 맥락을 포착합니다. 하이브리드 검색은 이러한 접근 방식을 통합 스코어링 모델에 결합해서 정확한 일치와 의미론적 이해의 균형을 유지하여 검색 품질을 개선합니다.

이렇게 하면 현재 엔터프라이즈 데이터에서 작동하는 RAG 파이프라인, AI 에이전트, 시맨틱 검색 애플리케이션에 대해 보다 정확하고 관련성이 높으며 설명 가능한 결과를 얻을 수 있습니다.

신뢰할 수 있는 AI를 위한 내장형 거버넌스

watsonx.data에서 OpenRAG와 OpenSearch를 사용하면 내장된 보안, 신원 및 접근 제어 기능을 활용하여 안심하고 워크로드를 배포할 수 있습니다. 데이터 검색, 사용자 인풋과 AI 아웃풋에 관한 거버넌스는 가시성, 위험 관리, 규정 준수 및 감사 가능성을 대규모로 보장합니다.

OpenSearch를 핵심 검색 엔진으로 사용하는 OpenRag는 조직 데이터의 전체 범위에서 검색, 추론 및 조치를 취할 수 있는 AI 워크플로를 지원합니다. 이 기능들은 곧 watsonx.data에 도입될 예정이며, 이를 통해 아직은 문서 속에 묻혀 있는 지식을 활용 가능하고 검색 가능한 형태로 전환하여, 생산 준비된 AI 에이전트를 지원하게 만들 것입니다.

OpenRAG에 대해 자세히 보기

watsonx.data 무료로 시작하기

Dima Spivak

Vice President, Product Management, watsonx.data

Emma Gauthier

Product Marketing Manager, watsonx.data