Shorthills는 IBM® watsonx.data의 Astra DB를 벡터 데이터베이스와 Langflow를 사용하여 RAG 시스템 과정의 반복 작업을 가속화하고 재현율과 정밀도를 60% 개선했습니다.
의미론적 검색과 검색 증강 생성(RAG) 같은 최신 인공지능 기술은 로펌이 방대한 문서를 뒤지는 데 소요되는 시간을 줄여줄 수 있습니다. 개념적으로 관련된 섹션을 찾고, 중요한 내용을 요약하고, 추적 가능한 인용을 반환하여 결과를 검증할 수 있도록 합니다.
이 작업이 잘 이루어지면, '탭을 10개씩 열어놓고' 진행하는 수동 워크플로를 증거 기반의 안내형 검색 경험으로 바꿀 수 있습니다. 법률 검색에서 사용자에게 필요한 건 단순한 답이 아닌 정답닙니다. 올바른 당국, 관련 예외 사항, 정확한 인용 구절을 통해 신속하게 답변이 입증되어야 합니다.
뉴저지에 본사를 둔 Shorthills AI는 이러한 목표를 염두에 두고 RAG와 지식 그래프를 사용하여 도메인별로 최적화된 챗봇 형태의 생성형 AI 에이전트 프레임워크를 개발했습니다. 이 프레임워크는 관련성, 완전성, 검증 가능한 소싱이 속도만큼이나 중요한 법률 업계에 AI 기반 인사이트를 제공합니다.
Shorthills는 IBM watsonx.data의 Astra DB를 벡터 데이터베이스로 사용하고 Langflow를 사용함으로써, RAG 시스템을 구축할 때 반복 작업의 속도를 높이고 재현율과 정밀도가 60% 개선했습니다.
IBM 솔루션은 결과가 사용자 쿼리의 세부 사항과 속성을 포착하는 정도에 따라 포괄성을 4배 향상시키는 데 기여할 수 있습니다. 또한 다양성을 9배 향상시켜 사용자에게 하나의 추론이 아닌 다양한 해석과 관점을 제공할 수 있습니다. 이 기능은 법률 워크플로에서 논거와 반박을 준비하는 데 매우 중요합니다.
법무 부서가 수십만 부의 법률 문서로 구성된 데이터 세트를 검토하려면 신뢰할 수 있는 검색, 문제에 대한 다양한 관점, 문서를 출처까지 역추적하는 기능이 필요합니다. 70%의 정답을 맞추는 것은 상당한 위험을 초래할 수 있으며, 할루시네이션은 용납될 수 없습니다.
많은 법률 고객의 주요 제약 조건은 배포입니다. 일부 조직에서는 규제 제약으로 인해 민감한 법적 정보를 하이퍼스케일러와 공유하지 못할 수 있습니다. 이러한 제약으로 인해, 개인 식별 정보(PII)나 보호 상황 정보(PHI)가 포함된 내용 등의 지식 기반을 온프레미스에 보관해야 할 수 있습니다.
Shorthills의 법률 AI 시스템은 다음과 같은 두 가지 파이프라인으로 구성됩니다.
파일을 데이터 레이크로 가져온 다음 대규모로 안정적으로 검색이 작동하도록 준비합니다.
쿼리 측면에서, Shorthills는 프로덕션 환경에 대해 하나의 범용 검색 방법에 의존하지 않는 실용적인 철학을 사용합니다.
이 방식을 구현하기 위해, 사용자의 의도에 따라 키워드, 벡터 또는 그래프 검색에 쿼리를 보내는 라우터가 시스템에 장착되어 있습니다. 옵션마다 시간 및 비용 절충점이 서로 다릅니다.
그 밖의 중요한 고려 사항:
마지막으로, 경험은 채팅 전용 인터페이스를 넘어 확장됩니다. 이 법률 검색 사용 사례에서 사용자는 Word 문서, 이미지, PDF 및 텍스트 파일을 포함한 여러 데이터 소스 유형을 검색할 수 있습니다.
Shorthills가 IBM의 스택으로 이 AI 어시스턴트 플랫폼을 구축하기로 선택한 주된 이유는 법률 세계의 엔터프라이즈 배포 현실에서 비롯되었습니다.
이러한 프로세스는 실용적인 엔지니어링 매개변수 내에서 작동해야 했습니다. LLM은 컴퓨팅을 많이 사용하며 온프레미스 확장에는 효율성을 위해 런타임과 배포 도구가 필요합니다.
측정 가능한 최종 사용자 성과에 대해 Shorthills는 다음과 같이 보고했습니다.
회상력과 정확도 향상, 포괄성과 다양성 개선, 고품질 인용 지원 등 구체적인 효과가 나타났습니다. 이 결과로 최종 사용자는 자료를 찾는 데 들이는 시간을 줄여서 자료를 평가하는 데 더 많은 시간을 할애할 수 있습니다.
Shorthills의 핵심 교훈은 AI 솔루션에 대한 프로덕션 검색은 반복적인 엔지니어링 작업이라는 것이었습니다. 문서 수가 몇 개에서 수천 개(그리고 그 이상)로 늘어나면 문제가 달라집니다. 궁극적으로 '검색'은 키워드, 벡터, 하이브리드 및 그래프 검색을 통해 발전하여 지연 시간과 비용을 예측할 수 있는 신중한 라우팅을 통해 지속적으로 개선되는 여정이 됩니다.
Shorthills는 IBM watsonx.data와 Langflow를 기반으로, 온프레미스 요건을 비롯한 기업의 제약 조건을 처리할 수 있는 법률 전문가용 AI 기반 엔터프라이즈급 검색 시스템을 구현했습니다. 이 시스템은 측정 가능한 수준으로 관련성을 향상시키고, 법적 최종 사용자가 자신 있게 결과를 결정하는 데 필요한 인용과 관점의 폭을 제공합니다.
의료 및 금융 서비스 같은 업계에도 이와 비슷한 고객 요구 사항과 거버넌스 요구 사항이 존재합니다. 기본 인프라의 확장성을 활용하면 여러 산업 분야와 전 세계에 유사한 솔루션을 배포할 수 있습니다.
다음 단계로 Shorthills는 이 검색 기반이 에이전트 기반 워크플로로 확장되리라 예상합니다. 이러한 워크플로에서 에이전트는 매번 기본 데이터와 검색 스택을 다시 빌드할 필요 없이 사람이 검토할 수 있도록 아웃풋을 조사, 초안 작성 및 패키징할 수 있습니다.