법률 검색용 프로덕션 RAG: Shorthills AI가 IBM watsonx.data를 사용하여 데이터 검색을 확장한 방법

Shorthills는 IBM® watsonx.data의 Astra DB를 벡터 데이터베이스와 Langflow를 사용하여 RAG 시스템 과정의 반복 작업을 가속화하고 재현율과 정밀도를 60% 개선했습니다.

게시일 2026년 01월 28일
현대적인 사무실 탁자에서 회의 중인 두 여성 사업가

의미론적 검색과 검색 증강 생성(RAG) 같은 최신 인공지능 기술은 로펌이 방대한 문서를 뒤지는 데 소요되는 시간을 줄여줄 수 있습니다. 개념적으로 관련된 섹션을 찾고, 중요한 내용을 요약하고, 추적 가능한 인용을 반환하여 결과를 검증할 수 있도록 합니다.

이 작업이 잘 이루어지면, '탭을 10개씩 열어놓고' 진행하는 수동 워크플로를 증거 기반의 안내형 검색 경험으로 바꿀 수 있습니다. 법률 검색에서 사용자에게 필요한 건 단순한 답이 아닌 정답닙니다. 올바른 당국, 관련 예외 사항, 정확한 인용 구절을 통해 신속하게 답변이 입증되어야 합니다.

법률 업계를 위한 AI 기반 인사이트

뉴저지에 본사를 둔 Shorthills AI는 이러한 목표를 염두에 두고 RAG와 지식 그래프를 사용하여 도메인별로 최적화된 챗봇 형태의 생성형 AI 에이전트 프레임워크를 개발했습니다. 이 프레임워크는 관련성, 완전성, 검증 가능한 소싱이 속도만큼이나 중요한 법률 업계에 AI 기반 인사이트를 제공합니다.

Shorthills는 IBM watsonx.data의 Astra DB를 벡터 데이터베이스로 사용하고 Langflow를 사용함으로써, RAG 시스템을 구축할 때 반복 작업의 속도를 높이고 재현율과 정밀도가 60% 개선했습니다.

IBM 솔루션은 결과가 사용자 쿼리의 세부 사항과 속성을 포착하는 정도에 따라 포괄성을 4배 향상시키는 데 기여할 수 있습니다. 또한 다양성을 9배 향상시켜 사용자에게 하나의 추론이 아닌 다양한 해석과 관점을 제공할 수 있습니다. 이 기능은 법률 워크플로에서 논거와 반박을 준비하는 데 매우 중요합니다.

활용: 관련성, 완전성 및 신뢰를 향상시키는 대규모 법률 문서 검색

법무 부서가 수십만 부의 법률 문서로 구성된 데이터 세트를 검토하려면 신뢰할 수 있는 검색, 문제에 대한 다양한 관점, 문서를 출처까지 역추적하는 기능이 필요합니다. 70%의 정답을 맞추는 것은 상당한 위험을 초래할 수 있으며, 할루시네이션은 용납될 수 없습니다.

많은 법률 고객의 주요 제약 조건은 배포입니다. 일부 조직에서는 규제 제약으로 인해 민감한 법적 정보를 하이퍼스케일러와 공유하지 못할 수 있습니다. 이러한 제약으로 인해, 개인 식별 정보(PII)나 보호 상황 정보(PHI)가 포함된 내용 등의 지식 기반을 온프레미스에 보관해야 할 수 있습니다.

기술 아키텍처: 하이브리드 RAG/키워드 검색 및 그래프 검색을 위한 확장가능한 파이프라인

Shorthills의 법률 AI 시스템은 다음과 같은 두 가지 파이프라인으로 구성됩니다.

  1. 문서와 데이터 수집 및 처리
  2. 키워드, 벡터, 그래프 등 여러 검색 모드를 지원하고 의도에 따라 올바른 기술로 쿼리를 라우팅하도록 구축된 쿼리 및 검색

1. 수집 파이프라인: 원시 법률 파일부터 검색 가능한 구조까지

파일을 데이터 레이크로 가져온 다음 대규모로 안정적으로 검색이 작동하도록 준비합니다.

  • 문서를 단순히 문자와 단어 수를 기준으로 분할하는 것이 아니라, 의미 있는 청킹에 중점을 두고 더 작게 조각내어 청킹하면 정의, 인용 및 논거 구조와 같은 맥락을 보존하는 데 도움이 됩니다.
  • 대규모 언어 모델(LLM) 기반 개체 추출은 판사 이름, 사건명, 사건 유형, 문서 ID, 판결 유형 같은 법률 관련 필드를 식별합니다. 그런 다음 나중에 검색 중에 관계를 사용할 수 있도록 개체 관계 다이어그램을 구성합니다.
  • 임베딩 모델을 사용해 문서를 임베딩하고 결과 벡터를 저장하면 벡터와 하이브리드 검색을 대규모로 지원할 수 있습니다. Shorthills는 Astra DB를 스토리지 기반으로 삼아 데이터를 검색합니다.
PDF와 데이터 스토리지 처리 PDF 처리 및 데이터 스토리지: 새 PDF를 읽어서 더 작은 텍스트 청크(예: 단락 또는 섹션)로 분할하고, 처리된 파일의 ID를 다시 CSV로 저장합니다. 이 접근 방식은 분석에 사용할 수 있는 구조화된 청크 텍스트를 생성하고 추적 기록을 업데이트하여 재처리를 방지합니다.
청킹 및 개체 관계 추출 청킹 및 개체 관계 추출: 청크는 Amazon Bedrock으로 전송되어 사람, 조직과 같은 개체와 '근무지', '위치' 등의 관계를 감지합니다. 원시 LLM 출력(구조화되지 않은 텍스트)은 로컬 JSON 파일에 일시적으로 캐시됩니다. 이 데이터는 깔끔하고 구조화된 형식으로 분석됩니다. 개체는 라벨이 붙은 항목으로, 관계는 그들 사이의 연결로 구성됩니다. 임베딩(숫자 표현)도 청크에 생성되어 벡터 데이터베이스에 저장되고 향후 검색에 사용됩니다.

2. 쿼리 파이프라인: 라우팅, 하이브리드 검색 및 관련성 및 지연 시간에 대한 재순위화

쿼리 측면에서, Shorthills는 프로덕션 환경에 대해 하나의 범용 검색 방법에 의존하지 않는 실용적인 철학을 사용합니다.

  • 문서 번호나 ID 같은 정확한 식별자에 대해서는 키워드 검색이 여전히 중요합니다.
  • 벡터 검색은 사용자가 자연어 질문을 할 때 '디스플레이'와 '화면'이 같은 개념을 지칭할 수 있음을 인식하는 등 의미론적 매칭을 개선합니다.
  • 그래프 검색은 문서 간의 연결 관계를 포착할 수 있지만, 규모가 커지면 속도가 느려지고 메모리가 많이 소모될 수 있으므로 선택적으로 사용해야 합니다.
지식 기반 상단의 검색 파이프라인 지식 기반 상단의 검색 파이프라인: 사용자 쿼리가 API Gateway를 통해 라우팅되고 Amazon Bedrock 기반의 하이브리드 검색(키워드 및 벡터)이 되며, 이를 통해 watsonx에서 관련 데이터가 검색됩니다. 그런 다음 데이터는 중복 제거 및 순위 지정 계층을 통과하여 정제되고 컨텍스트가 풍부한 검색 결과로 사용자에게 반환됩니다.

이 방식을 구현하기 위해, 사용자의 의도에 따라 키워드, 벡터 또는 그래프 검색에 쿼리를 보내는 라우터가 시스템에 장착되어 있습니다. 옵션마다 시간 및 비용 절충점이 서로 다릅니다.

그 밖의 중요한 고려 사항:

  • 적절한 상황에서 키워드 및 벡터 검색을 그래프 능력과 결합하는 확장가능한 하이브리드 검색 구현이 필요합니다. 이 방식은 검색 결과의 정확성을 최적화하고 문서 저장소가 늘어나면서 시스템이 다운되는 것을 방지합니다.
  • 결과가 사용자에게 반환되기 전에 최종 관련성을 개선하기 위해 검색 후 재순위화하는 과정이 있습니다.

마지막으로, 경험은 채팅 전용 인터페이스를 넘어 확장됩니다. 이 법률 검색 사용 사례에서 사용자는 Word 문서, 이미지, PDF 및 텍스트 파일을 포함한 여러 데이터 소스 유형을 검색할 수 있습니다.

이점: 유연성, 보안 및 확장성

Shorthills가 IBM의 스택으로 이 AI 어시스턴트 플랫폼을 구축하기로 선택한 주된 이유는 법률 세계의 엔터프라이즈 배포 현실에서 비롯되었습니다.

  • 위험 허용 범위나 규제 요건으로 인해 민감한 데이터를 하이퍼스케일러로 이동하지 못하는 고객에게는 온프레미스 지원과 데이터 레지던시가 필수적입니다.
  • IBM watsonx.data는 대량의 문서로 확장 가능한 있는 기능을 제공합니다.
  • 엔터프라이즈급 보안확장가능한 아키텍처를 통해 IBM watsonx.data 및 Langflow로 구축된 AI 지원 솔루션 및 AI 에이전트는 에이전트 및 RAG 파이프라인 개발을 위한 로우 코드, 드래그 앤 드롭 환경입니다.

이러한 프로세스는 실용적인 엔지니어링 매개변수 내에서 작동해야 했습니다. LLM은 컴퓨팅을 많이 사용하며 온프레미스 확장에는 효율성을 위해 런타임과 배포 도구가 필요합니다.

측정 가능한 최종 사용자 성과에 대해 Shorthills는 다음과 같이 보고했습니다.

  • 검색 시간 단축 및 재현율 및 정밀도 60% 이상 향상
  • 포괄성 약 4배 향상, 다양성 약 9배 향상
  • 반환된 결과에서 기존에 누락되었던 참조 및 인용에 대한 지원 개선

회상력과 정확도 향상, 포괄성과 다양성 개선, 고품질 인용 지원 등 구체적인 효과가 나타났습니다. 이 결과로 최종 사용자는 자료를 찾는 데 들이는 시간을 줄여서 자료를 평가하는 데 더 많은 시간을 할애할 수 있습니다.

확장 가능하게 구축된 기반

Shorthills의 핵심 교훈은 AI 솔루션에 대한 프로덕션 검색은 반복적인 엔지니어링 작업이라는 것이었습니다. 문서 수가 몇 개에서 수천 개(그리고 그 이상)로 늘어나면 문제가 달라집니다. 궁극적으로 '검색'은 키워드, 벡터, 하이브리드 및 그래프 검색을 통해 발전하여 지연 시간과 비용을 예측할 수 있는 신중한 라우팅을 통해 지속적으로 개선되는 여정이 됩니다.

Shorthills는 IBM watsonx.data와 Langflow를 기반으로, 온프레미스 요건을 비롯한 기업의 제약 조건을 처리할 수 있는 법률 전문가용 AI 기반 엔터프라이즈급 검색 시스템을 구현했습니다. 이 시스템은 측정 가능한 수준으로 관련성을 향상시키고, 법적 최종 사용자가 자신 있게 결과를 결정하는 데 필요한 인용과 관점의 폭을 제공합니다.

의료 및 금융 서비스 같은 업계에도 이와 비슷한 고객 요구 사항과 거버넌스 요구 사항이 존재합니다. 기본 인프라의 확장성을 활용하면 여러 산업 분야와 전 세계에 유사한 솔루션을 배포할 수 있습니다.

다음 단계로 Shorthills는 이 검색 기반이 에이전트 기반 워크플로로 확장되리라 예상합니다. 이러한 워크플로에서 에이전트는 매번 기본 데이터와 검색 스택을 다시 빌드할 필요 없이 사람이 검토할 수 있도록 아웃풋을 조사, 초안 작성 및 패키징할 수 있습니다.

