法的検索向け実稼働RAG：Shorthills AIがIBM watsonx.dataを使用してデータ検索を拡張した方法

Shorthillsは、IBM watsonx.data上のAstra DBをベクトル・データベースとして使用し、Langflowを使用してRAGシステム構築時のイテレーションを高速化することで、再現率と精度を60％向上させています。

公開日 2026年01月28日
セマンティック検索や検索拡張生成（RAG）などの最新の人工知能技術により、法律事務所が長い文書の探索に費やす時間を短縮できます。概念的に関連するセクションを見つけ、重要な内容を要約し、追跡可能な引用を返すことで、成果を検証できるようにします。

適切に実行すれば、法務チームが要求する厳密さを犠牲にすることなく、法務調査を手動の「10個のタブを開く」ワークフローから、ガイド付きで証拠に裏付けられたエクスペリエンスへと変えることができます。法的検索では、ユーザーは単なる回答だけではなく、正しい答えが必要です。その答えは、適切な当局が提供しており、関連する例外があり、引用できる正確な文章で迅速に裏付けられなければなりません。

法律業界向けのAIを活用した洞察

この目標を念頭に置いて、ニュージャージーに拠点を置くShorthills AIは、RAGと知識グラフを使用することにより、ドメインごとに最適化されたチャットボットの形で生成AIエージェント・フレームワークを開発しました。このフレームワークは、実際のスピードと同じくらい関連性、完全性、検証可能な原典が重要である法律業界向けに、AI搭載の洞察を提供します。

Shorthillsは、IBM watsonx.data上のAstra DBをベクトル・データベースとして使用し、Langflowを使用してRAGシステム構築時のイテレーションを高速化することで、再現率と精度を60％向上させています。

IBMのソリューションは、ユーザーのクエリーの詳細や観点をどれだけ正確に捉えた成果が得られるかという点で、包括性が4倍向上しました。また、ダイバーシティーも9倍向上しました。これは、単一の推論ではなく、複数の解釈や角度をユーザーに提供する機能です。この機能は、法的ワークフローにおける議論と反証の準備に不可欠です。

活用：関連性、完全性、信頼性を向上させる大規模な法的文書検索

法務部門が何十万もの法的文書のデータセットを選別するためには、信頼性の高い検索、問題に関する多角的な視点、結果を原典の文書までさかのぼって追跡できる機能が必要です。回答の70％を得ると重大なリスクが生じる可能性がある上、ハルシネーションは許容されません。

多くの法人顧客にとって重要な制約は、デプロイメントに関するものです。一部の組織では、規制上の制約により、法的なコンテンツ内の機密データをハイパースケーラーと共有できない場合があります。これらの制約により、個人情報（PII）やProtected Health Information（PHI）を含むコンテンツなどのナレッジ・ベースをオンプレミスに保持する必要がある場合があります。

技術的アーキテクチャー：ハイブリッドRAG／キーワード検索とグラフ取得のためのスケーラブルなパイプライン

ShorthillsのリーガルAIシステムは、次の2つのパイプラインで構成されています。

  1. ドキュメントとデータの取り込みと処理
  2. 照会と検索。複数の検索モード（キーワード、ベクトル、グラフ）をサポートし、意図に基づいてクエリーを適切な手法にルーティングするように構築

1. 取り込みパイプライン：未加工の法的ファイルから検索可能な構造まで

ファイルはデータレイクにインポートされ、検索が大規模かつ確実に機能するように準備されます。

  • 単に文字数や単語数で分割するのではなく、意味のあるチャンク化に重点を置いて文書を細かく分割することで、定義や引用、議論の構造などの文脈を保持することができます。
  • 大規模言語モデル（LLM）を活用したエンティティー抽出により、裁判官名、事件名、事件タイプ、文書ID、判決タイプなどの法務関連フィールドが識別されます。次に、後で検索中に関係を使用できるように、エンティティー関連図が構築されます。
  • 埋め込みモデルを使用してドキュメントを埋め込み、結果のベクトルを保存することで、ベクトルおよびハイブリッド検索を大規模にサポートできます。Shorthillsは、検索可能なデータのストレージ基盤としてAstra DBを利用しています。
PDFの処理とデータ・ストレージ PDFの処理とデータ・ストレージ：新しいPDFが読み込まれ、より小さなテキスト・チャンク（段落やセクションなど）に分割され、処理されたファイルのIDがCSVに保存されます。このアプローチにより、分析に適した構造化・チャンク化されたテキストが作成され、再処理を防ぐために追跡記録が更新されます。
チャンク化とエンティティー関係の抽出 チャンク化とエンティティー関係の抽出：チャンクはAmazon Bedrockに送信され、エンティティー（人、組織など）とそれらの関係（職場、場所など）が検知されます。未加工のLLMアウトプット（非構造化テキスト）は、ローカルのJSONファイルに一時的にキャッシュされます。次に、このデータはクリーンで構造化された形式（ラベル付き項目としてのエンティティーと、それらの間の接続としての関係）に解析されます。チャンクの埋め込み（数値表現）も生成され、将来の検索のためにベクトル・データベースに保管されます。

2. クエリー・パイプライン：関連性とレイテンシーのためのルーティング、ハイブリッド検索、再ランキング

クエリ側では、Shorthillsは本番環境に実用的な哲学を採用しています。つまり、単一のユニバーサル検索方法に頼らないようにすることです。

  • 文書番号やIDなどの正確な識別子では、キーワード検索が引き続き重要です。
  • ベクトル検索により、「ディスプレイ」と「画面」が同じ概念を指している可能性があることを認識するなど、ユーザーが自然言語で質問した際のセマンティック・マッチングが改善されます。
  • グラフ検索は文書間のリンクをキャプチャできますが、大規模になると速度が遅くなり、メモリーを大量に消費する可能性があるため、選択して使用する必要があります。
ナレッジ・ベースの検索パイプライン ナレッジ・ベース上の検索パイプライン：ユーザー・クエリーはAPI Gatewayを通過し、Amazon Bedrockを活用したハイブリッド検索（キーワードとベクトル）になり、関連データがwatsonxから取得されます。データは重複排除とランキング層を通過して、ユーザーに洗練されたコンテキスト豊富な検索結果として返されます。

このアプローチを実装するために、システムには、ユーザーの意図に応じてキーワード、ベクトル、またはグラフ検索にクエリーを送信するルーターが含まれています。両オプションでは時間とコストのトレードオフが異なります。

その他の重要な考慮事項は次のとおりです。

  • キーワード検索とベクトル検索を必要に応じてグラフ機能と組み合わせた、スケーラブルなハイブリッド検索の実装が必要です。このアプローチにより、検索結果が最適化され、文書の保管が増大するにつれてシステムが停滞するのを防ぐことができます。
  • このシステムには、ユーザーに結果を返す前に最終的な関連性を向上させるために、検索後の再ランク付け段階が含まれています。

最後に、このエクスペリエンスはチャットのみのインターフェースを超えて拡張されています。この法的検索のユースケースでは、ユーザーはWord文書、画像、PDF、テキスト・ファイルなど、複数の種類のデータ・ソースを取得できます。

メリット：柔軟性、セキュリティー、拡張性

ShorthillsがIBMのスタックを使用してこのAIアシスタント・プラットフォームを構築することを選択した主な理由は、以下の法律業界におけるエンタープライズ・デプロイメントの現実に起因しています。

  • オンプレミスのサポートとデータ・レジデンシーは、リスク許容度や規制要件により、ハイパースケーラーへの機密データの移動が制限されているお客様にとって不可欠です。
  • IBM watsonx.dataは、大量の文書を対象として検索を拡張する機能を備えています。
  • エンタープライズ・グレードのセキュリティースケーラブルなアーキテクチャーにより、IBM watsonx.dataとLangflow（エージェントやRAGパイプラインの開発のためのローコードのドラッグ・アンド・ドロップ環境）で構築されたAI対応ソリューションやAIエージェントが可能になります。

これらのプロセスは、実用的なエンジニアリング・パラメーター内で動作する必要がありました。LLMは演算能力を大量に消費し、オンプレミスでのスケーリングには効率化のために適切なランタイムとデプロイメント・ツールが必要でした。

測定可能なエンドユーザーの成果に関して、Shorthillsは以下のように報告しています。

  • 検索時間が短縮され、再現率と精度が60％以上向上
  • 包括性が約4倍、ダイバーシティーが9倍向上
  • 以前は欠落していた、返された結果における参照や引用のサポート強化

その影響は具体的で、再現率と精度の向上、包括性とダイバーシティーの向上、高品質の引用サポートなどを実現しています。この成果により、エンド・ユーザーが資料を探す時間を減らし、その評価により多くの時間を費やすことができるようになりました。

拡張するための基盤

Shorthillsの核となる教訓は、AIソリューションの実稼働検索は、反復的なエンジニアリング作業であるということです。一握りの文書から数千（あるいはそれを超える）に拡張すると、問題は変わります。最終的に、「検索」は、キーワード、ベクトル、ハイブリッド、グラフ検索を通じて進化し、レイテンシーとコストが予測可能になるように慎重なルーティングを行うことで、継続的な改善プロセスとなります。

IBM watsonx.dataとLangflowを基盤とすることで、Shorthillsは、エンタープライズ規模で運用し、オンプレミス要件を含む企業の制約を処理できる法律専門家向けの AI駆動型検索システムを導入しました。このシステムは、測定可能な関連性の向上を実現し、法律のエンドユーザーが自信を持って結果を判断するために必要な引用と幅広い視点を提供します。

同様の顧客ニーズとガバナンス要件は、ヘルスケアや金融サービスなどの業種にも存在します。基盤となるインフラストラクチャーの拡張性により、同様のソリューションを複数の業界や世界中に展開することが可能です。

次のステップとして、Shorthillsは、この検索基盤がエージェントベースのワークフローに拡張されると考えています。こうしたワークフローでは、エージェントは基礎となるデータや検索スタックを毎回再構築することなく、人間のレビュー用にアウトプットを調査、下書き、パッケージ化できます。

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM