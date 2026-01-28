Künstliche Intelligenz Server IT-Automatisierung

Produktions-RAG für die juristische Recherche: Wie die KI von Shorthills die Datenabfrage mit IBM watsonx.data skaliert hat

Durch die Verwendung von Astra DB auf IBM watsonx.data als Vektordatenbank und Langflow zur Beschleunigung der Iteration beim Aufbau von RAG-Systemen erzielt Shorthills eine Verbesserung von 60 % bei Recall und Präzision.

Veröffentlicht 28. Januar 2026
Zwei Geschäftsfrauen führen eine Diskussion an einem modernen Bürotisch

Moderne Techniken der künstlichen Intelligenz wie semantisches Retrieval und Retrieval-Augmented Generation (RAG) können den Zeitaufwand von Anwaltskanzleien für die Suche in umfangreichen Dokumenten reduzieren. Sie identifizieren konzeptionell relevante Abschnitte, fassen die wesentlichen Punkte zusammen und liefern nachvollziehbare Zitate, sodass die Ergebnisse validiert werden können.

Bei korrekter Umsetzung verwandelt sich die Rechtsrecherche von einem manuellen Arbeitsablauf mit „zehn geöffneten Tabs“ in eine geführte, evidenzbasierte Sucherfahrung, ohne dass die von Rechtsteams geforderte Genauigkeit beeinträchtigt wird. Bei der juristischen Recherche benötigen Nutzer nicht nur eine Antwort, sondern die richtige Antwort. Diese Antwort muss mit den richtigen Behörden, den entsprechenden Ausnahmen und den genauen Passagen, die sie zitieren können, untermauert werden – und zwar schnell.

KI-gestützte Erkenntnisse für die Rechtsbranche

Mit diesem Ziel vor Augen hat das in New Jersey ansässige Unternehmen Shorthills AI ein generatives KI-Agenten-Framework in Form von domänenspezifisch optimierten Chatbots entwickelt, das RAG und Wissensgraphen nutzt. Dieses Framework liefert KI-gestützte Erkenntnisse für die Rechtsbranche, in der Relevanz, Vollständigkeit und überprüfbare Quellen ebenso wichtig sind wie reine Geschwindigkeit.

IBM-Lösungen tragen außerdem dazu bei, die Vollständigkeit um das Vierfache zu verbessern – also wie gut die Ergebnisse die Details und Aspekte der Suchanfrage des Benutzers erfassen. Darüber hinaus bieten sie eine neunmal höhere Vielfalt – die Fähigkeit, den Nutzern mehrere Interpretationen und Blickwinkel anzubieten, anstatt nur eine einzige Argumentationslinie. Diese Funktion ist für die Vorbereitung von Argumenten und Gegenargumenten in juristischen Workflows von entscheidender Bedeutung.

Anwendungsbeispiel: Umfangreiche Suche nach juristischen Dokumenten, die Relevanz, Vollständigkeit und Vertrauen verbessert

Rechtsabteilungen, die einen Datensatz mit Hunderttausenden von Rechtsdokumenten durchsuchen, benötigen eine zuverlässige Abfragefunktion, verschiedene Blickwinkel auf ein Thema und die Möglichkeit, Ergebnisse bis zu den Quelldokumenten zurückzuverfolgen. Eine 70-prozentige Antwort kann erhebliche Risiken mit sich bringen, und Halluzinationen sind nicht akzeptabel.

Eine wesentliche Einschränkung für viele Kunden aus dem Rechtsbereich stellt die Bereitstellung dar. Einige Unternehmen können aufgrund gesetzlicher Beschränkungen möglicherweise keine sensiblen Daten in rechtlichen Inhalten mit Hyperscalern teilen. Diese Einschränkungen könnten es erforderlich machen, dass eine Wissensdatenbank lokal verbleibt, beispielsweise Inhalte, die personenbezogene Daten (Personally Identifiable Information, PII) oder geschützte Gesundheitsinformationen (Protected Health Information, PHI) enthalten.

Technische Architektur: Eine skalierbare Pipeline für Hybrid-Suche mit RAG- und Schlüsselworten sowie Graphenabruf

Das legale KI-System von Shorthills besteht aus zwei Pipelines:

  1. Aufnahme und Verarbeitung von Dokumenten und Daten
  2. Abfrage und Abruf, entwickelt zur Unterstützung mehrerer Abrufmodi – Schlüsselwort, Vektor und Grafik – und zur Weiterleitung von Abfragen an die richtige Technik basierend auf der Absicht

1. Ingestion-Pipeline: Von juristischen Rohdateien zu durchsuchbaren Strukturen

Die Dateien werden in einen Data Lake importiert und anschließend so aufbereitet, dass die Abfrage zuverlässig in großem Umfang funktioniert:

  • Das Aufteilen von Dokumenten in kleinere Einheiten, wobei der Schwerpunkt auf einer sinnvollen Aufteilung liegt – und nicht nur auf einer Aufteilung nach Zeichen- und Wortanzahl –, trägt dazu bei, den Kontext wie Definitionen, Zitate und Argumentationsstrukturen zu bewahren.
  • Die Entitätsextraktion, die auf einem großen Sprachmodell (LLM) basiert, identifiziert rechtlich relevante Felder wie den Namen des Richters, den Namen des Falles, die Art des Falles, Dokument-IDs und die Art des Urteils. Anschließend wird ein Entity-Relationship-Diagramm erstellt, damit die Beziehungen später beim Abruf verwendet werden können.
  • Das Einbetten von Dokumenten mit einem Einbettungsmodell und das Speichern der resultierenden Vektoren unterstützt die Vektor- und Hybrid-Suche in großem Maßstab. Shorthills setzt auf Astra DB als Speicherplattform für die durchsuchbaren Daten.
PDF-Verarbeitung und Datenspeicherung Verarbeitung von PDF-Dateien und Datenspeicherung: Neue PDF-Dateien werden gelesen, in kleinere Textabschnitte (z. B. Absätze oder Abschnitte) unterteilt und die IDs der verarbeiteten Dateien werden wieder in der CSV-Datei gespeichert. Dieser Ansatz erzeugt strukturierten, in Abschnitte unterteilten Text, der für die Analyse bereit ist, und aktualisiert den Nachverfolgungsdatensatz, um eine erneute Verarbeitung zu vermeiden.
Chunking und Extraktion von Entity-Relationships Chunking und Extraktion von Entitätsbeziehungen: Chunks werden an Amazon Bedrock gesendet, um Entitäten – wie Personen, Organisationen – und deren Beziehungen, beispielsweise „arbeitet bei“, „befindet sich in“, zu erkennen. Die rohe LLM-Ausgabe (unstrukturierter Text) wird vorübergehend in einer lokalen JSON-Datei zwischengespeichert. Diese Daten werden anschließend in übersichtliche, strukturierte Formate zerlegt – Entitäten als beschriftete Elemente und Beziehungen als Verbindungen zwischen ihnen. Einbettungen (numerische Darstellungen) für die Chunks werden ebenfalls generiert und in einer Vektordatenbank für den späteren Abruf gespeichert.

2. Abfrage-Pipeline: Routing, hybrides Retrieval und Reranking für Relevanz und Latenz

Auf der Abfrageseite verfolgt Shorthills eine pragmatische Philosophie für seine Produktionsumgebung: Es wird vermieden, sich auf eine einzige universelle Suchmethode zu verlassen.

  • Die Stichwortsuche ist nach wie vor wichtig für exakte Identifikatoren wie Dokumentennummern oder IDs.
  • Die Vektorsuche verbessert die semantische Übereinstimmung, wenn Benutzer Fragen in natürlicher Sprache stellen, indem sie beispielsweise erkennt, dass „Display“ und „Bildschirm“ sich auf dasselbe Konzept beziehen können.
  • Die Graphensuche kann Verknüpfungen zwischen Dokumenten erfassen, jedoch kann sie in großem Maßstab langsam und speicherintensiv werden – daher sollte sie selektiv eingesetzt werden.
Suchpipeline auf Basis der Wissensdatenbank Suchpipeline auf Basis der Wissensdatenbank: Eine Benutzeranfrage wird über das API Gateway weitergeleitet und wird zu einer hybriden Suche (Schlüsselwort und Vektor), die von Amazon Bedrock unterstützt wird, wobei relevante Daten aus watsonx abgerufen werden. Die Daten werden anschließend durch eine Deduplizierungs- und Ranking-Ebene geleitet und dem Benutzer als verfeinertes, kontextreiches Suchergebnis zurückgegeben.

Um diesen Ansatz umzusetzen, umfasst das System Router, die je nach Absicht des Benutzers eine Anfrage an die Stichwort-, Vektor- oder Graphensuche senden. Jede Option ist mit unterschiedlichen Zeit- und Kostenkompromissen verbunden.

Weitere wichtige Überlegungen waren:

  • Es besteht Bedarf an einer skalierbaren Hybrid-Suchimplementierung, die bei Bedarf die Stichwort- und Vektorsuche mit Grafikfunktionen kombiniert. Dieser Ansatz optimiert die Genauigkeit der Suchergebnisse und verhindert, dass Systeme bei zunehmender Größe des Dokumentenspeichers langsamer werden.
  • Das System umfasst eine Neubewertungsphase nach der Suche, um die endgültige Relevanz zu verbessern, bevor die Ergebnisse an den Benutzer zurückgegeben werden.

Schließlich geht das Erlebnis über eine reine Chat-Oberfläche hinaus. In diesem Anwendungsfall der juristischen Recherche können Benutzer verschiedene Arten von Datenquellen abrufen, darunter Word-Dokumente, Bilder, PDF-Dateien und Textdateien.

Vorteile: Flexibilität, Sicherheit und Skalierbarkeit

Ein wesentlicher Grund, warum Shorthills sich für den Aufbau dieser KI-Assistenzplattform mit IBMs Stack entschied, lag in den Realitäten der Unternehmensbereitstellung in der Rechtswelt begründet:

  • On-Premises-Support und Datenresidenz sind für Kunden von entscheidender Bedeutung, die aufgrund von Risikotoleranz oder regulatorischen Anforderungen keine sensiblen Daten an Hyperscaler übertragen dürfen.
  • IBM watsonx.data schaltet die Fähigkeit frei, die Suche über große Dokumentenvolumina zu skalieren.
  • Sicherheit der Unternehmensklasse und eine skalierbare Architektur ermöglichen KI-fähige Lösungen und KI-Agenten, die mit IBM watsonx.data und Langflow erstellt wurden, einer Low-Code-Umgebung mit Drag-and-Drop-Funktion für die Entwicklung von Agenten und RAG-Pipelines.

Diese Prozesse mussten innerhalb praktischer technischer Parameter ablaufen: LLMs sind rechenintensiv, und die Skalierung vor Ort erfordert die richtigen Laufzeit- und Bereitstellungstools, um effizient zu sein.

In Bezug auf messbare Endnutzerergebnisse berichtete Shorthills:

  • Schnellere Suchzeiten und mehr als 60 % Verbesserung bei Trefferquote und Präzision
  • Eine etwa 4-fache Verbesserung des Umfangs und eine 9-fache Verbesserung der Vielfalt
  • Verbesserte Unterstützung für Referenzen und Zitate in den zurückgegebenen Ergebnissen, die zuvor fehlten

Die Auswirkungen sind konkret: verbesserte Wiederauffindbarkeit und Präzision, höhere Vollständigkeit und Vielfalt sowie hochwertige Unterstützung bei der Zitierung. Dieses Ergebnis bedeutet, dass Endnutzer weniger Zeit mit der Suche nach Material verbringen und mehr Zeit für dessen Bewertung aufwenden können.

Ein Fundament zum Skalieren

Die zentrale Erkenntnis von Shorthills war, dass die Suche nach KI-Lösungen ein iterativer technischer Prozess ist. Die Skalierung von einer Handvoll Dokumenten auf Tausende (und mehr) verändert die Herausforderung. Letztendlich wird die „Suche“ zu einem Prozess der kontinuierlichen Verbesserung – sie entwickelt sich durch Keyword-, Vektor-, Hybrid- und Graphensuche weiter, wobei durch sorgfältige Routing-Maßnahmen Latenzzeiten und Kosten vorhersehbar bleiben.

Auf der Grundlage von IBM watsonx.data und Langflow hat Shorthills ein KI-gestütztes Suchsystem für Juristen implementiert, das auf Unternehmensebene eingesetzt werden kann und unternehmensspezifische Anforderungen, einschließlich lokaler Anforderungen, erfüllt. Das System liefert messbare Relevanzgewinne und bietet die Zitate und die Bandbreite an Perspektiven, die juristische Endnutzer benötigen, um Ergebnisse mit Zuversicht zu bestimmen.

Ähnliche Kundenbedürfnisse und Governance-Anforderungen bestehen in verschiedenen Branchen wie dem Gesundheitswesen und den Finanzdienstleistungen. Die Skalierbarkeit der zugrunde liegenden Infrastruktur ermöglicht es uns, ähnliche Lösungen in verschiedenen Branchen und weltweit einzusetzen.

Als nächsten Schritt sieht Shorthills eine Ausweitung dieser Retrieval-Grundlage auf agentische Workflows. In diesen Workflows kann ein Agent recherchieren, Entwürfe erstellen und Ergebnisse für die Überprüfung durch Menschen zusammenstellen, ohne jedes Mal die zugrunde liegenden Daten und den Abruf-Stack neu aufbauen zu müssen.

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM