Moderne Techniken der künstlichen Intelligenz wie semantisches Retrieval und Retrieval-Augmented Generation (RAG) können den Zeitaufwand von Anwaltskanzleien für die Suche in umfangreichen Dokumenten reduzieren. Sie identifizieren konzeptionell relevante Abschnitte, fassen die wesentlichen Punkte zusammen und liefern nachvollziehbare Zitate, sodass die Ergebnisse validiert werden können.
Bei korrekter Umsetzung verwandelt sich die Rechtsrecherche von einem manuellen Arbeitsablauf mit „zehn geöffneten Tabs“ in eine geführte, evidenzbasierte Sucherfahrung, ohne dass die von Rechtsteams geforderte Genauigkeit beeinträchtigt wird. Bei der juristischen Recherche benötigen Nutzer nicht nur eine Antwort, sondern die richtige Antwort. Diese Antwort muss mit den richtigen Behörden, den entsprechenden Ausnahmen und den genauen Passagen, die sie zitieren können, untermauert werden – und zwar schnell.
Mit diesem Ziel vor Augen hat das in New Jersey ansässige Unternehmen Shorthills AI ein generatives KI-Agenten-Framework in Form von domänenspezifisch optimierten Chatbots entwickelt, das RAG und Wissensgraphen nutzt. Dieses Framework liefert KI-gestützte Erkenntnisse für die Rechtsbranche, in der Relevanz, Vollständigkeit und überprüfbare Quellen ebenso wichtig sind wie reine Geschwindigkeit.
Durch die Verwendung von Astra DB auf IBM watsonx.data als Vektordatenbank und Langflow zur Beschleunigung der Iteration beim Aufbau von RAG-Systemen erzielt Shorthills eine Verbesserung von 60 % bei Recall und Präzision.
IBM-Lösungen tragen außerdem dazu bei, die Vollständigkeit um das Vierfache zu verbessern – also wie gut die Ergebnisse die Details und Aspekte der Suchanfrage des Benutzers erfassen. Darüber hinaus bieten sie eine neunmal höhere Vielfalt – die Fähigkeit, den Nutzern mehrere Interpretationen und Blickwinkel anzubieten, anstatt nur eine einzige Argumentationslinie. Diese Funktion ist für die Vorbereitung von Argumenten und Gegenargumenten in juristischen Workflows von entscheidender Bedeutung.
Rechtsabteilungen, die einen Datensatz mit Hunderttausenden von Rechtsdokumenten durchsuchen, benötigen eine zuverlässige Abfragefunktion, verschiedene Blickwinkel auf ein Thema und die Möglichkeit, Ergebnisse bis zu den Quelldokumenten zurückzuverfolgen. Eine 70-prozentige Antwort kann erhebliche Risiken mit sich bringen, und Halluzinationen sind nicht akzeptabel.
Eine wesentliche Einschränkung für viele Kunden aus dem Rechtsbereich stellt die Bereitstellung dar. Einige Unternehmen können aufgrund gesetzlicher Beschränkungen möglicherweise keine sensiblen Daten in rechtlichen Inhalten mit Hyperscalern teilen. Diese Einschränkungen könnten es erforderlich machen, dass eine Wissensdatenbank lokal verbleibt, beispielsweise Inhalte, die personenbezogene Daten (Personally Identifiable Information, PII) oder geschützte Gesundheitsinformationen (Protected Health Information, PHI) enthalten.
Das legale KI-System von Shorthills besteht aus zwei Pipelines:
Die Dateien werden in einen Data Lake importiert und anschließend so aufbereitet, dass die Abfrage zuverlässig in großem Umfang funktioniert:
Auf der Abfrageseite verfolgt Shorthills eine pragmatische Philosophie für seine Produktionsumgebung: Es wird vermieden, sich auf eine einzige universelle Suchmethode zu verlassen.
Um diesen Ansatz umzusetzen, umfasst das System Router, die je nach Absicht des Benutzers eine Anfrage an die Stichwort-, Vektor- oder Graphensuche senden. Jede Option ist mit unterschiedlichen Zeit- und Kostenkompromissen verbunden.
Weitere wichtige Überlegungen waren:
Schließlich geht das Erlebnis über eine reine Chat-Oberfläche hinaus. In diesem Anwendungsfall der juristischen Recherche können Benutzer verschiedene Arten von Datenquellen abrufen, darunter Word-Dokumente, Bilder, PDF-Dateien und Textdateien.
Ein wesentlicher Grund, warum Shorthills sich für den Aufbau dieser KI-Assistenzplattform mit IBMs Stack entschied, lag in den Realitäten der Unternehmensbereitstellung in der Rechtswelt begründet:
Diese Prozesse mussten innerhalb praktischer technischer Parameter ablaufen: LLMs sind rechenintensiv, und die Skalierung vor Ort erfordert die richtigen Laufzeit- und Bereitstellungstools, um effizient zu sein.
In Bezug auf messbare Endnutzerergebnisse berichtete Shorthills:
Die Auswirkungen sind konkret: verbesserte Wiederauffindbarkeit und Präzision, höhere Vollständigkeit und Vielfalt sowie hochwertige Unterstützung bei der Zitierung. Dieses Ergebnis bedeutet, dass Endnutzer weniger Zeit mit der Suche nach Material verbringen und mehr Zeit für dessen Bewertung aufwenden können.
Die zentrale Erkenntnis von Shorthills war, dass die Suche nach KI-Lösungen ein iterativer technischer Prozess ist. Die Skalierung von einer Handvoll Dokumenten auf Tausende (und mehr) verändert die Herausforderung. Letztendlich wird die „Suche“ zu einem Prozess der kontinuierlichen Verbesserung – sie entwickelt sich durch Keyword-, Vektor-, Hybrid- und Graphensuche weiter, wobei durch sorgfältige Routing-Maßnahmen Latenzzeiten und Kosten vorhersehbar bleiben.
Auf der Grundlage von IBM watsonx.data und Langflow hat Shorthills ein KI-gestütztes Suchsystem für Juristen implementiert, das auf Unternehmensebene eingesetzt werden kann und unternehmensspezifische Anforderungen, einschließlich lokaler Anforderungen, erfüllt. Das System liefert messbare Relevanzgewinne und bietet die Zitate und die Bandbreite an Perspektiven, die juristische Endnutzer benötigen, um Ergebnisse mit Zuversicht zu bestimmen.
Ähnliche Kundenbedürfnisse und Governance-Anforderungen bestehen in verschiedenen Branchen wie dem Gesundheitswesen und den Finanzdienstleistungen. Die Skalierbarkeit der zugrunde liegenden Infrastruktur ermöglicht es uns, ähnliche Lösungen in verschiedenen Branchen und weltweit einzusetzen.
Als nächsten Schritt sieht Shorthills eine Ausweitung dieser Retrieval-Grundlage auf agentische Workflows. In diesen Workflows kann ein Agent recherchieren, Entwürfe erstellen und Ergebnisse für die Überprüfung durch Menschen zusammenstellen, ohne jedes Mal die zugrunde liegenden Daten und den Abruf-Stack neu aufbauen zu müssen.