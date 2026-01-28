Intelligence artificielle Calcul et serveurs Automatisation informatique

Analyse de la production pour la recherche juridique : comment Shorthills AI a optimisé la récupération de données avec IBM watsonx.data

En utilisant Astra DB sur IBM watsonx.data comme base de données vectorielle et Langflow pour accélérer l’itération lors de la construction de systèmes RAG, Shorthills obtient une amélioration de 60 % en termes de rappel et de précision.

Publié le 28 janvier 2026
Les techniques modernes d’intelligence artificielle telles que la recherche sémantique et la génération augmentée de récupération (RAG) peuvent réduire le temps que les cabinets juridiques consacrent à la recherche de longs documents. Leur méthode consiste à identifier les sections conceptuellement pertinentes, à résumer les points essentiels et à fournir des citations vérifiables afin de valider les résultats.

Bien menée, cela permet de transformer la recherche juridique d’un workflow manuel « en dix onglets ouverts » en une expérience de recherche guidée et étayée par des preuves, sans pour autant sacrifier la rigueur requise par les équipes juridiques. Dans la recherche juridique, les utilisateurs n’ont pas seulement besoin d’une réponse ; ils ont besoin de la bonne réponse. Cette réponse doit être étayée par les autorités compétentes, les exceptions pertinentes et les passages exacts qu’elles peuvent citer, rapidement.

Des informations alimentées par l’IA pour le secteur juridique

Dans cette optique, Shorthills AI, basée dans le New Jersey, a mis au point un cadre génératif d’agents d’IA sous la forme de chatbots optimisés pour un domaine spécifique, en utilisant le RAG et un graphique de connaissances. Ce cadre des exigences est alimenté par l’IA informations pour les secteurs juridiques, où la pertinence, l’exhaustivité et l’origine vérifiable comptent autant que la vitesse brute.

Les solutions IBM contribuent également à multiplier par 4 l’exhaustivité, c’est-à-dire la capacité des résultats à saisir les détails et les aspects de la requête de l’utilisateur. Ils sont également neuf fois plus diversifiés, c’est-à-dire qu’ils offrent aux utilisateurs plusieurs interprétations et angles de vue plutôt qu’une seule ligne de raisonnement. Cette fonctionnalité est critique pour préparer les arguments et les réfutations dans les workflows juridiques.

Mise en pratique : recherche de documents juridiques à grande échelle qui améliore la pertinence, l’exhaustivité et la fiabilité

Les services juridiques qui passent au crible un jeu de données de centaines de milliers de documents juridiques ont besoin d’une récupération fiable, de plusieurs angles sur une question et de la possibilité de retracer les résultats jusqu’aux documents sources. Obtenir 70 % de la réponse peut comporter des risques importants, et les hallucinations sont inacceptables.

Le déploiement constitue une contrainte majeure pour de nombreux clients du secteur juridique. Certaines entreprises pourraient ne pas pouvoir partager des données sensibles dans des contenus juridiques avec des hyperscalers en raison de contraintes réglementaires, notamment l’exigence qu’une base de connaissances reste sur site, comme le contenu qui comprend des données personnelles (PII) ou des données de santé protégées (PHI).

Architecture technique : un pipeline évolutif pour la recherche hybride RAG/mots-clés et la récupération de graphiques

Le système d’IA juridique de Shorthills se compose de deux pipelines :

  1. L’ingestion de données et le traitement de documents
  2. La recherche et l’extraction, conçues pour prendre en charge plusieurs modes d’extraction (mot-clé, vecteur et graphe) et pour acheminer les requêtes vers la bonne technique en fonction de l’intention

1. Pipeline d’ingestion : des fichiers juridiques bruts aux structures consultables

Les fichiers sont importés dans un data lake, puis préparés pour que la récupération fonctionne de manière fiable à l’échelle :

  • Le découpage des documents en petits morceaux, en mettant l’accent sur le découpage significatif, et pas simplement en fonction du nombre de caractères et de mots, permet de préserver le contexte, tel que les définitions, les citations et les structures d’argumentation.
  • L’extraction d’entités à l’aide de grands modèles de langage (LLM) permet d’identifier les champs pertinents sur le plan juridique, tels que le nom du juge, le nom de l’affaire, le type d’affaire, les identifiants des documents et le type de jugement. Un diagramme des relations entre les entités est ensuite construit afin que les relations puissent être utilisées ultérieurement lors de la recherche.
  • Embedding de documents avec un modèle d’embedding et le stockage des vecteurs résultants permet la récupération vectorielle et hybride à l’échelle. Shorthills utilise Astra DB comme base de stockage pour ses données consultables.
Traitement des PDF et stockage de données Traitement des PDF et stockage de données : les nouveaux PDF sont lus, divisés en petits morceaux de texte (par exemple, paragraphes ou sections) et les identifiants des fichiers traités sont enregistrés dans le fichier CSV. Cette approche permet de créer un texte structuré et fragmenté, prêt à être analysé, et de mettre à jour l’enregistrement de suivi afin d’éviter tout retraitement.
Fragmentation et extraction des relations entre les entités Extraction de fragments et de relations d’entités : des fragments sont envoyés à Amazon Bedrock pour détecter des entités telles que les personnes, les entreprises, et leurs relations, telles que « travaille chez » ou « localisé ». La sortie brute du LLM (texte non structuré) est temporairement mise en cache dans un fichier JSON local. Ces données sont ensuite analysées dans des formats propres et structurés : les entités sont des éléments étiquetés et les relations sont des liens entre eux. Les embeddings (représentations numériques) pour les fragments sont également générés et stockés dans une base de données vectorielle pour une récupération future.

2. Pipeline de requêtes : routage, récupération hybride et reclassement en fonction de la pertinence et de la latence

Du côté des requêtes, Shorthills applique une philosophie pragmatique à son environnement de production : éviter de dépendre d’une seule méthode de recherche universelle.

  • La recherche par mot-clé est toujours importante pour les identifiants exacts, tels que les numéros de documents ou les identifiants.
  • La recherche vectorielle améliore la correspondance sémantique lorsque les utilisateurs posent des questions en langage naturel, par exemple en reconnaissant que les termes « affichage » et « écran » pourraient désigner le même concept.
  • La recherche graphique peut capturer les liens entre les documents, mais à l’échelle elle peut devenir lente et gourmande en mémoire, et doit donc être utilisée de manière sélective.
Pipeline de recherche au sommet de la base de connaissances Pipeline de recherche au-dessus de la base de connaissances : une requête utilisateur passe par l’API Gateway et devient une recherche hybride (mot-clé et vecteur) propulsée par Amazon Bedrock, où les données pertinentes sont récupérées depuis watsonx. Les données sont ensuite transmises par une couche de déduplication et de classement, puis renvoyées à l’utilisateur sous la forme d’un résultat de recherche affiné et riche en contexte.

Pour mettre en œuvre cette approche, le système inclut des routeurs qui envoient une requête à la recherche par mot-clé, vecteur ou graphique en fonction de l’intention de l’utilisateur. Chaque option comporte des compromis différents en termes de temps et de coûts.

Parmi les autres considérations critiques, citons :

  • Il est nécessaire de mettre en place un système de recherche hybride évolutif qui combine la recherche par mot-clé et la recherche vectorielle avec des capacités graphiques, le cas échéant. Cette approche optimise la précision des résultats de recherche et empêche les systèmes de s’enliser à mesure que la bibliothèque de documents s’agrandit.
  • Le système comprend une étape de reclassement après la recherche pour améliorer la pertinence finale avant que les résultats ne soient renvoyés à l’utilisateur.

Enfin, l’expérience va au-delà d’une simple interface de chat. Dans ce cas d’utilisation de recherche juridique, les utilisateurs peuvent récupérer plusieurs types de sources de données, notamment des documents Word, des images, des PDF et des fichiers texte.

Avantages : flexibilité, sécurité et évolutivité

L’une des principales raisons pour lesquelles Shorthills a choisi de créer cette plateforme d’assistant IA avec la pile d’IBM provient des réalités du déploiement en entreprise dans le monde juridique :

  • Le support sur site et l’hébergement des données sont essentiels pour les clients qui ne peuvent pas déplacer des données sensibles vers des hyperscalers en raison d’une tolérance au risque ou d’exigences réglementaires.
  • IBM watsonx.data déverrouille la possibilité de dimensionner la recherche sur de grands volumes de documents.
  • Une sécurité dédiée aux entreprises et une architecture évolutive permettent des solutions prêtes pour l’IA et des agents IA construits avec IBM watsonx.data et Langflow, un environnement low code, glisser-déposer, pour développer des agents et des pipelines RAG.

Ces processus devaient fonctionner dans le cadre de paramètres techniques pratiques : Les LLM sont gourmands en ressources informatiques et la mise à l’échelle sur site nécessite un temps d’exécution et un outil de déploiement adéquats pour être efficace.

En termes de résultats mesurables pour les utilisateurs finaux, Shorthills a rapporté ce qui suit :

  • Temps de recherche plus rapide et amélioration de plus de 60 % en termes de rappel et de précision
  • Environ 4 fois plus d’exhaustivité et 9 fois plus de diversité
  • Meilleure prise en charge des références et citations dans les résultats renvoyés, qui étaient auparavant absentes

L’impact est concret : rappel et précision améliorés, exhaustivité et diversité accrues et soutien de haute qualité aux citations. Les utilisateurs finaux passent ainsi moins de temps à rechercher du matériel et plus de temps à l’évaluer.

Une base conçue pour évoluer

L’enseignement principal de Shorthills est que la recherche de solutions d’IA pour la production est un exercice d’ingénierie itératif. Passer d’une poignée de documents à des milliers (et plus) change le problème. En fin de compte, la « recherche » devient un parcours d’amélioration continue, évoluant à travers la recherche par mot-clé, vecteur, hybride et graphique, avec un routage minutieux pour que la latence et les coûts restent prévisibles.

En s’appuyant sur IBM watsonx.data et Langflow, Shorthills a mis en place un système de recherche piloté par l’IA pour les professionnels du droit, capable d’opérer à l’échelle de l’entreprise, de gérer les contraintes de l’entreprise, y compris les exigences sur site. Le système offre des gains de pertinence mesurables et fournit les citations et l’étendue des perspectives dont les utilisateurs finaux du droit ont besoin pour déterminer les résultats en toute confiance.

Des besoins clients et des exigences de gouvernance similaires existent dans tous les secteurs, par exemple la santé et les services financiers. L’évolutivité de l’infrastructure sous-jacente nous permet de déployer des solutions similaires dans de nombreux secteurs et dans le monde entier.

Dans une prochaine étape, Shorthills voit cette base de récupération s’étendant dans des workflows basés sur des agents. Dans ces workflows, un agent peut faire des recherches, rédiger et présenter des productions pour examen humain sans avoir à reconstruire à chaque fois les données sous-jacentes et la pile.

