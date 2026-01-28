Inteligencia artificial Computación y servidores Automatización de TI

RAG de producción para búsquedas legales: cómo Shorthills AI amplió la recuperación de datos con IBM® watsonx.data

Al usar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al construir sistemas RAG, Shorthills obtiene una mejora del 60 % en la memoria y la precisión.

Publicado el 28 de enero de 2026
Dos empresarias entablando una conversación en una mesa de oficina moderna

Las técnicas modernas de inteligencia artificial, como la recuperación semántica y la generación aumentada por recuperación (RAG), pueden reducir el tiempo que los bufetes de abogados dedican a buscar documentos largos. Trabajan encontrando secciones conceptualmente relevantes, resumiendo lo que importa y devolviendo citas rastreables para que los resultados puedan validarse.

Si se hace bien, esto convierte la investigación legal de un flujo de trabajo manual, en el que hay que abrir diez pestañas, en una experiencia de búsqueda guiada y respaldada por pruebas, sin sacrificar el rigor que exigen los equipos jurídicos. En la búsqueda legal, los usuarios no solo necesitan una respuesta; la correcta. Esa respuesta debe estar respaldada rápidamente por las autoridades adecuadas, las excepciones pertinentes y los pasajes exactos que puedan citar.

Conocimientos con IA para los sectores legales

Con este objetivo en mente, Shorthills AI, con sede en Nueva Jersey, ha desarrollado un marco de agentes de IA generativa en forma de chatbots optimizados para dominios específicos mediante el uso de RAG y grafos de conocimiento. Este marco ofrece información con IA para el sector jurídico, en el que la relevancia, la exhaustividad y el origen verificable importan tanto como la velocidad bruta.

Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60 % en recuperación y precisión.

Las soluciones de IBM también ayudan a mejorar cuatro veces la exhaustividad: la precisión con la que los resultados capturan los detalles y los aspectos de la consulta del usuario. También ofrecen una diversidad nueve veces mayor: la capacidad de ofrecer a los usuarios múltiples interpretaciones y ángulos en lugar de una sola línea de razonamiento. Esta característica es crítica para preparar argumentos y refutaciones en los flujos de trabajo legales.

Ponerlo en práctica: Búsqueda de documentos legales a gran escala que mejora la pertinencia, la exhaustividad y la confianza

Los departamentos legales que examinan un conjunto de datos de cientos de miles de documentos legales requieren una recuperación fiable, múltiples ángulos sobre un problema y la capacidad de rastrear los resultados hasta los documentos fuente. Obtener el 70 % de la respuesta puede plantear riesgos importantes y las alucinaciones son inaceptables.

Una limitación clave para muchos clientes legales es la implementación. Es posible que algunas organizaciones no puedan compartir datos confidenciales de contenido legal con los hiperescaladores debido a restricciones reglamentarias. Estas limitaciones pueden requerir que una base de conocimientos permanezca on premises, como el contenido que incluye información de identificación personal (PII) o información médica protegida (PHI).

Arquitectura técnica: un pipeline escalable para la búsqueda híbrida de RAG/palabras clave y la recuperación de grafos

El sistema de IA legal de Shorthills consta de dos pipelines:

  1. Ingesta de datos y procesamiento de documentos
  2. Consulta y recuperación, creada para admitir varios modos de recuperación (palabra clave, vector y gráfico) y para dirigir las consultas a la técnica correcta en función de la intención

1. Pipeline de ingesta: desde archivos legales sin procesar hasta estructuras con capacidad de búsqueda

Los archivos se importan en un data lake y luego se preparan para que la recuperación funcione de forma fiable a escala:

  • La división de los documentos en partes más pequeñas, haciendo hincapié en la fragmentación significativa (no simplemente en dividirlos por número de caracteres y palabras) ayuda a preservar el contexto, como las definiciones, las citas y las estructuras argumentales.
  • La extracción de entidades impulsadas por un modelo de lenguaje de gran tamaño (LLM) identifica campos legalmente relevantes, como el nombre del juez, el nombre del caso, el tipo de caso, los identificadores de documentos y el tipo de sentencia. A continuación, se construye un diagrama de relación de entidad para que las relaciones puedan utilizarse más adelante durante la recuperación.
  • La integración de documentos con un modelo de integración y almacenamiento de los vectores resultantes soporta la recuperación vectorial e híbrida a escala. Shorthills confía en Astra DB como base de almacenamiento para los datos de búsqueda.
Procesamiento de archivos PDF y almacenamiento de datos Procesamiento de archivos PDF y almacenamiento de datos: los nuevos PDF se leen, se dividen en fragmentos de texto más pequeños (por ejemplo, párrafos o secciones) y los ID de los archivos procesados se guardan en el CSV. Este enfoque crea texto estructurado y fragmentado listo para el análisis y actualiza el registro de seguimiento para evitar el reprocesamiento.
Fragmentación y extracción de relaciones entre entidades Fragmentación y extracción de relaciones entre entidades: los fragmentos se envían a Amazon Bedrock para detectar entidades, como personas, organizaciones, y sus relaciones, como “trabaja en”, “ubicado en”. La salida LLM sin procesar (texto no estructurado) se almacena temporalmente en caché en un archivo JSON local. A continuación, estos datos se analizan en formatos limpios y estructurados: entidades como elementos etiquetados y relaciones como conexiones entre ellos. Las incrustaciones (representaciones numéricas) de los fragmentos también se generan y almacenan en una base de datos vectorial para su futura recuperación.

2. Pipeline de consultas: enrutamiento, recuperación híbrida y cambio de clasificación por relevancia y latencia

En cuanto a las consultas, Shorthills emplea una filosofía pragmática para su entorno de producción: evitar depender de un único método de búsqueda universal.

  • La búsqueda por palabras clave sigue siendo importante para los identificadores exactos, como los números de documento o los ID.
  • La búsqueda vectorial mejora la coincidencia semántica cuando los usuarios formulan preguntas en lenguaje natural, por ejemplo, al reconocer que “pantalla” y “monitor” pueden referirse al mismo concepto.
  • La búsqueda gráfica puede capturar vínculos entre documentos, pero a escala puede volverse lenta y consumir mucha memoria, por lo que debe utilizarse de forma selectiva.
Búsqueda en el pipeline de la base de conocimientos Búsqueda en el pipeline de la base de conocimientos: la consulta del usuario se enruta a través de la API Gateway y se convierte en una búsqueda híbrida (palabra clave y vector) impulsada por Amazon Bedrock, donde se recuperan los datos relevantes de watsonx. A continuación, los datos pasan por una capa de deduplicación y clasificación y se devuelven al usuario como un resultado de búsqueda refinado y rico en contexto.

Para implementar este enfoque, el sistema incluye enrutadores que envían una consulta a la búsqueda de palabras clave, vectores o gráficos en función de la intención del usuario. Cada opción conlleva diferentes compensaciones de tiempo y coste.

Otras consideraciones críticas incluían:

  • Es necesario implementar un sistema de búsqueda híbrido escalable que combine la búsqueda por palabras clave y vectores con capacidades gráficas cuando sea apropiado. Este enfoque optimiza la precisión de los resultados de búsqueda y evita que los sistemas se atasquen a medida que crece el almacenar de documentos.
  • El sistema incluye una etapa de reordenación tras la recuperación para mejorar la relevancia final antes de devolver los resultados al usuario.

Por último, la experiencia va más allá de una interfaz solo de chat. En este caso de uso de búsqueda legal, los usuarios pueden recuperar múltiples tipos de fuentes de datos, incluidos documentos de Word, imágenes, PDF y archivos de texto.

Beneficios: flexibilidad, seguridad y escalabilidad

Una razón clave por la que Shorthills decidió crear esta plataforma de asistente de IA con la pila de IBM surgió de las realidades de implementación empresarial en el mundo legal:

  • El soporte on-premises y la residencia de datos son esenciales para los clientes que no pueden mover datos confidenciales a hiperescaladores debido a la tolerancia al riesgo o a los requisitos normativos.
  • IBM watsonx.data desbloquea la capacidad de escalar la búsqueda en grandes volúmenes de documentos.
  • La seguridad de nivel empresarial y una arquitectura escalable permiten soluciones y agentes de IA preparados para IA construidos con IBM watsonx.data y Langflow, un entorno low-code de arrastrar y soltar para desarrollar agentes y pipelines RAG.

Estos procesos tenían que funcionar dentro de parámetros de ingeniería prácticos: los LLM consumen muchos ordenadores y el escalado on-premises requiere el tiempo de ejecución y la implementación adecuados para ser eficaz.

En términos de resultados medibles para el usuario final, Shorthills informó de:

  • Tiempo de búsqueda más rápido y más del 60 % de mejora en la recuperación y la precisión
  • Una mejora aproximada de cuatro veces en la exhaustividad y de nueve veces en la diversidad
  • Mejor soporte para referencias y citas en los resultados devueltos, que antes faltaban

El impacto es concreto: mejora de la recuperación y la precisión, mayor exhaustividad y diversidad, y soporte de citas de alta calidad. Este resultado se traduce en que los usuarios finales dedican menos tiempo a buscar material y más tiempo a evaluarlo.

Una base construida para escalar

La lección principal de Shorthills fue que la búsqueda de soluciones de IA en producción es un ejercicio de ingeniería iterativo. Escalar de unos cuantos documentos a miles (y más) cambia el problema. En última instancia, la “búsqueda” se convierte en un viaje de mejora continua, que evoluciona a través de la búsqueda por palabras clave, vectoriales, híbridas y gráficas, con un enrutamiento cuidadoso para que la latencia y el coste sigan siendo predecibles.

Basándose en IBM watsonx.data y Langflow, Shorthills implementó un sistema de búsqueda impulsado por IA para profesionales legales que puede operar a escala empresarial, gestionar limitaciones empresariales, incluidos los requisitos on-premises. El sistema ofrece ganancias medibles en la relevancia y proporciona las citas y la amplitud de perspectivas que los usuarios legales necesitan para determinar los resultados con confianza.

Existen necesidades similares por parte de los clientes y requisitos de gobierno en sectores como la sanidad y los servicios financieros. La escalabilidad de la infraestructura subyacente nos permite implementar soluciones similares en múltiples sectores y en todo el mundo.

Como siguiente paso, Shorthills ve esta base de recuperación extendiéndose a flujos de trabajo basados en agentes. En estos flujos de trabajo, un agente puede investigar, redactar y empaquetar resultados para su revisión humana sin tener que reconstruir cada vez los datos subyacentes y la pila de recuperación.

Más información sobre IBM watsonx.data

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM