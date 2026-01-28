Inteligencia artificial Computación y servidores Automatización de TI

RAG de producción para búsqueda legal: cómo Shorthills AI escaló la recuperación de datos con IBM watsonx.data

Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60% en la recuperación y la precisión.

Publicado el 28 de enero de 2026
Las técnicas modernas de inteligencia artificial, como la recuperación semántica y la generación aumentada por recuperación (RAG, por sus siglas en inglés) pueden reducir el tiempo que los bufetes de abogados dedican a buscar documentos largos. Trabajan encontrando secciones conceptualmente relevantes, resumiendo lo que importa y devolviendo citas rastreables para que los resultados puedan validarse.

Bien hecho, esto convierte la investigación legal de un flujo de trabajo manual de "diez pestañas abiertas" en una experiencia de búsqueda guiada y respaldada por evidencia sin sacrificar el rigor que requieren los equipos legales. En la búsqueda legal, los usuarios no solo necesitan una respuesta; necesitan la respuesta correcta. Esa respuesta debe estar respaldada por las autoridades competentes, las excepciones pertinentes y los pasajes exactos que pueden citar, y todo ello con rapidez.

Insights impulsados por IA para la industria legal

Con este objetivo en mente, Shorthills IA, con sede en Nueva Jersey, ha desarrollado una infraestructura de agentes de IA generativa en forma de chatbots optimizados para dominios específicos mediante el uso de RAG y gráficos de conocimiento. Este marco ofrece insights impulsados por IA para la industria legal, donde la relevancia, la integridad y el abastecimiento verificable importan tanto como la velocidad bruta.

Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60% en la recuperación y la precisión.

Las soluciones de IBM también ayudan a cuadruplicar la exhaustividad: lo bien que los resultados capturan los detalles y aspectos de la consulta del usuario. También ofrecen una mejora de nueve veces en la diversidad: la capacidad de ofrecer a los usuarios múltiples interpretaciones y ángulos en lugar de una sola línea de razonamiento. Esta característica es crítica para preparar argumentos y refutaciones en flujos de trabajo legales.

Ponerlo en práctica: búsqueda de documentos legales a gran escala que mejora la relevancia, la integridad y la confianza

Los departamentos legales que examinan un conjunto de datos de cientos de miles de documentos legales requieren una recuperación fiable, múltiples ángulos sobre un problema y la capacidad de rastrear los resultados hasta los documentos fuente. Obtener el 70% de la respuesta puede plantear riesgos significativos, y las alucinaciones son inaceptables.

Una limitación clave para muchos clientes legales es el despliegue. Es posible que algunas organizaciones no puedan compartir datos confidenciales en contenido legal con hiperescaladores debido a restricciones reglamentarias. Estas restricciones pueden requerir que una base de conocimientos permanezca on premises, como contenido que incluya información de identificación personal (PII) o información de salud protegida (PHI).

Arquitectura técnica: un pipeline escalable para la búsqueda híbrida de RAG/palabras clave y la recuperación de gráficos

El sistema de IA legal de Shorthills consta de dos pipelines:

  1. Ingesta y procesamiento de documentos y datos
  2. Consulta y recuperación, diseñadas para admitir múltiples modos de recuperación (palabra clave, vector y gráfico) y para dirigir las consultas a la técnica adecuada en función de la intención.

1. Pipeline de ingesta: desde archivos legales sin procesar hasta estructuras de búsqueda

Los archivos se importan en un data lake y luego se preparan para que la recuperación funcione de forma fiable a escala:

  • La fragmentación de documentos en partes más pequeñas, con énfasis en la fragmentación significativa, no simplemente la división por caracteres y el número de palabras, ayuda a preservar el contexto, como definiciones, citas y estructuras de argumentos.
  • La extracción de entidades impulsada por un modelo de lenguaje grande (LLM) identifica campos legalmente relevantes, como el nombre del juez, el nombre del caso, el tipo de caso, los identificadores de documentos y el tipo de sentencia. A continuación, se construye un diagrama de relaciones entre entidades para que las relaciones puedan utilizarse posteriormente durante la recuperación.
  • Incorporación documenta con un modelo de incorporación, y almacenar los vectores resultantes soporta la recuperación vectorial e híbrida de una escala. Shorthills confía en Astra DB como base de almacenamiento para los datos que se pueden buscar.
Procesamiento de archivos PDF y almacenamiento de datos Procesamiento de archivos PDF y almacenamiento de datos: los nuevos PDF se leen, se dividen en fragmentos de texto más pequeños (por ejemplo, párrafos o secciones) y los ID de los archivos procesados se guardan en el CSV. Este enfoque crea un texto estructurado y fragmentado listo para su análisis y actualiza el registro de seguimiento para evitar que se vuelva a procesar.
Fragmentación y extracción de relaciones de entidades Fragmentación y extracción de relaciones entre entidades: los fragmentos se envían a Amazon Bedrock para detectar entidades, como personas, organizaciones, y sus relaciones, como "trabaja en", "ubicado en". La salida LLM sin procesar (texto no estructurado) se almacena temporalmente en caché en un archivo JSON local. Luego, estos datos se analizan en formatos limpios y estructurados: entidades como elementos etiquetados y relaciones como conexiones entre ellos. Las incorporaciones (representaciones numéricas) para los fragmentos también se generan y se almacenan en una base de datos vectorial para su futura recuperación.

2. Canalización de consultas: enrutamiento, recuperación híbrida y reranking para mayor relevancia y latencia

En cuanto a las consultas, Shorthills emplea una filosofía pragmática para su entorno de producción: evitar depender de un único método de búsqueda universal.

  • La búsqueda de palabras clave sigue siendo importante para identificadores exactos, como números de documentos o ID.
  • La búsqueda vectorial mejora la coincidencia semántica cuando los usuarios hacen preguntas en lenguaje natural, como reconocer que "monitor" y "pantalla" podrían referirse al mismo concepto.
  • La búsqueda gráfica puede capturar los vínculos entre documentos, pero a gran escala puede volverse lenta y consumir mucha memoria, por lo que debe utilizarse de forma selectiva.
Canal de búsqueda sobre la base de conocimientos Canal de búsqueda sobre la base de conocimientos: una consulta de usuario se enruta a través de API Gateway y se convierte en una búsqueda híbrida (palabra clave y vector) impulsada por Amazon Bedrock, donde los datos relevantes se recuperan de watsonx. Luego, los datos pasan a través de una capa de deduplicación y clasificación y se devuelven al usuario como un resultado de búsqueda refinado y rico en contexto.

Para implementar este enfoque, el sistema incluye routers que envían una consulta a búsqueda por palabra clave, vector o gráfico dependiendo de la intención del usuario. Cada opción conlleva diferentes compensaciones de tiempo y costo.

Otras consideraciones críticas incluyeron:

  • Existe la necesidad de una implementación de búsqueda híbrida escalable que combine la búsqueda de palabras clave y vectores con capacidades gráficas cuando corresponda. Este enfoque optimiza la precisión de los resultados de búsqueda y evita que los sistemas se atasquen a medida que crece el almacén de documentos.
  • El sistema incluye una etapa de reclasificación después de la recuperación para mejorar la relevancia final antes de que los resultados se devuelvan al usuario.

Finalmente, la experiencia se extiende más allá de una interfaz de solo chat. En este caso de uso de búsqueda legal, los usuarios pueden recuperar múltiples tipos de fuentes de datos, incluidos documentos de Word, imágenes, PDF y archivos de texto.

Beneficios: flexibilidad, seguridad y escalabilidad

Una razón clave por la que Shorthills eligió construir esta plataforma de asistente de IA con la pila de IBM se debió a las realidades del despliegue empresarial en el mundo legal:

  • El soporte on premises y la residencia de datos son esenciales para los clientes que no pueden mover datos confidenciales a hiperescaladores debido a la tolerancia al riesgo o a los requisitos normativos.
  • IBM watsonx.data desbloquea la capacidad de escalar la búsqueda en grandes volúmenes de documentos.
  • La seguridad de nivel empresarial y una arquitectura escalable permiten soluciones listas para IA y agentes de IA creados con IBM watsonx.data y Langflow, un entorno de arrastrar y soltar de código bajo para desarrollar agentes y canalizaciones RAG.

Estos procesos tenían que operar dentro de parámetros prácticos de ingeniería: las LLM requieren un gran gasto de computación y el escalado on premises requiere el tiempo de ejecución y el despliegue adecuados para la eficiencia.

En términos de resultados medibles para el usuario final, Shorthills informó:

  • Tiempo de búsqueda más rápido y más del 60% de mejora en la recuperación y la precisión
  • Una mejora de aproximadamente 4 veces en exhaustividad y 9 veces en diversidad
  • Mejor soporte para referencias y citas en los resultados devueltos, que antes faltaban

El impacto es concreto: mejor recuperación y precisión, mayor exhaustividad y diversidad y soporte de citas de alta calidad. Este resultado se traduce en que los usuarios finales pasan menos tiempo buscando material y más tiempo evaluándolo.

Una base construida para escalar

La lección principal de Shorthills fue que la búsqueda de soluciones de IA en producción es un ejercicio de ingeniería iterativo. Escalar de unos pocos documentos a miles (y más) cambia el problema. En última instancia, la "búsqueda" se convierte en un proceso de mejora continua, que evoluciona a través de la búsqueda de palabras clave, vectores, híbridos y gráficos, con un enrutamiento cuidadoso para que la latencia y el costo sigan siendo predecibles.

Al basarse en IBM watsonx.data y Langflow, Shorthills implementó un sistema de búsqueda impulsado por IA para profesionales legales que pueden operar a escala empresarial y manejar las limitaciones empresariales, incluidos los requisitos on premises. El sistema ofrece ganancias medibles en la relevancia y proporciona las citas y la amplitud de perspectivas que los usuarios legales necesitan para determinar los resultados con confianza.

Existen necesidades de los clientes y requisitos de gobernanza similares en industrias como la atención médica y los servicios financieros. La escalabilidad de la infraestructura subyacente nos permite desplegar soluciones similares en múltiples industrias y en todo el mundo.

Como siguiente paso, Shorthills prevé que esta base de recuperación se extienda a los flujos de trabajo basados en agentes. En estos flujos de trabajo, un agente puede realizar una investigación, redactar y empaquetar resultados para comentarios humanos sin tener que reconstruir los datos subyacentes y la pila cada vez.

Aprenda más sobre IBM watsonx.data

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM