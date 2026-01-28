Al usar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al construir sistemas RAG, Shorthills obtiene una mejora del 60 % en la memoria y la precisión.
Las técnicas modernas de inteligencia artificial, como la recuperación semántica y la generación aumentada por recuperación (RAG), pueden reducir el tiempo que los bufetes de abogados dedican a buscar documentos largos. Trabajan encontrando secciones conceptualmente relevantes, resumiendo lo que importa y devolviendo citas rastreables para que los resultados puedan validarse.
Si se hace bien, esto convierte la investigación legal de un flujo de trabajo manual, en el que hay que abrir diez pestañas, en una experiencia de búsqueda guiada y respaldada por pruebas, sin sacrificar el rigor que exigen los equipos jurídicos. En la búsqueda legal, los usuarios no solo necesitan una respuesta; la correcta. Esa respuesta debe estar respaldada rápidamente por las autoridades adecuadas, las excepciones pertinentes y los pasajes exactos que puedan citar.
Con este objetivo en mente, Shorthills AI, con sede en Nueva Jersey, ha desarrollado un marco de agentes de IA generativa en forma de chatbots optimizados para dominios específicos mediante el uso de RAG y grafos de conocimiento. Este marco ofrece información con IA para el sector jurídico, en el que la relevancia, la exhaustividad y el origen verificable importan tanto como la velocidad bruta.
Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60 % en recuperación y precisión.
Las soluciones de IBM también ayudan a mejorar cuatro veces la exhaustividad: la precisión con la que los resultados capturan los detalles y los aspectos de la consulta del usuario. También ofrecen una diversidad nueve veces mayor: la capacidad de ofrecer a los usuarios múltiples interpretaciones y ángulos en lugar de una sola línea de razonamiento. Esta característica es crítica para preparar argumentos y refutaciones en los flujos de trabajo legales.
Los departamentos legales que examinan un conjunto de datos de cientos de miles de documentos legales requieren una recuperación fiable, múltiples ángulos sobre un problema y la capacidad de rastrear los resultados hasta los documentos fuente. Obtener el 70 % de la respuesta puede plantear riesgos importantes y las alucinaciones son inaceptables.
Una limitación clave para muchos clientes legales es la implementación. Es posible que algunas organizaciones no puedan compartir datos confidenciales de contenido legal con los hiperescaladores debido a restricciones reglamentarias. Estas limitaciones pueden requerir que una base de conocimientos permanezca on premises, como el contenido que incluye información de identificación personal (PII) o información médica protegida (PHI).
El sistema de IA legal de Shorthills consta de dos pipelines:
Los archivos se importan en un data lake y luego se preparan para que la recuperación funcione de forma fiable a escala:
En cuanto a las consultas, Shorthills emplea una filosofía pragmática para su entorno de producción: evitar depender de un único método de búsqueda universal.
Para implementar este enfoque, el sistema incluye enrutadores que envían una consulta a la búsqueda de palabras clave, vectores o gráficos en función de la intención del usuario. Cada opción conlleva diferentes compensaciones de tiempo y coste.
Otras consideraciones críticas incluían:
Por último, la experiencia va más allá de una interfaz solo de chat. En este caso de uso de búsqueda legal, los usuarios pueden recuperar múltiples tipos de fuentes de datos, incluidos documentos de Word, imágenes, PDF y archivos de texto.
Una razón clave por la que Shorthills decidió crear esta plataforma de asistente de IA con la pila de IBM surgió de las realidades de implementación empresarial en el mundo legal:
Estos procesos tenían que funcionar dentro de parámetros de ingeniería prácticos: los LLM consumen muchos ordenadores y el escalado on-premises requiere el tiempo de ejecución y la implementación adecuados para ser eficaz.
En términos de resultados medibles para el usuario final, Shorthills informó de:
El impacto es concreto: mejora de la recuperación y la precisión, mayor exhaustividad y diversidad, y soporte de citas de alta calidad. Este resultado se traduce en que los usuarios finales dedican menos tiempo a buscar material y más tiempo a evaluarlo.
La lección principal de Shorthills fue que la búsqueda de soluciones de IA en producción es un ejercicio de ingeniería iterativo. Escalar de unos cuantos documentos a miles (y más) cambia el problema. En última instancia, la “búsqueda” se convierte en un viaje de mejora continua, que evoluciona a través de la búsqueda por palabras clave, vectoriales, híbridas y gráficas, con un enrutamiento cuidadoso para que la latencia y el coste sigan siendo predecibles.
Basándose en IBM watsonx.data y Langflow, Shorthills implementó un sistema de búsqueda impulsado por IA para profesionales legales que puede operar a escala empresarial, gestionar limitaciones empresariales, incluidos los requisitos on-premises. El sistema ofrece ganancias medibles en la relevancia y proporciona las citas y la amplitud de perspectivas que los usuarios legales necesitan para determinar los resultados con confianza.
Existen necesidades similares por parte de los clientes y requisitos de gobierno en sectores como la sanidad y los servicios financieros. La escalabilidad de la infraestructura subyacente nos permite implementar soluciones similares en múltiples sectores y en todo el mundo.
Como siguiente paso, Shorthills ve esta base de recuperación extendiéndose a flujos de trabajo basados en agentes. En estos flujos de trabajo, un agente puede investigar, redactar y empaquetar resultados para su revisión humana sin tener que reconstruir cada vez los datos subyacentes y la pila de recuperación.