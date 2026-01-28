Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60% en la recuperación y la precisión.
Las técnicas modernas de inteligencia artificial, como la recuperación semántica y la generación aumentada por recuperación (RAG, por sus siglas en inglés) pueden reducir el tiempo que los bufetes de abogados dedican a buscar documentos largos. Trabajan encontrando secciones conceptualmente relevantes, resumiendo lo que importa y devolviendo citas rastreables para que los resultados puedan validarse.
Bien hecho, esto convierte la investigación legal de un flujo de trabajo manual de "diez pestañas abiertas" en una experiencia de búsqueda guiada y respaldada por evidencia sin sacrificar el rigor que requieren los equipos legales. En la búsqueda legal, los usuarios no solo necesitan una respuesta; necesitan la respuesta correcta. Esa respuesta debe estar respaldada por las autoridades competentes, las excepciones pertinentes y los pasajes exactos que pueden citar, y todo ello con rapidez.
Con este objetivo en mente, Shorthills IA, con sede en Nueva Jersey, ha desarrollado una infraestructura de agentes de IA generativa en forma de chatbots optimizados para dominios específicos mediante el uso de RAG y gráficos de conocimiento. Este marco ofrece insights impulsados por IA para la industria legal, donde la relevancia, la integridad y el abastecimiento verificable importan tanto como la velocidad bruta.
Al utilizar Astra DB en IBM watsonx.data como base de datos vectorial y Langflow para acelerar la iteración al crear sistemas RAG, Shorthills obtiene una mejora del 60% en la recuperación y la precisión.
Las soluciones de IBM también ayudan a cuadruplicar la exhaustividad: lo bien que los resultados capturan los detalles y aspectos de la consulta del usuario. También ofrecen una mejora de nueve veces en la diversidad: la capacidad de ofrecer a los usuarios múltiples interpretaciones y ángulos en lugar de una sola línea de razonamiento. Esta característica es crítica para preparar argumentos y refutaciones en flujos de trabajo legales.
Los departamentos legales que examinan un conjunto de datos de cientos de miles de documentos legales requieren una recuperación fiable, múltiples ángulos sobre un problema y la capacidad de rastrear los resultados hasta los documentos fuente. Obtener el 70% de la respuesta puede plantear riesgos significativos, y las alucinaciones son inaceptables.
Una limitación clave para muchos clientes legales es el despliegue. Es posible que algunas organizaciones no puedan compartir datos confidenciales en contenido legal con hiperescaladores debido a restricciones reglamentarias. Estas restricciones pueden requerir que una base de conocimientos permanezca on premises, como contenido que incluya información de identificación personal (PII) o información de salud protegida (PHI).
El sistema de IA legal de Shorthills consta de dos pipelines:
Los archivos se importan en un data lake y luego se preparan para que la recuperación funcione de forma fiable a escala:
En cuanto a las consultas, Shorthills emplea una filosofía pragmática para su entorno de producción: evitar depender de un único método de búsqueda universal.
Para implementar este enfoque, el sistema incluye routers que envían una consulta a búsqueda por palabra clave, vector o gráfico dependiendo de la intención del usuario. Cada opción conlleva diferentes compensaciones de tiempo y costo.
Otras consideraciones críticas incluyeron:
Finalmente, la experiencia se extiende más allá de una interfaz de solo chat. En este caso de uso de búsqueda legal, los usuarios pueden recuperar múltiples tipos de fuentes de datos, incluidos documentos de Word, imágenes, PDF y archivos de texto.
Una razón clave por la que Shorthills eligió construir esta plataforma de asistente de IA con la pila de IBM se debió a las realidades del despliegue empresarial en el mundo legal:
Estos procesos tenían que operar dentro de parámetros prácticos de ingeniería: las LLM requieren un gran gasto de computación y el escalado on premises requiere el tiempo de ejecución y el despliegue adecuados para la eficiencia.
En términos de resultados medibles para el usuario final, Shorthills informó:
El impacto es concreto: mejor recuperación y precisión, mayor exhaustividad y diversidad y soporte de citas de alta calidad. Este resultado se traduce en que los usuarios finales pasan menos tiempo buscando material y más tiempo evaluándolo.
La lección principal de Shorthills fue que la búsqueda de soluciones de IA en producción es un ejercicio de ingeniería iterativo. Escalar de unos pocos documentos a miles (y más) cambia el problema. En última instancia, la "búsqueda" se convierte en un proceso de mejora continua, que evoluciona a través de la búsqueda de palabras clave, vectores, híbridos y gráficos, con un enrutamiento cuidadoso para que la latencia y el costo sigan siendo predecibles.
Al basarse en IBM watsonx.data y Langflow, Shorthills implementó un sistema de búsqueda impulsado por IA para profesionales legales que pueden operar a escala empresarial y manejar las limitaciones empresariales, incluidos los requisitos on premises. El sistema ofrece ganancias medibles en la relevancia y proporciona las citas y la amplitud de perspectivas que los usuarios legales necesitan para determinar los resultados con confianza.
Existen necesidades de los clientes y requisitos de gobernanza similares en industrias como la atención médica y los servicios financieros. La escalabilidad de la infraestructura subyacente nos permite desplegar soluciones similares en múltiples industrias y en todo el mundo.
Como siguiente paso, Shorthills prevé que esta base de recuperación se extienda a los flujos de trabajo basados en agentes. En estos flujos de trabajo, un agente puede realizar una investigación, redactar y empaquetar resultados para comentarios humanos sin tener que reconstruir los datos subyacentes y la pila cada vez.