Se trata de configuraciones avanzadas que combinan múltiples modelos, técnicas o sistemas de IA para resolver problemas complejos con mayor eficacia que un solo modelo de IA. Estos sistemas integran diferentes componentes, cada uno especializado en una tarea particular para trabajar de forma colaborativa o secuencial.
Si bien se presta mucha atención a los modelos de lenguaje extensos (LLM), estos enormes modelos de aprendizaje automático (ML) enfrentan limitaciones. Resulta costoso ejecutarlos y desarrollarlos, y son lentos. Carecen de experiencia específica en los dominios y no siempre son expertos en el manejo de tareas complejas que implican muchos pasos en todos los sistemas.
Debido a tales limitaciones, los investigadores han descubierto que complementar los modelos monolíticos con otros modelos y herramientas, cada uno optimizado para un rol específico, puede hacer que el método sea más eficaz.
Una entrada en el blog de 2024 del Laboratorio de Investigación en Inteligencia Artificial de Berkeley (BAIR) fue una visión temprana clarificadora de cómo serían los sistemas de IA compuestos. La publicación proponía que se podrían obtener mejores resultados construyendo sistemas de IA compuestos y que el futuro de la IA supondría que las organizaciones reunieran LLM, sistemas de recuperación, agentes de IA y herramientas externas, cada una optimizada para tareas específicas.
La orquestación de múltiples modelos individuales y componentes interactivos conlleva numerosos beneficios.
Al dividir las tareas entre modelos especializados, los sistemas compuestos reducen la carga cognitiva de los componentes individuales de la IA. Por ejemplo, un modelo podría centrarse en analizar datos estructurados, mientras que otro interpreta datos no estructurados, como imágenes o texto. Esta división del trabajo mejora el rendimiento y aumenta la precisión en comparación con los sistemas de un solo modelo.
Los LLM son impresionantes y cada vez más grandes, así que cuando se les suministran más recursos computacionales, pero se enfrentan a techos de rendimiento y las salidas van disminuyendo dadas las leyes de escalabilidad, a veces, en lugar de aumentar los cómputos en un LLM, puede ser preferible delegar ciertas tareas a otro modelo, agente o herramienta que no consuma tantos recursos.
A veces, es posible que combinar varios modelos para realizar una tarea sea más rápido que entrenar un solo LLM para ella. Además, los sistemas compuestos pueden procesar diferentes tipos de datos simultáneamente, lo que permite tomar decisiones en tiempo real. Esto es fundamental en las aplicaciones de la IA, como la detección de fraudes, donde las respuestas rápidas son esenciales, o en aplicaciones perimetrales, donde se debe minimizar la latencia.
Los sistemas compuestos son muy versátiles y aplicables en diversos casos de uso. Esta versatilidad hace que los sistemas de IA compuestos sean la opción de preferencia de las empresas que buscan optimizar las operaciones en múltiples dominios.
Las organizaciones pueden beneficiarse de los diseños de sistemas que utilizan una combinación de componentes previamente entrenados, código abierto y módulos personalizados. Cada componente se puede actualizar o reemplazar de forma independiente a medida que la tecnología evoluciona sin tener que revisar todo el sistema. Al distribuir las tareas en varios modelos, los sistemas compuestos se benefician de la adaptabilidad y la resiliencia a fallas de componentes individuales.
Los métodos compuestos, entre ellos la generación aumentada por recuperación (RAG), amplían las capacidades de los LLM al permitirles acceder a fuentes de datos ajenas a sus conjuntos de datos de entrenamiento iniciales. La combinación de diferentes modelos permite a los desarrolladores optimizar objetivos específicos, como la velocidad o la pericia en los dominios.
Los LLM pueden ser difíciles de manejar, propensos a las alucinaciones y tomar decisiones que no siempre se pueden explicar fácilmente. Una solución de IA compuesta puede ayudar a controlar las entradas y filtrar las salidas, lo que deriva en un comportamiento más controlado que promueve la confianza.
Los sistemas de IA compuestos ya se están empleando en casos de uso del mundo real, como:
Ciertas versiones de chatbots, incluidos ChatGPT de OpenAI y Copilot de Microsoft, se basan en arquitecturas compuestas. ChatGPT, por ejemplo, amplía su utilidad a través de varias herramientas y API para tareas específicas.
Reúne un LLM, el generador de imágenes DALL-E y un complemento de intérprete de código. Utiliza RAG para acceder dinámicamente a fuentes de datos y bases de conocimiento externas. Se utilizan modelos de IA separados para detectar y filtrar contenido dañino o inapropiado antes de dar una respuesta.
Aunque esta tecnología aún no se ha generalizado, los sistemas de vehículos autónomos utilizan modelos de visión artificial para detectar y reconocer objetos en el entorno del automóvil. Los algoritmos de fusión de sensores combinan datos de cámaras, LiDAR, radar y sensores ultrasónicos para crear un mapa 3D completo del entorno, mejorando así la conciencia situacional.
Los modelos de aprendizaje por refuerzo toman decisiones, como determinar cuándo cambiar de carril, ajustar la velocidad o detenerse en un semáforo, en función de las condiciones en tiempo real.
Además, el procesamiento de lenguaje natural (PLN) permite que el vehículo interprete y responda a órdenes habladas de los pasajeros. Estos componentes funcionan juntos perfectamente para procesar grandes cantidades de datos, tomar decisiones inteligentes rápidamente y proporcionar una experiencia intuitiva.
Un sistema de IA compuesto en atención al cliente combina varias tecnologías de IA para ofrecer un servicio eficiente, personalizado y con capacidad de respuesta. Por ejemplo, los modelos de PLN analizan las consultas de los clientes para extraer la intención y los detalles clave, lo que permite que el sistema comprenda el problema con precisión.
Una vez identificada la intención, un chatbot impulsado por IA generativa entabla conversación con un cliente, ofreciendo asistencia inmediata o aclarando detalles adicionales. Al mismo tiempo, un sistema de recomendaciones sugiere soluciones relevantes, como pasos para la solución de problemas, artículos de preguntas frecuentes o recomendaciones de productos adaptadas a las necesidades del cliente.
Para mejorar la experiencia, un modelo de análisis de opiniones evalúa el tono y el estado emocional del cliente, lo que ayuda a priorizar los casos urgentes o de insatisfacción para derivarlos a un humano. Esta combinación de componentes permite una atención al cliente rápida, inteligente y empática, lo que reduce el tiempo de resolución y mantiene altos niveles de satisfacción del cliente.
Un sistema de IA compuesto en la cadena de suministro emplea múltiples componentes de IA para optimizar la logística, la gestión de inventarios y la eficiencia general. Por ejemplo, los modelos de análisis predictivos pronostican la demanda analizando los datos históricos de ventas, las tendencias estacionales y las variables del mercado, lo que permite planear los inventarios con precisión.
Los sistemas de visión artificial monitorean las operaciones del almacén, identificando ineficiencias o errores en tiempo real, como artículos extraviados o mercancías dañadas. Al mismo tiempo, los algoritmos de optimización de rutas determinan las rutas de entrega más eficientes, teniendo en cuenta factores como el tráfico, el clima y el consumo de combustible.
Además, el PLN permite el manejo automatizado de las comunicaciones con proveedores y clientes, como el procesamiento de órdenes de compra o la respuesta a consultas. Al integrar estos componentes, el sistema mejora la capacidad de respuesta de la cadena de suministro, reduce el desperdicio y ayuda a garantizar la entrega oportuna, al tiempo que se adapta dinámicamente a los cambios en la demanda y las condiciones externas.
Diseñar sistemas de IA compuestos implica integrar múltiples modelos de IA y componentes en marcos cohesivos capaces de abordar tareas complejas. Estos marcos proporcionan la infraestructura para combinar diversos modelos de IA y ayudan a garantizar una comunicación fluida entre ellos.
En un sistema de IA compuesto, una lógica de control programada podría recurrir a un modelo o un LLM podría estar “a cargo”, dependiendo de los objetivos del sistema.
Ambos métodos tienen distintas ventajas, y las diversas formas en que los modelos y otros componentes pueden trabajar juntos dentro de un sistema de IA son ilimitadas, por lo que los diseñadores deben considerar su elección de manera crítica y estar dispuestos a experimentar con diversas arquitecturas y combinaciones de componentes.
Las operaciones de machine learning (MLOps) se vuelven más complicadas con flujos de trabajo compuestos. Por ejemplo, es difícil aplicar métricas coherentes en diferentes tipos de herramientas y modelos. Los investigadores de BAIRD afirman que surge una nueva fase de desarrollo de IA junto con el cambio a sistemas compuestos para ayudar a lidiar con los desafíos que suponen el monitoreo, la depuración y otras cuestiones operativas involucradas.