Las últimas tendencias de IA presentadas por expertos
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Microsoft AutoGen es una infraestructura de código abierto para crear agentes de IA y otras aplicaciones de inteligencia artificial código abierto para crear agentes de IA. Es el resultado de la incursión de Microsoft Research en la IA agéntica, que simplifica la creación de sistemas de multi-agente usando modelos de lenguaje grande (LLMs).
Un documento galardonado de 2024 de Chi Wang de Microsoft y otros investigadores demostró la aplicabilidad de AutoGen a varios problemas del mundo real, incluida la optimización de la cadena de suministro y la toma de decisiones en línea.1 El SDK de Python de AutoGen hace que empezar sea tan sencillo como
Si bien AutoGen es uno de los principales marcos multiagente, hay todo un ecosistema de infraestructura/marco de agentes de IA para elegir. Otros incluyen crewAI, LangChain y LangGraph, así como BeeAI de IBM.
AutoGen se compone de tres capas principales.
Core es la capa fundacional de AutoGen, la plomería y el cableado básicos que hacen que la infraestructura de AutoGen funcione. En el lenguaje de Microsoft, "Core API implementa el paso de mensajes, agentes basados en eventos y tiempo de ejecución local y distribuido". En otras palabras, permite que los agentes hablen entre sí, les permite despertarse ante ciertos desencadenantes de eventos y les permite ejecutarse localmente en su computadora o en varios servidores.
Si Core es plomería y cableado, AgentChat es algo así como una casa prefabricada con accesorios incorporados. AgentChat supone (según los casos de uso predominantes) que la mayoría de las personas quieren que los agentes de IA puedan chatear con humanos y otros bots (en términos técnicos, que sean "agentes conversables"). Y en lugar de obligar a los desarrolladores a codificar una lógica de orquestación desde cero, AgentChat asume además que en la colaboración multiagente, habrá una división del trabajo, con equipos de agentes que con frecuencia incluyen un "AsistenteAgente" (que utiliza LLM para "pensar" por el usuario), así como un “UserProxyAgent” (para la ejecución de código y el uso de herramientas). Esta capacidad de aprovechar los equipos de agentes de "plantilla" ayuda a facilitar la creación rápida de prototipos de aplicaciones de IA.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
AutoGen es "extensible", lo que significa que los usuarios pueden agregar nuevas capacidades. Las extensiones predeterminadas de AutoGen incluyen componentes como LocalSearchTool, que permite buscar dentro de su propio conjunto de archivos, así como MultimodalWebSurfer, que puede navegar por Internet en general. Microsoft anima a los desarrolladores a crear también sus propias extensiones.
Otras herramientas útiles incluyen AutoGenBench, que crea un punto de referencia de rendimiento de la IA agéntica y ayuda a dirigir la depuración, así como AutoGen Studio, una interfaz sin código para principiantes (para la cual se puede encontrar un tutorial accesible en YouTube).
Microsoft ha afirmado ver cientos de aplicaciones de AutoGen en industrias que van desde la biotecnología hasta los bienes de consumo empaquetados y las telecomunicaciones.2
Un profesor de fisioterapia en la Universidad de Tufts, Benjamin Stern, ha utilizado AutoGen para tareas complejas, incluida la creación de evaluaciones personalizadas, guías de estudio individualizadas y tutorías para estudiantes en transición a cursos de posgrado. Además, ha utilizado las interacciones de los agentes para simular entrevistas con pacientes y ha aprovechado las capacidades similares al "chat grupal" de AutoGen para fomentar formatos de debate por turnos. También informa que utiliza agentes de OpenAI Assistant a través de AutoGen.
La empresa farmacéutica Novo Nordisk ha informado de varias formas en que utiliza la pila de IA de Microsoft para llevar a cabo y compartir el razonamiento en el descubrimiento de fármacos.3 Sam Khalil, vicepresidente de nsights de datos de la empresa, informa que AutoGen "nos está ayudando a desarrollar un marco de múltiples agentes listo para la producción".
Los ingenieros de IBM Kelly Abuelsaad y Anna Gutowska han creado una aplicación RAG multiagente con AutoGen que funciona a partir de entradas humanas para recopilar información de un corpus local de documentos. Describen un sistema en el que seis agentes altamente especializados (incluido un agente planificador, un asistente de investigación y un generador de informes, entre otros) dividen y vencen. “Ya no necesitamos escribir SQL queries para extraer datos relevantes de una base de conocimientos”, escriben. La solución es más escalable que trabajar con un gran modelo, ya que los desarrolladores pueden aumentar selectivamente cualquier agente único que se convierta en un cuello de botella.
En Github, un usuario demostró cómo se podría utilizar AutoGen para examinar imágenes tomadas con una cámara en un entorno potencialmente peligroso como una fábrica, determinando en tiempo real si algún humano presente no lleva casco. A través de una automatización, el sistema agregaría un cuadro delimitador rojo en la parte superior de la imagen para alertar al personal de seguridad.
Lo anterior ha descrito AutoGen, la oferta de Microsoft. Sin embargo, como suele ocurrir con los proyectos de software, ha habido una bifurcación en el camino. Un infraestructura competidora, AG2, es promocionado como un "Agente OS de código abierto para agentes de IA" por sus creadores, incluido el mencionado Chi Wang. Anteriormente en Microsoft, Chi Wang mover más tarde a Google DeepMind; parece haber decidido evolucionar una versión independiente de AutoGen desde que dejó Microsoft.
"Este no es un marco nuevo: es básicamente AutoGen 0.2.34 que continúa con un nuevo nombre", según un usuario de Reddit que buscó aliviar la confusión.4 Una de las principales diferencias entre AutoGen de Micosoft y AG2 es que este último está impulsado por la comunidad, en lugar de respaldado por una gran empresa. Los mantenedores de AG2 incluyen a Wang, así como a investigadores de Meta, IBM y varias universidades.5
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.
1. “AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation,” Wang et al., Documento de la conferencia COLM 2024, agosto de 2024.
2. “What's New in AutoGen”, Chi Wang, Github, 3 de marzo de 2024
3. “Transformar el descubrimiento de fármacos: Novo Nordisk utiliza el poder de la IA y Azure con Microsoft Research” Microsoft.com, 4 de octubre de 2024
4. “¿Qué está pasando con AutoGen y AG2?” Hilo de Reddit, 2024
5. AG2AI/AG2, lista de mantenimiento de Github, mayo de 2025