Las últimas tendencias en IA, presentadas por expertos
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
Microsoft AutoGen es un marco de código abierto para crear agentes de IA y otras aplicaciones de inteligencia artificial. Es el resultado de la incursión de Microsoft Research en la IA agéntica, que simplifica la creación de sistemas multiagente mediante el uso de grandes modelos de lenguaje (LLM).
Un artículo galardonado de 2024, escrito por Chi Wang, de Microsoft, y otros investigadores, demostró la aplicabilidad de AutoGen a varios problemas del mundo real, entre ellos la optimización de la cadena de suministro y la toma de decisiones en línea.1 El SDK para Python de AutoGen hace que empezar sea tan sencillo como
Aunque AutoGen es uno de los principales marcos multiagente, hay todo un ecosistema de marcos de agentes de IA entre los que elegir. Otros incluyen crewAI, LangChain y LangGraph, así como BeeAI de IBM.
AutoGen se compone de tres capas principales.
Core es la capa fundamental de AutoGen, la estructura básica que hace funcionar el marco de AutoGen. En el lenguaje de Microsoft, "Core API implementa el paso de mensajes, agentes basados en eventos y tiempo de ejecución local y distribuido". En otras palabras, permite que los agentes hablen entre sí, les permite despertarse cuando se activan ciertos eventos y les permite ejecutarse localmente en su ordenador o en varios servidores.
Si Core es la estructura básica, AgentChat es algo así como una casa prefabricada con accesorios incorporados. AgentChat supone (basándose en los casos de uso predominantes) que la mayoría de la gente quiere que los agentes de IA puedan chatear con humanos y otros bots (en términos técnicos, que sean "agentes conversables"). Y en lugar de obligar a los desarrolladores a codificar una lógica de orquestación desde cero, AgentChat supone además que en la colaboración multiagente habrá una división del trabajo, con equipos de agentes que suelen incluir un "AssistantAgent" (que utiliza LLM para "pensar" por el usuario), así como un "UserProxyAgent" (para la ejecución de código y el uso de herramientas). Esta capacidad de aprovechar los equipos de agentes de "plantilla" ayuda a facilitar la creación rápida de prototipos de aplicaciones de IA.
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
AutoGen es "extensible", lo que significa que los usuarios pueden añadir nuevas capacidades. Las extensiones predeterminadas de AutoGen incluyen componentes como LocalSearchTool, que permite buscar dentro de su propio conjunto de archivos, así como MultimodalWebSurfer, que puede navegar por Internet en general. Microsoft anima a los desarrolladores a crear también sus propias extensiones.
Otras herramientas útiles incluyen AutoGenBench, que establece una referencia del rendimiento de la IA agéntica y ayuda a dirigir la depuración, así como AutoGen Studio, una interfaz no-code para principiantes (para la cual se puede encontrar un tutorial de vídeo accesible.
Microsoft ha afirmado haber visto cientos de aplicaciones de AutoGen en sectores que van desde la biotecnología hasta los bienes de consumo empaquetados y las telecomunicaciones.2
Un profesor de fisioterapia en la Universidad de Tufts, Benjamin Stern, ha utilizado AutoGen para tareas complejas, incluida la creación de evaluaciones personalizadas, guías de estudio individualizadas y tutorías para estudiantes en transición a cursos de posgrado. Además, ha utilizado las interacciones de los agentes para simular entrevistas con pacientes y ha aprovechado las capacidades similares al "chat de grupo" de AutoGen para fomentar formatos de debate por turnos. También informa que utiliza agentes de OpenAI Assistant a través de AutoGen.
La empresa farmacéutica Novo Nordisk ha informado de varias formas en que utiliza la pila de IA de Microsoft para llevar a cabo y compartir el razonamiento en el descubrimiento de fármacos.3 Sam Khalil, vicepresidente de información de datos de la empresa, informa que AutoGen "nos está ayudando a desarrollar un marco de múltiples agentes listo para la producción".
Los ingenieros de IBM, Kelly Abuelsaad y Anna Gutowska, han creado una aplicación RAG multiagente con AutoGen que funciona a partir de entradas humanas para recopilar información de un corpus local de documentos. Describen un sistema en el que seis agentes altamente especializados (incluido un agente planificador, un asistente de investigación y un generador de informes, entre otros) dividen y vencen. "Ya no necesitamos escribir complejas consultas SQL para extraer datos relevantes de una base de conocimientos", escriben. La solución es más escalable que trabajar con un gran modelo, ya que los desarrolladores pueden aumentar selectivamente cualquier agente que se convierta en un cuello de botella.
En Github, un usuario ha demostrado cómo AutoGen podría utilizarse para examinar imágenes tomadas con una cámara en un entorno potencialmente peligroso como una fábrica, determinando en tiempo real si algún humano presente no lleva casco. Mediante un proceso automatizado, el sistema añadiría un recuadro rojo sobre la imagen para alertar al personal de seguridad.
Lo anterior ha descrito AutoGen, la oferta de Microsoft. Sin embargo, como suele ocurrir con los proyectos de software, ha habido una bifurcación en el camino. Un marco competidor, AG2, se promociona como un "Agente OS de código abierto para agentes de IA" por sus creadores, incluido el mencionado Chi Wang. Anteriormente en Microsoft, Chi Wang mover más tarde a Google DeepMind; parece haber decidido desarrollar una versión independiente de AutoGen desde que dejó Microsoft.
"Este no es un marco nuevo, es básicamente AutoGen 0.2.34 que continúa con un nuevo nombre", según un usuario de Reddit que trató de aliviar la confusión.4 Una de las principales diferencias entre AutoGen de Microsoft y AG2 es que este último está impulsado por la comunidad, en lugar de respaldado por una gran empresa. Entre los mantenedores de AG2 se encuentran Wang, así como investigadores de Meta, IBM y varias universidades.5
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.
1. "AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation". Wang et al. Documento de la conferencia COLM 2024. Agosto de 2024.
2. "What's New in AutoGen". Chi Wang, Github. 3 de marzo de 2024.
3. “Transforming drug discovery: Novo Nordisk uses the power of AI and Azure with Microsoft Research”. Microsoft.com. 4 de octubre de 2024.
4. “What’s going on with AutoGen and AG2?” Hilo de Reddit. 2024.
5. AG2AI/AG2,. Lista de mantenedores de Github. Mayo de 2025.