什么是 AutoGen?

作者

David Zax

Staff Writer

IBM Think

Microsoft AutoGen 是一个开源框架,用于构建 AI 智能体和其他人工智能应用程序。它是 Microsoft Research 在智能体式 AI 领域尝试的结果,简化了使用大型语言模型 (LLM) 创建多智能体系统的过程。 

Microsoft 的 Chi Wang 和其他研究人员在 2024 年发表的一篇获奖论文展示了 AutoGen 在多个现实问题中的适用性,包括供应链优化和在线决策制定。1 AutoGen 的 Python SDK 使得入门入门变得简单如 pip install

虽然 AutoGen 是一个领先的多智能体框架,但还有整个生态系统可供选择的 AI 智能体框架。其他框架包括 crewAILangChainLangGraph,以及 IBM 的 BeeAI

AutoGen 的架构

AutoGen 由三个主要层组成。

核心层

Core 是 AutoGen 的基础层,是使 AutoGen 框架能够运行的基本管道和布线。用 Microsoft 的话来说,“Core API 实现了消息传递、事件驱动智能体以及本地和分布式运行时。”换句话说,它允许智能体 相互通信,使它们能够在某些事件触发时唤醒,并使它们能够在本地计算机或各种服务器上运行。

AgentChat 层

如果 Core 是管道和布线,那么 AgentChat 就像一个带有内置固定装置的预制房屋。AgentChat 假设(基于流行的用例)大多数人希望 AI 智能体能够与人类和其他机器人进行聊天(在技术术语中,成为“可对话的智能体”)。AgentChat 并没有强迫开发人员从头开始编写编排逻辑,而是进一步假设在多智能体协作中,会有分工,智能体团队经常包括一个“AssistantAgent”(它使用 LLM 为用户进行“思考”)以及一个“UserProxyAgent”(用于代码执行和工具使用)。这种利用“模板”智能体团队的能力有助于促进 AI 应用程序的快速原型设计。

专家为您带来最新的 AI 趋势

获取有关最重要且最有趣的 AI 新闻的精选洞察分析。订阅我们的每周 Think 时事通讯。请参阅 IBM 隐私声明

谢谢!您已订阅。

您的订阅将以英语提供。您会在每份时事通讯中找到一个取消订阅链接。您可以在此处管理您的订阅或取消订阅。有关更多信息,请参阅我们的 IBM 隐私声明

扩展层

AutoGen 是“可扩展的”,这意味着用户可以添加新的功能。AutoGen 的默认扩展 包括 LocalSearchTool 和 MultiModeWebSurfer 等组件,前者支持在自己的文件集内进行搜索,后者可以覆盖更广泛的互联网。Microsoft 也鼓励开发人员创建自己的扩展。

其他有用的工具包括 AutoGenBench ,它可以对智能体式 AI 性能进行基准测试并帮助直接调试,以及 AutoGen Studio,这是一个面向初学者的无代码界面(可以在 YouTube 上找到易于上手的视频教程 )。 

AutoGen 的实际用例

Microsoft 声称,已在生物技术到消费品包装再到电信等行业中看到了数百种 AutoGen 应用。2

教育

塔夫茨大学的理疗教授 Benjamin Stern 利用 AutoGen 完成了复杂的任务,包括为过渡到研究生课程的学生创建定制的评估、个性化的学习指南和辅导。此外,他还利用智能体交互来模拟患者访谈,并利用 AutoGen 类似“群聊”的功能来促进循环辩论形式。他还报告了通过 AutoGen 使用 OpenAI 助手智能体的情况。

AI 智能体

5 种类型的 AI 智能体:自主功能与现实世界的应用

了解目标驱动和基于效用的 AI 如何适应工作流和复杂环境。

发现药物

制药公司 Novo Nordisk 报告了其使用 Microsoft 的 AI 堆栈在药物发现中进行和共享推理的几种方法。3该公司数据洞察副总裁 Sam Khalil 表示,AutoGen “正在帮助我们开发一个可用于生产的多智能体框架”。

数据科学

IBM 工程师 Kelly Abuelsaad 和 Anna Gutowska 创建了一个使用 AutoGen 的多智能体RAG 应用,该应用从人工输入开始,从本地文档库中收集信息。他们描述了一个由六个高度专业化的智能体(包括规划智能体、研究助理和报告生成器等)分工协作的系统。“我们不再需要编写复杂的 SQL 查询来从知识库中提取相关数据,”他们写道。由于开发者可以选择性地增强任何一个成为瓶颈的单一智能体,该解决方案比使用一个大型模型更具可扩展性。

2. 职业安全

在 Github 上,一位用户演示了 如何使用 AutoGen 来检查工厂等潜在危险环境中摄像头拍摄的图像,实时判断现场的人员是否未戴安全帽。通过自动化,该系统会在图像上方添加一个红色边框,以提醒安全人员。

AutoGen 与 AG2

以上介绍了微软的 AutoGen 产品。然而,正如软件项目经常出现的情况一样,也出现了一个分支。一个名为AG2的竞争框架被其创建者(包括上述 Chi Wang)称为“AI 智能体的开源AgentOS”。Chi Wang 曾在 Microsoft 工作,后来加入 Google DeepMind;他在离开 Microsoft 后似乎已经决定开发一个 AutoGen 的独立版本。

根据一位意在澄清误解的 Reddit 用户所述:“这并非全新框架,本质上就是更名为 AutoGen 0.2.34 的延续版本。”4Microsoft 的 AutoGen 和 AG2 之间的主要区别之一是,后者是社区驱动的,而不是由一家大公司提供支持。AG2 的维护者包括 Wang,以及来自 Meta、IBM 和多所大学的研究人员。5

相关解决方案
IBM AI 智能体开发

借助 IBM watsonx.ai 开发平台,让开发人员能够构建、部署和监控 AI 代理。

 

深入了解 watsonx.ai
人工智能 (AI) 解决方案

借助 IBM 业界领先的人工智能专业知识和解决方案组合,让人工智能在您的业务中发挥作用。

深入了解人工智能解决方案
AI 咨询与服务

通过增加 AI 重塑关键工作流程和运营,最大限度提升体验、实时决策和商业价值。

深入了解人工智能服务
采取下一步行动

无论您是选择定制预构建的应用程序和技能,还是使用 AI 开发平台构建和部署定制代理服务,IBM watsonx 平台都能满足您的需求。

探索 watsonx Orchestrate 深入了解 watsonx.ai
脚注

1. “AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation,” Wang et al., COLM 2024 conference paper, August 2024.

2. “What’s New in AutoGen”,  Chi Wang, Github, March 3 2024

3. “Transforming drug discovery: Novo Nordisk uses the power of AI and Azure with Microsoft Research” Microsoft.com, October 4, 2024

4. “What’s going on with AutoGen and AG2?” Reddit thread, 2024

5. AG2AI/AG2, Github Maintainers list, May 2025