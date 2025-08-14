据估计，到 2024 年，AI 智能体市场约为 50 亿美元，预计到 2030 年将增长到约 500 亿美元。1然而，随着越来越多的企业构建 AI 智能体以简化和自动化工作流，在监控这些智能体的行为以确保它们按预期运行方面出现了新的挑战。AgentOps 是一套尚处于初步定义阶段的新兴最佳实践，主要用于评估智能体的性能，其理念建立在相关领域的基础之上：DevOps（规范了软件交付流程）和MLOps（对机器学习模型做了同样的规范）。

但是管理智能体并不像构建传统软件甚至 AI 模型那样简单。“智能体式”系统是复杂且动态的，本质上涉及具有自己想法的软件。智能体自主行动、链接任务、做出决策并采取非确定性行为。AgentOps 背后的想法是将可观测性和可靠性带入可能混乱的领域，使开发人员能够窥视智能体交互和其他智能体行为的黑匣。

管理 AgentOps 并没有单一工具，而是依赖整个生态系统；一项最新研究发现，在 Github 及其他代码库中，有 17 款与该实践相关的工具，从 Agenta 到 LangSmith 再到 Trulens 不等（其中一款雄心勃勃的 AgentOps 工具就名为“AgentOps”）。此类工具通常可为开发人员所选的智能体框架提供支持，无论是 IBM 的 watsonx Agents 还是 OpenAI 的 Agents SDK。在这一热门领域，出现了许多流行的平台和框架，包括 AutoGen、LangChain 和 CrewAI （后者针对多智能体系统的编排进行了优化）。