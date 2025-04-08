人工智能 (AI) 治理是指有助于确保 AI 系统和工具安全与道德的流程、标准和护栏。AI 治理框架可指导 AI 研究、开发和应用，以确保安全、公平和尊重人权。
当涉及到智能体时，需要更新治理框架以考虑智能体的自主权。智能体的经济潜力巨大，但伴随而来的风险同样高企。随着智能系统自主性日益增强，如何确保其运作更安全、更符合道德规范且更透明，将成为日益重要的议题。
自主性、适应性和复杂性是 AI 智能体的强大特征，但也使得智能体更难以管理。AI 智能体在治理方面面临的主要挑战之一是其独立决策的能力。与严格遵循规则编程的传统软件系统不同，AI 智能体使用机器学习来分析数据，并根据概率确定行动。这种自主性使 AI 能够在实时环境中运行。
由于缺乏人为控制，因此更难确保 AI 智能体以安全、公平和合乎道德的方式行事。在自动驾驶或算法股票交易等高风险情况下，AI 智能体的决策可能会产生重大后果，但人类并非总能进行监督。这造成了治理困境。领导者如何在 AI 的效率和自主性与问责和控制需求之间取得平衡？
许多 AI 智能体，尤其是由机器学习驱动的更先进的 AI 智能体，会执行人类不容易理解的决策过程。与具有可追溯逻辑的基于规则的系统不同，机器学习模型根据数据中的复杂模式做出决策，即使是开发人员也无法完全理解。这种不透明性使得 AI 驱动的决策难以审核，这对快速发展的自动化用例来说是一个挑战。想象一下，如果 AI 系统根据错误数据拒绝贷款申请，或者医疗保健系统推荐错误的治疗方法，那将是多么可怕的事情。利益相关者必须能够理解该决策背后的理由。
偏差是另一个挑战。AI 系统会从历史数据中学习，但如果数据包含偏差，AI 可能会放大这些偏差。AI 智能体可能会做出不可取的决定，比如将效率置于公平或隐私之上。
与任何 AI 系统一样，自主智能体也容易受到安全威胁。AI 模型和机器人可以通过对抗性攻击进行操纵，对输入数据稍加修改就能诱使 AI 做出错误的决定。大型语言模型 (LLM) 和使用自然语言与用户通信的聊天机器人可能会被诱骗生成有害内容。AI 智能体的分散部署使得难以实施统一的安全措施。
智能体系统通常依赖 API 与外部应用程序和数据源集成。管理不善的 API 可能暴露安全漏洞，成为网络攻击的目标。网络安全风险包括对抗性攻击、数据泄漏和未经授权的访问，从而暴露敏感信息。为了降低这些风险，API 应具有访问控制和身份验证机制，以防止未经授权的交互。
除了安全性之外，组织在设计 AI 智能体时还需要遵守法规。然而，法规往往落后于技术进步。AI 系统本质上复杂且不可预测，而合规要求可能模棱两可或相互矛盾。我们可能很快就会看到世界上的国家和跨国管理机构专门围绕药物的使用制定规则。
传统 AI 治理最佳实践，例如数据治理、风险评估、透明工作流、可解释性、道德标准和持续监控，也适用于智能体系统。但是，智能体治理可能超越这些既定的实践。
各组织不仅可以在部署之前测试模型，还可以创建模拟环境，让 AI 智能体在完全部署之前做出不会对现实世界产生影响的决策。AI 沙盒技术使开发人员能够在智能体接触真实用户前，预先研究可能出现的伦理困境。AI 模型可以在道德压力测试下进行测试，例如模拟自动驾驶事故场景或雇用 AI 时的伦理困境。
智能体对智能体进行监控是在问题失控之前阻止问题的另一种方法。由于智能体生态系统可能非常复杂，因此智能体需要经常相互协作和协商。监控这些交互并为智能体建立冲突解决规则，有助于确保智能体和谐地协同工作。
工作智能体还可以与“治理智能体”配对，旨在监视和评估其他智能体并防止潜在的危害。为了降低风险，必须持续监控智能体以检测模型漂移。试想一下，一个整天与脾气暴躁的客户打交道的客服人员，会因为适应了这种互动而养成坏脾气的性格。现在想象一下，一个治理智能体像监督员一样，把这个智能体叫到一边，并传达一些类似于“你今天好像不太像你自己”的信息。智能体还可以被编程为在执行某些操作时寻求人类批准。
除了这些措施外，许多专家建议智能体程序应具备紧急关闭机制，以便在高风险环境中能够立即停用。组织可以建立遏制程序，以帮助确保出现故障的 AI 无法在干预之前将问题升级。一些组织正在尝试在边缘情况和极端或意外条件下对智能体进行对抗性攻击的压力测试，以识别漏洞。
AI 智能体治理很快就会变得更容易一些。治理平台提供商将提供强大的 AI 治理工具，这些工具带有仪表盘，可提供智能体系统和智能体交互的专门指标。例如，IBM 的软件工程师目前正致力于将上下文相关性、忠实度和答案相似性等专门指标集成到 watsonx.gov 中。合适的治理软件将帮助利益相关者在整个端到端生命周期内跟踪其智能体，使他们能够最大限度地利用 agentic AI。
随着 agentic AI 系统变得更加自主，确保它们安全、合乎道德和安全地运行是一项日益严峻的挑战。组织必须采用可扩展的治理模型，执行强大的网络安全和风险管理协议，并整合人机回圈监督。如果组织能够安全地扩展智能体系统，就能获取几乎无限的价值。
