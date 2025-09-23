IBM 在“2025 年 IDC Marketscape 全球生成式 AI 评估技术产品 2025 供应商评估”中被评为领导者。
我们相信，这一认可反映了 IBM watsonx.governance 日益增长的影响力和持续创新，以及 IBM 致力于满足现代对可信、可扩展和负责任的 AI 的需求的承诺。
IDC MarketScape 报告指出：“拥有多样化技术环境的企业可能会发现 IBM 是一个中立的供应商。例如，它不依赖于特定的云服务。此外，重视 IBM 更广泛相关产品（包括自动化文档、管理护栏和安全产品）的企业，也应考虑 IBM。”
IDC MarketScape 供应商分析模型旨在概述特定市场中技术和供应商的竞争能力。该研究方法采用严格的评分方法，基于定性和定量标准，从而生成每个供应商在特定市场中的位置的图形化展示。能力得分衡量供应商在短期内的产品、市场推广和业务执行能力。战略得分衡量供应商战略与客户需求在 3 到 5 年时间范围内的契合度。供应商的市场份额由图标的大小表示
IDC MarketScape 的严格评估框架提供了客观的第三方评估，组织在做生成式 AI 模型评估技术决策时可以信赖。
该框架考虑了以下 5 个类别：
我们认为 IBM 的优势包括：
IBM® watsonx.governance 可提供一种统一的方法来管理从开发到部署的整个 AI 生命周期。通过引导式问卷，用户可以定义业务问题，帮助发现并识别潜在风险，同时揭示应对策略。
这些风险维度被映射为可在评估过程中使用的指标。此外，该集成流程在评估过程中会自动提取元数据，将其存储在集中化的事实表中，并提供应用开发过程的透明记录，包括模型信息、提示模板等。通过将评估技术纳入这一紧密集成的生命周期（包括文档化），我们将自身定位为企业用户的理想解决方案。
通过整合风险数据、风险与控制评估、内部和外部损失事件以及关键风险指标或度量，团队可以全面了解整个企业的风险状况。这可以帮助企业在风险出现时实时自动识别。此外，IBM watsonx.governance 还提供自动风险评级，可为风险团队提供清晰、客观的风险级别评估。动态仪表板和图表便于快速识别、测量、监控和分析风险，而自动化警报则可在风险阈值被触发时及时采取补救措施。
借助 IBM watsonx.governance，用户可以使用各种预构建指标来评估 AI 系统的性能和有效性。这些包括用于漂移识别、模型性能及其他关键领域的指标：
这些指标（以及其他指标）为评估 AI 系统的性能和有效性提供了一个全面的框架。此外，用户可以创建自定义指标，将评估调整到特定的业务需求和风险状况，从而提供全面的评估框架。
IBM 团队的另一项创新是“Evaluation Studio”。此特性提供两个关键功能：
Evaluation Studio 帮助开发人员在数据集上评估不同版本的提示，并在直观的用户界面中比较结果。它还支持独特的自定义排名功能，用户可以通过选择指标并根据重要性分配权重来制定自定义排名方案。这可以帮助用户轻松优化将在工具或智能体中使用的提示。
watsonx.governance 评估开发平台还支持实验跟踪，这是构建更好的智能体式 AI 系统的强大工具。您可以快速设置实验，尝试（智能体的）不同变体，并用模型、检索器或提示等细节对其进行标记。通过基于延迟、成本和质量（例如忠诚度）的并排比较，可以轻松了解哪种方法最有效。重要的是，该平台可帮助您保存每次运行的确切代码，从而使开发人员无需存储每个版本的时间，而是让他们专注于构建和改进智能体。
IBM watsonx.governance 解决方案支持开箱即用、基于装饰器的循环评估器，为智能体治理树立了新标准，使客户能够评估指标并根据评估结果决定智能体的执行流程。IBM watsonx.governance 还支持通过智能体评估器进行离线智能体评估，这些评估器有助于在构建测试数据时评估 AI 智能体。主要功能包括：
这一创新工具提供了无与伦比的可见性和对性能的控制，使客户能够优化他们的工作流并获得更好的结果。
为了进一步增强 AI/ML 运营团队的能力，IBM 致力于通过一系列新功能推动创新。在即将发布的版本中，您将体验到更多智能体治理功能，例如：
治理不再是由合规性和审计所界定的障碍。它现在成为了规模化的推动力，使团队能够构建稳健、透明且可用于企业部署的生成式 AI 系统。治理是从头开始构建高效、安全和值得信赖的 AI 智能体、应用程序和模型。
随着生成式 AI 的不断发展，watsonx.governance 使团队能够以自信、透明和可控的方式快速推进工作。我们的评估方法专注于实时风险管理、自动化实验管理与追踪，以及每个阶段的透明度。watsonx.governance 在构建时充分考虑了现实世界的复杂性，可帮助团队负责任地扩展规模、降低风险并解锁生成式 AI 的全部潜力，而不会减慢您的速度。
