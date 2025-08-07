人工智能

六大战略转变：采用小型、快速、开放模型构建 agentic AI

两位同事在办公室里，坐在笔记本电脑前交谈

作者

Laura Langendorf

Laura Langendorf

Rogerio Gonçalves

AI/ML Ops Brand Content Strategist

传统的企业软件开发规则，比如六到十二个月的路线图、庞大的前期基础设施和单体式发布，已经跟不上新一代人工智能驱动的世界的步伐了。是时候摒弃旧规则、革新开发方法并重新思考应用程序构建方式了。请遵循以下六大原则：

1. 构建符合业务需求的模型，以更快实现投资回报

让我们从任何应用程序的核心开始，即应用程序背后的模型。但是，并非每个 AI 问题都需要具有数千亿参数的模型。在特定任务上，针对领域进行调整的小型模型通常可与通用大型模型相媲美甚至更胜一筹，它们能够以极低的成本提供同等水平的精度，并加快推理速度。通过聚焦文本摘要与分析、代码生成、文档质量保证或其他范围明确的问题，开发团队可以：

  • 降低每次查询的推理成本，使模型对大型代理机群而言更经济可行
  • 将延迟缩短至亚秒级响应，这对于交互式工作流和人机回圈流程来说至为关键
  • 在混合或边缘环境中部署，可避免云出口费用，同时保障数据主权与合规性

选择正确的模型并不是要追求最大的参数规模，而是要从一开始就评估每次使用成本、价值实现延迟以及与任务指标的适配度。

2. 确保平台敏捷且生态系统开放

生成式 AI 的成功不仅仅取决于模型的选择。需要为任务选择合适的模型，并围绕任务构建相应的工具、平台和开发实践，才能将 AI 转化为真正的业务成果。开发人员及其管理人员应推动对以下方面的投资：

  • 开源 AI 模型：避免锁定，促进建设充满活力的开发者社区
  • 微工厂架构：由小型团队负责组装和管理针对每个核心用例构建的专用模型包、模板和最佳实践
  • 模块化管道：将轻量级模型和业务规则串联为微服务，从而实现快速迭代、持续整合和无缝回滚

这种模块化、开放式方法可将试点计划缩短到数周而不是数月，使团队能够在几分钟内创建新代理，并在整个企业范围内充分释放生成式 AI 的变革潜力。

3. 从一开始就嵌入负责任的 AI

要打造真正负责任的 AI，不能事后才考虑，而是要融入到开发的每个阶段。构建这些应用程序意味着，开发人员需要持续关注以下几点：

  1. 模型选择与训练透明度：选择的模型应在开放、可审计的数据集上训练，而且符合企业价值观和监管要求。
  2. 数据工程严谨性：跟踪数据沿袭、记录数据转换，并维护从原始数据到模型输出的清晰、可解释的管道。
  3. 人机回圈治理：嵌入审查检查点和性能阈值，通过触发警报或升级，促进合规和质量保障。

通过在源头实现治理标准化，开发团队可减少偏见、保护隐私并建立信任，从而为可持续、可扩展的生成式 AI 部署奠定基础。

4. 通过整个生命周期实现 agentic AI 运营

在打好基础后，包括建立快速高效、适合业务的模型、模块化管道以及负责任的开发实践，下一个合乎逻辑的步骤就是通过智能体来实现 AI 运营化。这项举措很可能成为贵组织内部积极讨论的话题，也是理论转化为切实影响的关键所在。

AI 智能体是半自主的“工作人员”，能够审核输入、推理任务并采取行动，而且通常与人类和其他智能体合作。将这些智能体集成到企业工作流中，可以显著提高生产力。

以下是生命周期的各个阶段：

  1. 设计：明确定义智能体的职责（例如，“代码提取器”、“测试生成器”、“合规分析器”）。
  2. 构建：为专业化的精简模型构建管道，并为每个阶段编写业务规则。
  3. 部署：在中央平台上编排智能体，并配置监控、可追溯性和服务级别协议功能。
  4. 运营与优化：收集反馈循环，重新培训或重新配置智能体，并持续衡量投资回报率（ROI）。

5. 将智能体与合适的模型相结合，实现价值最大化

让智能体大规模发挥作用的关键在于如何有效地将它们与为企业构建的快速模型相结合，从而使智能体的生命周期不仅成为可能，而且富有成效。这种方法需要精心设计、编排和衡量，以确保技术组件与业务成果保持一致。以下是让这种整合发挥作用的方法：

  • 选择合适的模型：通过关键任务（例如，代码转文本、SQL 生成、实体提取）对小型模型进行基准测试，并比较延迟和每 1,000 个令牌的成本。
  • 构建工厂和编排：将相关智能体分组到专用工厂，以支持核心用例（例如银行大型机、保险引擎）。
  • 治理和监控：提供中央用户界面/API 以进行智能体访问，并跟踪性能指标（延迟、错误）、版本控制（智能体 ID）和“人机回圈”检查点。
  • 衡量价值：定义明确的关键绩效指标（KPI），例如节省的开发时间、代码质量改进和成本降低，并使用仪表板监控现代化改造所需时间和技术债务偿还情况。

6. 扩展快速的小型模型，提升企业影响力

当一个快速且紧凑的模型的成本只占大型语言模型的一小部分时，增加额外的智能体就成为一项边际支出。这种扩散型经济模式意味着：

  • 快速扩展：可以同时运行数十甚至数百个专用智能体，而不会超出预算。
  • 影响范围控制：轻量级容器和故障隔离式部署可确保单个智能体故障不会引发系统范围内的故障。
  • 持续优化：成本感知监控仪表板可跟踪 CPU/GPU 使用情况、每个智能体的推理使用情况和性能关键绩效指标 (KPI)，从而不断推动改进。

利用这种规模优势，公司可以更快地从概念验证扩展到企业级生产。这一举措可充分解锁生成式 AI 的生产力优势，包括降低成本、加快上市时间、提高质量、促进决策以及提升团队效率。

从战略转变到可持续转型

践行这六条原则不仅仅是为了构建更好的 AI，更是为了重塑创新产生方式以及智能技术在企业内部的定位。

企业从实验阶段步入转型阶段。开发周期从数月缩短至数周。AI 智能体从充满潜力的原型发展为对业务运营至关重要的力量。创新变得可预测，不再是偶然的幸运事件，而是植根于每一次产品迭代和业务决策中的可重复过程。

企业 AI 将通过以下方式引领未来发展方向：

  • 可组合架构：敏捷、可重复使用的组件，让团队能够快速部署和迭代，而无需处理重复多余的工作。
  • 成本感知编排：AI 系统能够自我监控效率，并针对性能、预算和合规性进行动态优化。
  • 混合智能：以治理、透明和信任为核心，实现人类与 AI 智能体之间的无缝协作。
  • 规模化部署针对行业进行调整的模型：组织不再采用一刀切的大型语言模型，而是部署针对其确切需求进行微调的一系列领域专用模型。

企业 AI 正在从“登月计划”式的集中性宏大实验迈向分散式的日常应用，不再依赖单一的庞大模型，而是让多个大小合适的模型嵌入到各个职能部门中。要想获得成功，组织不仅要构建更智能的模型，还要构建更智能的系统、团队和战略。

通过这六大战略转变，组织不仅可以实现开发堆栈的现代化转型，还可以为未来的业务发展做好准备。
相关解决方案
IBM AI 智能体开发

借助 IBM watsonx.ai 开发平台，让开发人员能够构建、部署和监控 AI 代理。

 深入了解 watsonx.ai
IBM AI 智能体和助手

借助在业界首屈一指的全面功能，帮助企业构建、定制和管理 AI 智能体和助手，从而在提高生产力方面取得突破性进展。

 深入了解 AI 智能体
IBM Granite

借助专为提高开发人员效率而设计的 Granite 小型开放式模型，可实现 90% 以上的成本节约。这些企业就绪型模型可根据安全基准提供卓越的性能，且适用于多种企业任务，包括网络安全、RAG 等。

 深入了解 Granite
采取后续步骤

借助在业界首屈一指的全面功能，帮助企业构建、定制和管理 AI 智能体和助手，从而实现复杂工作流自动化并在提高生产力方面取得突破性进展。

 深入了解 watsonx.ai 智能体开发 探索 watsonx Orchestrate