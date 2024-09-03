早在 2023 年春季——在人工智能 (AI) 领域这算是相当长的时间了——高盛发布报告估计，生成式 AI 的出现可能使全球 GDP 每年增长 7%，相当于每年额外增加超过 7 万亿美元。
生成式 AI 如何实现这一目标？该技术的应用场景众多，但总体上可描述为提升人机交互效率。这种改进将推动低层级任务自动化与人类能力增强，使工作者能以更高熟练度完成更多任务。
鉴于生成式 AI 应用范围的广泛性与技术复杂性，许多媒体报道可能使读者误以为这是种近乎神奇的万能解决方案。确实，这种观点主导了 2022 年 ChatGPT 等工具推动技术主流化时对生成式 AI 的大多数报道，部分分析师当时预测我们正处于将重塑未来工作形态的革命前沿。
然而不到两年，媒体对生成式 AI 的热情已有所降温。六月间，高盛发布了一份措辞更审慎的报告 ，质疑生成式 AI 的效益是否能证明万亿级开发投资的合理性。金融时报》等媒体也发表了持类似怀疑立场的评论文章。IBM Think 时事通讯团队曾在早期文章中总结并回应了部分此类不确定性。
随后的股市波动致使多位分析师宣称“AI 泡沫”即将破裂，可能引发堪比 90 年代互联网泡沫破灭规模的市场修正。
媒体对生成式 AI 的质疑大致可归结为开发者面临的四大突出危机：
这些是严峻的障碍，但许多人士仍乐观认为，解决最后一个问题（用例）将有助于化解另外三个危机。好消息是，他们已经在识别并开发有实际意义的用例。
IBM 杰出工程师 Chris Hay 表示：“生成式 AI 正在对我们自身和客户产生显著且可衡量的影响，从根本上改变我们的工作方式。”“这涵盖了从人力资源流程转型、通过品牌内容实现营销变革，到联络中心或软件开发等所有行业和领域。”Hay 认为我们正处于狂热期之后的修正阶段，近期媒体的悲观态度或许可被视为对早期言论的平衡——那些言论事后看来犹如炒作。
“我可不想成为那位分析师，”Hay 提到近期某个对 AI 未来极度悲观的预测时说道，“我可不想成为那种断言 'AI 在未来 10 年内不会产生任何实际用处'的人，因为你余生都会被人引用这句话。”
这类论断最终可能被证明与那些认为早期互联网成不了气候的断言一样短视，或如同 IBM 创始人 Thomas Watson 在 1943 年预测世界只需要 5 台计算机那般局限。Hay 认为部分问题在于媒体经常将生成式 AI 与基于 LLM 的聊天机器人（如 ChatGPT）的狭义应用混为一谈，而这些应用确实未必能解决企业面临的所有问题。
Hay 相信，若开始遭遇供应瓶颈——无论是数据、算力还是能源——工程师们将会发挥创造力来突破这些障碍。
“当某种资源充裕时，人们会肆意消耗，”Hay 指出，“如果你手头有数十万块 GPU，你自然会投入使用。但当你面临资源约束时，反而会激发更多创造力。”
以合成数据为例，这正是应对数据危机的一条可行路径。这种通过算法模拟真实数据特征生成的数据，既可替代也可补充现实数据。虽然机器学习工程师需谨慎避免过度使用合成数据，但短期内采用混合策略有望缓解现实数据匮乏的困境。例如，近期 Microsoft 发布的 PHI-3.5 模型和 Hugging Face 的 SMOL 模型都采用大量合成数据进行训练，最终形成了高性能的小型模型。
当当今的 LLM 耗电量巨大，但并无充分理由认为当前的变换器就是最终架构。基于状态空间模型 (SSM) 的模型（例如 Mistral Codestral Mamba、Jamba 1.5 或 Falcon Mamba 1.5）因其增强的上下文长度能力正日益受到欢迎。采用多种模型类型的混合架构也日益受到关注。除架构创新外，工程师们还在量化技术、专为推理设计的芯片以及微调（一种使预训练模型适配特定用例的深度学习技术）等其他方法中发掘价值。
“我希望能看到行业内形成更活跃的微调社群，而非仅仅关注预训练，”Hay 表示，“预训练是整个过程成本最高的环节。微调则经济得多，且可能带来更显著的价值回报。”
Hay 指出，未来我们可能会拥有超出当前需求的 GPU 资源，因为我们的技术效率将大幅提升。他最近尝试将一台个人笔记本电脑改造成能够训练模型的机器。通过重建更高效的数据流水线和调试批处理技术，他正在探索在资源限制下开展工作的方法。虽然这些操作本可在昂贵的 H100 Tensor Core GPU 上完成，但正是资源受限的思维模式促使他找到了更高效达成目标的方法。需求始终是创新之母。
模型正朝着更小巧、更强大的方向发展。
“观察当今的较小模型，它们使用的训练令牌量已超过去年的大型模型，”Hay 强调，“人们正在将更多令牌压缩到更小的模型中，这些模型因而变得更高效率、更快速。”
“当我们思考 AI 在解决实际商业问题中的应用时，我们发现这些专业模型正变得愈发重要，”IBM 全球技术、数据与人工智能战略负责人 Brent Smolinski 表示。这类模型包括所谓的小型语言模型和非生成式模型（例如预测模型），它们所需的数据集更为精简。在此背景下，数据质量往往比数量更为关键。此外，这些专业模型能耗更低且更易于管控。
“许多研究正致力于开发计算效率更高的算法，”Smolinski 补充道。高效模型能同时应对前述四大危机：它们消耗更少的数据、能源和算力，同时更快的运行速度催生了新的用例。
“LLM 的优势在于其具备自然对话交互界面，且输入数据越多，对话体验越自然，”Smolinski 指出。“但在狭窄专业领域或特定问题场景中，这些 LLM 容易产生幻觉，这确实是个严峻问题。因此我们的客户往往倾向于选择小型语言模型——即使交互界面未达到完美自然也无妨，因为针对特定问题场景本就不需苛求完美。”
生成式 AI 或许不是万能解决方案，但确实是工具库中的利器。以智能工作流为例，这种多步骤方法通过使用 LLM 和 AI 智能体来执行任务。这些智能体具备一定程度的自主决策能力，可与数据、系统乃至人类进行交互以完成指定任务。专业智能体可被设计用于处理特定任务或专业领域，提供 LLM 可能缺乏的深度知识与经验。这类智能体既能调用更专业的数据，也可整合领域特定算法与模型。
设想一家电信公司，其中由 LLM 编排的智能工作流能高效处理客户支持咨询。当客户提交请求时，LLM 会处理该查询，对问题进行分类，并触发特定智能体处理各项任务。例如，一个智能体负责检索客户账户详情并核验所提供信息，而另一个智能体则负责诊断问题，如运行网络检查或分析账单差异。
当问题被发现后，第三个智能体会制定解决方案，无论是重置设备、提供退款还是安排技术人员上门。随后 LLM 协助通信智能体生成给客户的个性化回复，帮助确保信息清晰且符合公司品牌语调。问题解决后，会启动反馈循环，由智能体收集客户反馈以确定满意度。若客户不满意，LLM 将审核反馈并可能触发其他后续行动，例如安排人工客服致电。
LLM 虽然功能多样，但在需要深厚领域专业知识或专门知识的任务上可能表现不佳，尤其当这些任务超出其训练数据范围时。它们响应速度较慢，也不适合在动态环境中做出实时决策。相比之下，智能体可通过更简单的决策算法实现自主、主动的实时操作。
与庞大单一的 LLM 不同，智能体可被设计成能从环境中学习并适应环境。它们能运用强化学习或反馈循环来持续提升性能，根据既往任务的成功与否调整策略。智能体工作流本身会生成新数据，这些数据又可被用于进一步训练。
该场景凸显了 LLM 作为解决商业问题的有用组成部分，但并非完整解决方案。这实际上是个好消息，因为 LLM 往往是价值链中成本最高的环节。
Smolinski 指出人们面对新技术时常走向极端。我们可能认为一项新技术将改变世界，当它未能实现这一转变时，又可能变得过度悲观。
“我认为真相往往处于两个极端之间，”他阐述道，并强调 AI 需要作为解决商业问题的更广泛战略组成部分。“通常从来不是单独依靠 AI，即使真是如此，也往往需要同时运用多种类型的 AI 模型来解决问题。但必须从问题本身出发。如果存在能对决策能力产生实质性影响的人工智能应用——这种影响进而会带来重大财务效益——就应聚焦这些领域，进而规划如何应用恰当的技术与人工智能组合。要充分利用整个工具生态，不仅限于 LLM，而应涵盖所有可用工具的完整光谱。”
对于所谓的“用例危机”，Hay 确信将会出现更多能证明这些模型成本合理性的令人信服的用例。
“若等到技术完美无缺、一切标准化后才进入市场，这种策略极易被颠覆，”他直言不讳。“我认为不应该冒这样的风险。”