语音 AI 爆发：会说话的技术如何改变商业

几位电台评论员正在进行节目播报

语音 AI 技术发展迅速，有望从客户服务到内部沟通全面重塑企业运营方式。

过去几周，OpenAI 推出了新工具，简化 AI 语音助手的创建，并将其高级语音模式扩展至更多付费用户。Microsoft 更新了 Copilot AI，提升了语音能力与推理功能，而 Meta 则将语音 AI 引入其消息应用程序

IBM 杰出工程师 Chris Hay 表示，这些进展“可能会彻底改变企业与客户的沟通方式”。

用于客户服务的 AI 语音

Hay 预测，各类企业在客户互动和运营管理方式上将迎来巨大变革。他指出，AI 驱动的通信工具普及化可能为小型企业创造前所未有的机会，与大型企业一较高下。

“我们正迈入 AI 客服中心时代，”Hay 说，“即便是小型店铺，也能提供与大型企业同等水平的客户服务。这真是令人难以置信。”

Hay 指出，关键在于开发实时 API，实现人类与 AI 之间的超低延迟交流。这使得人们能够像日常对话一样，与 AI 自然地进行来回互动。

Hay 指出，“要实现自然语言语音对话，模型延迟需保持在约 200 毫秒。我不想等三秒钟……我需要立即得到回应。”

开发人员如今可通过 OpenAI 等公司提供的 API 使用最新的语音 AI 技术。Hay 表示：“存在一个可规模化生产的开发人员 API，任何人都能调用该 API，自行构建功能，几乎不需掌握复杂的模型或开发知识。”

这一技术的潜在影响可能深远而广泛。Hay 预测，随着各类企业采纳这项技术，未来几个月到几年内，将掀起“大规模语音虚拟助理浪潮”。这可能带来更个性化的客户服务，催生新的 AI 通信产业，并推动岗位向 AI 管理方向转变。

对于消费者而言，这种体验很快可能与真人客服对话无异。Hay 指出，最近通过 Google NotebookLM 演示的 AI 生成播客，展示了该技术的显著进步。

谈及其中一场演示，他说：“如果没人告诉我这是 AI，我真的不会相信。这些声音充满情感。现在，你可以与 AI 实时对话，而且这种体验还将持续优化。”

AI 声音变得个性化。

各大科技公司正竞相强化 AI 助手的个性与功能。Meta 的策略是在其消息平台上为 AI 助手引入名人配音。用户可选择以 Awkwafina 和 Judi Dench 等明星为原型生成的 AI 声音。

然而，潜在风险也随之而来。Hay 承认，如果这项技术落入不法分子之手，可能会成为诈骗和欺诈行为的工具。

他警告道：“未来六个月，大家将见证新一代诈骗者的出现，他们的声音听起来极为真实，语调自然，充满情感，就像你听过的播客主持人一样。本质上，这些模型就是用来从人们手中骗取钱财的。”这可能让以往识别风险的信号失效，例如异常口音或机械化的语音。Hay 说：“这些特征将被彻底隐藏起来。“

他将此类情况比作《哈利·波特》小说中的情节：人物必须通过提出个人问题来验证对方身份。现实中，人们或许也需要采取类似的方法来确认身份。

Hay 若有所思地说：“我该如何确认自己真的在和银行沟通？我又怎么能确认，打电话让我给钱的女儿是真人？人类必须学会提出这些验证问题。”

尽管存在这些风险，Hay 对该技术的潜力依然持乐观态度。他指出，语音 AI 有望大幅提升无障碍沟通，使人们能够用母语与企业或政府服务互动。

他表示：“想想像福利申请之类的事务吧，对吧？你会收到各种令人困惑的文件。现在，如果你能够用母语拨打 [福利提供商] 的电话，并且能够将那些非常复杂的文件翻译成更容易理解的简明语言，那会方便得多。”

AI 语音技术仍在不断演进，Hay 认为，我们对其潜在应用才刚刚触及冰山一角。他设想未来，AI 助手将无缝嵌入可穿戴设备，例如 Meta 最近推出的 Orion 增强现实眼镜。

Hay 说：“当实时 API 嵌入我的眼镜中时，我便可在移动中进行实时对话。结合 AR，这将彻底改变游戏规则。“尽管他承认存在伦理挑战，例如近期智能眼镜能即时识别他人身份的事件，Hay 仍对这项技术的前景持乐观态度。

他承认：“伦理问题必须妥善解决，而伦理本身至关重要。但我很乐观。”

 

