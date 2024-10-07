Hay 预测，各类企业在客户互动和运营管理方式上将迎来巨大变革。他指出，AI 驱动的通信工具普及化可能为小型企业创造前所未有的机会，与大型企业一较高下。
“我们正迈入 AI 客服中心时代，”Hay 说，“即便是小型店铺，也能提供与大型企业同等水平的客户服务。这真是令人难以置信。”
Hay 指出，关键在于开发实时 API，实现人类与 AI 之间的超低延迟交流。这使得人们能够像日常对话一样，与 AI 自然地进行来回互动。
Hay 指出，“要实现自然语言语音对话，模型延迟需保持在约 200 毫秒。我不想等三秒钟……我需要立即得到回应。”
开发人员如今可通过 OpenAI 等公司提供的 API 使用最新的语音 AI 技术。Hay 表示：“存在一个可规模化生产的开发人员 API，任何人都能调用该 API，自行构建功能，几乎不需掌握复杂的模型或开发知识。”
这一技术的潜在影响可能深远而广泛。Hay 预测，随着各类企业采纳这项技术，未来几个月到几年内，将掀起“大规模语音虚拟助理浪潮”。这可能带来更个性化的客户服务，催生新的 AI 通信产业，并推动岗位向 AI 管理方向转变。
对于消费者而言，这种体验很快可能与真人客服对话无异。Hay 指出，最近通过 Google NotebookLM 演示的 AI 生成播客，展示了该技术的显著进步。
谈及其中一场演示，他说：“如果没人告诉我这是 AI，我真的不会相信。这些声音充满情感。现在，你可以与 AI 实时对话，而且这种体验还将持续优化。”
各大科技公司正竞相强化 AI 助手的个性与功能。Meta 的策略是在其消息平台上为 AI 助手引入名人配音。用户可选择以 Awkwafina 和 Judi Dench 等明星为原型生成的 AI 声音。
然而，潜在风险也随之而来。Hay 承认，如果这项技术落入不法分子之手，可能会成为诈骗和欺诈行为的工具。
他警告道：“未来六个月，大家将见证新一代诈骗者的出现，他们的声音听起来极为真实，语调自然，充满情感，就像你听过的播客主持人一样。本质上，这些模型就是用来从人们手中骗取钱财的。”这可能让以往识别风险的信号失效，例如异常口音或机械化的语音。Hay 说：“这些特征将被彻底隐藏起来。“
他将此类情况比作《哈利·波特》小说中的情节：人物必须通过提出个人问题来验证对方身份。现实中，人们或许也需要采取类似的方法来确认身份。
Hay 若有所思地说：“我该如何确认自己真的在和银行沟通？我又怎么能确认，打电话让我给钱的女儿是真人？人类必须学会提出这些验证问题。”
尽管存在这些风险，Hay 对该技术的潜力依然持乐观态度。他指出，语音 AI 有望大幅提升无障碍沟通，使人们能够用母语与企业或政府服务互动。
他表示：“想想像福利申请之类的事务吧，对吧？你会收到各种令人困惑的文件。现在，如果你能够用母语拨打 [福利提供商] 的电话，并且能够将那些非常复杂的文件翻译成更容易理解的简明语言，那会方便得多。”
AI 语音技术仍在不断演进，Hay 认为，我们对其潜在应用才刚刚触及冰山一角。他设想未来，AI 助手将无缝嵌入可穿戴设备，例如 Meta 最近推出的 Orion 增强现实眼镜。
Hay 说：“当实时 API 嵌入我的眼镜中时，我便可在移动中进行实时对话。结合 AR，这将彻底改变游戏规则。“尽管他承认存在伦理挑战，例如近期智能眼镜能即时识别他人身份的事件，Hay 仍对这项技术的前景持乐观态度。
他承认：“伦理问题必须妥善解决，而伦理本身至关重要。但我很乐观。”
