关于 IBM Voice Gateway

IBM® Voice Gateway 支持通过电话与认知自助服务代理程序进行直接语音交互,或者能够转录呼叫者与代理程序之间的电话呼叫,以便在处理对话时能够分析代理程序的实时反馈。Voice Gateway 使用会话启动协议 (SIP) 来编排 Watson 服务并将其与公共或专用电话网络集成。

使用 IBM Voice Gateway 的方式

通过 IBM Voice Gateway,可以设置自助服务代理程序代理程序助手

您选择的实施类型将确定如何设置 Voice Gateway。在以下部分中了解关于以下每个实施的更多信息。

自助服务代理程序

利用自助服务代理程序,客户将接受指令通过 Voice Gateway 与您训练为提供特定响应的 Watson 服务进行交互。也可以选择允许 Watson 服务经由 API 发起呼叫转接来选择接入呼叫中心代理程序。

通过 Voice Gateway 转到客户呼叫,其用于编排 Watson 服务。如果已配置,那么呼叫将转到代理人。

在后端,自助服务由以下组件组成,每个组件都扮演不同的角色:

Watson 服务编排

下图显示了 Voice Gateway 如何编排各种 Watson 服务来启用自助服务代理程序。在几秒钟之内,发声在这些服务之间流动以产生与呼叫者的自然音对话。

Voice Gateway 充当呼叫者和每个 Watson 服务通信的中心。
  1. 呼叫者提出请求。
  2. 请求将被传送到 Speech to Text 服务。
  3. 返回文本话语。
  4. 文本将以消息请求的形式发送到 Watson Assistant 或 Virtual Agent。
  5. 返回消息响应。
  6. 响应文本将发送到 Text to Speech 服务。
  7. 返回合成音频。
  8. Voice Gateway 将音频响应传送到呼叫者。

通过服务编排引擎的对话流程

对于自助服务代理程序,可以有选择地将服务编排引擎 (SOE) 包含到您的环境,从而使您能够将自己的定制层添加到 Voice Gateway 和 Watson Assistant 服务之间的通信。Voice Gateway 和 Watson Assistant 通过 Watson Assistant REST API 进行通信,仅使用 MessageRequest 方法来发送请求数据,并接收对应的 JSON 响应。服务编排引擎充当 Watson Assistant 的代理,使用第三方 API 来拦截消息请求和响应并进行修改。

Voice Gateway 和 Watson Assistant 之间的消息请求和响应流经服务编排引擎,后者进行修改。

对于 Voice Gateway 的生产部署,出于以下原因,可能想要合并服务编排引擎:

要了解有关如何实施服务编排引擎的更多信息,请参阅通过服务编排引擎进行连接

自助服务代理程序的功能

代理程序助手

通过 Voice Gateway,可使用 SIPREC 协议实时转录来自活动电话呼叫的呼叫者和被呼叫者(例如联系中心代理)音频。该功能需要能够将媒体派生到 Voice Gateway(它充当 SIPREC 会话录制服务器 (SRS))的会话边界控制器 (SBC)。

对于代理程序助手,Voice Gateway 将呼叫派生到 Watson 服务,它可转录对话来向代理人提供反馈。

代理程序助手的功能

体系结构

IBM Voice Gateway 是自助服务代理程序和代理程序助手的整体体系结构中的多个组件之一。所使用的体系结构和技术根据实施的不同而有所不同。对于自助服务代理程序,呼叫者可通过 SIP 干线直接连接到 Voice Gateway,或者可通过会话边界控制器 (SBC) 间接连接到 Voice Gateway。

Voice Gateway 体系结构

Voice Gateway 由两个单独的微服务 SIP OrchestratorMedia Relay 组成。这些微服务以两个单独的 Docker 映像的形式交付。

下图在高级别显示了这两个微服务如何组合起来提供 IBM Voice Gateway 的完整功能:

Voice Gateway、SIP Orchestrator 和 Media Relay 中的单独微服务使用 API 进行通信。

使用 MRCP 服务器连接到服务

除使用 IBM® Speech to Text、IBM® Text to Speech 或 IBM® Voice Gateway Speech to Text Adapter 以外,Voice Gateway 还支持媒体资源控制协议 V2 (MRCPv2) 连接。您可以混用由 Voice Gateway 协调的第三方语音识别和语音合成服务。请参阅使用 MRCPv2 配置服务

使用 SIP 干线时的自助服务代理程序体系结构

通过 SIP 干线连接到自助服务代理程序时,必须将 SIP 干线配置为基于其 IP 地址和 SIP 端口将 INVITE 请求转发至 Voice Gateway。

呼叫通过 SIP 干线流入 Voice Gateway,其通过 API 与 Watson 服务通信。

SIP 干线可用于通过从公用电话网络呼叫 Watson 服务来快速地设置和测试 Voice Gateway。在此情况下,只要将 Voice Gateway 部署到公共云 Docker 容器服务(例如 IBM® Cloud Kubernetes Service)即可。本地企业集成通常需要您配置会话边界控制器 (SBC),这将在下一个部分中进行讨论。

使用 SBC 时的自助服务代理程序体系结构

会话边界控制器通常用于您希望能够将客户转接到实时联系中心代理的情况。在通信通过会话边界控制器 (SBC) 流动的自助服务代理程序中,需要将 SBC 配置为基于其 IP 地址和 SIP 端口将呼叫转发至 Voice Gateway。请注意,要启用呼叫转接,SBC 必须仍留在呼叫路径中,以便它可处理 SIP REFER 消息:

呼叫流转至 SBC 然后流转至 Voice Gateway,其通过 API 与 Watson 服务通信。

通过 MCU 举行呼叫会议时的代理程序助手体系结构

对于代理程序助手,必须与 Voice Gateway 共享来自客户和代理人之间的呼叫的媒体,以便其可以转录呼叫。将呼叫媒体路由至 Voice Gateway 的一种方法是通过会议将其转换为现行呼叫。通常,此会议需要多点控制单元 (MCU) 或可以充当 MCU 的呼叫中的参与者。Voice Gateway 发送呼叫音频进行语音转文字处理,然后将返回的转录发送到已配置的报告 REST 服务器。

呼叫通过多点控制单元与代理程序和 Voice Gateway 举行会议。Voice Gateway 侦听呼叫,发送呼叫音频进行语音转文字处理,然后将返回的转录发送到 REST 服务器或其他分析网关。

通过 SBC 派生呼叫时的代理程序助手体系结构

代理程序助手的另一个选项是将呼叫从会话边界控制器 (SBC) 派生至充当 SIPREC 会话录制服务器 (SRS) 的 Voice Gateway。Voice Gateway 发送呼叫音频进行语音转文字处理,然后将返回的转录发送到 REST 服务器或支持 REST API 的分析网关。

呼叫转至 SBC,后者在 Voice Gateway 将呼叫转至代理人时向其派生呼叫。Voice Gateway 发送呼叫音频进行语音转文字处理,然后将返回的转录发送到 REST 服务器或其他分析网关。

受支持的语言

Voice Gateway 面向 Watson 语音服务支持以下语言:

IBM® Voice Gateway Speech to Text Adapter 和 IBM® Voice Gateway Text to Speech Adapter 使您能够通过 Google Cloud Speech API 和 Google Cloud Text-to-Speech API 对自助服务代理程序使用其他语言。有关更多信息,请参阅集成第三方语音服务。通过使用语音转文字适配器和文字转语音适配器,可以将 Voice Gateway 部署扩展为支持各种语言,包括如下语言:

要使某种语言受支持,与 Voice Gateway 集成的所有服务都必须支持该语言,包括第三方语音服务和 IBM Watson™ Assistant 服务。有关更多信息,请参阅 Watson Assistant 服务支持的语言。要支持其他语言,可以创建定制语音适配器,可以使用这些适配器将第三方语音识别(语音转文字)与语音合成(文字转语音)服务集成。 语音适配器样本可以帮助开始创建语音适配器。

注意:IBM Voice Gateway 不向任何外部服务提供许可证,包括 Watson 服务或第三方语音服务。

受支持的协议

系统需求

要在生产环境中部署 Voice Gateway,需要以下最低软件和硬件级别。

表 1. 受支持平台和操作系统
平台 操作系统
Linux® 64 位 Red Hat Enterprise Linux (RHEL) 7.3、7.4 和 7.5
Ubuntu 16.04 LTS

由于 IBM Voice Gateway 作为一组 Docker 映像进行分发,因此您也可以在支持 Docker 和 Kubernetes 的其他平台上部署 Voice Gateway。例如,可以使用 Docker for Windows 和 Docker Machine 在 64 位 Windows 环境上部署 Voice Gateway。

表 2. 部署环境需求
环境 最低版本
Docker Community Edition 或 Enterprise Edition V1.13 或更高版本
注:不支持 Swarm 方式
Kubernetes V1.7.3 或更高版本
IBM Cloud Private V2.1.0 或更高版本
IBM Cloud Kubernetes Service 不适用 - 基于云的服务
表 3. 虚拟化硬件需求
硬件 最低需求
虚拟机 RAM 8 千兆字节 (GB)
虚拟 CPU (vCPU) 具有 x86-64 体系结构的 2 个 vCPU,时钟速度为 2.4 GHz
注意:根据并发呼叫的预期数量及其他因素而异
存储器 50 千兆字节 (GB)
注意:呼叫录制和日志存储设置会显著影响存储需求

达到您要求的性能级别需要的确切虚拟化硬件根据多种因素而差异巨大,包括预期的并发呼叫数量、产品配置和 Watson Assistant 对话。如果需要帮助规划 Voice Gateway 环境,请与产品团队联系,如获取帮助中所述。