集成第三方语音服务
IBM® Voice Gateway 支持使用语音适配器来集成第三方语音识别(语音转文字)和语音合成(文字转语音)服务,从而替换 IBM® Speech to Text 和 IBM® Text to Speech 服务。适配器是与 Voice Gateway 一起部署的单独 Docker 容器,并且充当介于 Voice Gateway 和第三方语音服务之间的代理。
Voice Gateway 提供以下选项以用于集成第三方语音服务:
-
Voice Gateway Speech to Text Adapter:此适配器目前支持使用 Google Cloud Speech API 进行语音识别。使用 Google Cloud Speech API 将支持使用法语、德语和意大利语作为自助服务代理程序的附加语言。V1.0.0.5 和更高版本。
-
定制语音适配器:要使用其他语音识别或语音合成服务,可以创建自己的语音适配器。首先,请使用语音适配器样本。V1.0.0.5 和更高版本。
Speech to Text Adapter
部署 Speech to Text Adapter
Voice Gateway Speech to Text Adapter 作为单独 Docker 映像来封装,您可以将其与核心的 SIP Orchestrator 和 Media Relay 映像一起配置和部署。部署 Speech to Text Adapter 之前,请部署基本 Voice Gateway 实例,如 Voice Gateway 入门中所述。然后,在以下页面中详细了解如何将 Speech to Text Adapter 添加到部署中:
- 在 Docker 上部署 Speech to Text Adapter
- 将 Speech to Text Adapter 部署到 IBM Cloud Kubernetes Service 中的 Kubernetes
配置 Speech to Text Adapter
要设置 Speech to Text Adapter,可以定义下列类型的配置。
- 部署配置,用于定义 Speech to Text Adapter 容器并被指定为 Docker 环境变量。有关更多信息,请参阅 Speech to Text Adapter 环境变量。
- JSON 配置,可指定以在单个 Voice Gateway 环境中单独配置多个租户。有关更多信息,请参阅设置多租户环境。
- 动态配置,使您能够通过在 Watson Assistant 对话节点响应中指定 API 操作和状态变量,以便能够呼叫期间更改设置。有关更多信息,请参阅使用 Voice Gateway API 对自助服务代理程序进行编程。
在以下页面中详细了解与配置 Speech to Text Adapter 相关的主题: