集成第三方语音和文字服务
IBM® Voice Gateway 支持使用语音适配器来集成第三方语音识别(语音转文字)和语音合成(文字转语音)服务,从而替换 IBM® Speech to Text 和 IBM® Text to Speech 服务。适配器是与 Voice Gateway 一起部署的单独 Docker 容器,并且充当介于 Voice Gateway 和第三方语音服务之间的代理。
Voice Gateway 提供以下选项以用于集成第三方语音服务:
-
Voice Gateway Speech to Text Adapter:Speech to Text adapter 当前支持使用 Google Cloud Speech API 进行语音识别。使用 Google Cloud Speech API 将支持使用法语、德语和意大利语作为自助服务代理程序的附加语言。V1.0.0.5 和更高版本。
-
Voice Gateway Text to Speech Adapter:Text to Speech Adapter 当前支持 Google Text to Speech API 从文本将语音合成为音频。通过使用 Google Text to Speech API,可以为自助服务代理程序选择其他语音。V1.0.0.7a 和更高版本。
- 媒体资源控制协议 V2 (MRCPv2):可以使用 Voice Gateway 作为 MRCPv2 客户机来与充当 MRCPv2 服务器(如 Nuance)的语音转文字和文字转语音服务进行连接。V1.0.0.7 和更高版本。请参阅使用 MRCPv2 配置服务。
- 定制语音适配器:要使用其他语音识别或语音合成服务,可以创建自己的语音适配器。首先,请使用语音适配器样本。V1.0.0.5 和更高版本。