什么是 Watson Speech to Text?

Speech to Text 服务提供了一个 API,用于将语言转录功能添加到应用。它将有关语言结构的信息与音频信号的合成相结合。

Watson Speech to Text 功能

强大的实时语音识别

自动且实时转录 7 种语言的音频。跨各种音频格式和编程接口(HTTP REST、Websocket 和 Asynchronous HTTP)快速识别和转录正在讨论的内容,即便内容来自音质较差的音频也可以转录。

高精度语音引擎

定制模型,以提高您最关注的语言和内容的准确性,例如产品名称、敏感主题或个人名称。识别音频中的不同发言者,并极为准确、可靠地实时发现指定的关键字。

设计为支持各种用例

针对各种用例转录音频,从麦克风音频实时转录,到分析呼叫中心的 1000 条音频记录,以提供有意义的分析。

几分钟内即可快速上手 Watson Speech to Text

Watson Speech to Text 入门

请即刻通过右侧任意方式, 让 IBM 专家为您答疑解惑