交互式演示

高级语音识别和格式

一切入门所需的信息,以及持续改进的功能。

预训练的语音模型

使用针对客户服务领域调整的语音模型激活语音应用。

模型训练选项

通过语言和声学训练选项提高用例的语音识别准确性。

微调功能

提高提取短语、单词、字母、数字或列表的语音识别准确性。

低延迟转录

使用我们针对实时语音应用的低延迟而优化的模型。

转录前的录音诊断

在转录开始前分析和纠正弱音频信号。

最终结果前的临时转录

在生成语音转录时和最终的确定过程中使用语音转录来缩短应用响应时间。

智能格式

将日期、时间、数字、币值、电子邮件和网站地址转换为常规形式,在最终的转录结果中展示。

声纹识别

在多参与者的语音交流中识别说话人和说话内容。 目前针对双向呼叫中心对话进行优化,并且可检测到多达 6 个不同的说话人。

单词识别和过滤

使用我们的关键字识别和侮辱性语言过滤功能筛选特定字词或不当内容。(仅限美式英语)

立即开始使用 Watson Speech to Text