O que é Watson Speech to Text?

O serviço Speech to Text oferece uma API para incluir recursos de transcrição de fala em aplicativos. Ele combina informações sobre a estrutura de linguagem com a composição do sinal de áudio.

Recursos do Watson Speech to Text

Eficiente reconhecimento de voz em tempo real

Transcreva automaticamente o áudio de 7 idiomas em tempo real. Identifique e transcreva rapidamente o que está sendo falado, mesmo a partir de um áudio de qualidade inferior, em uma variedade de formatos de áudio e interfaces de programação (HTTP REST, Websocket, HTTP Assíncrono).

Mecanismo de fala altamente preciso

Customize seu modelo para melhorar a precisão para o idioma e conteúdo de maior interesse, como nomes de produtos, assuntos confidenciais ou nomes de pessoas. Reconheça falantes diferentes em seu áudio e marque palavras-chave especificadas em tempo real com alta precisão e confiança.

Construído para suportar vários casos de uso

Transcreva áudio para vários casos de uso, de transcrição em tempo real para áudio de um microfone à análise de 1000 s de gravação de áudio de sua central de atendimento para oferecer análise significativa.

Comece a usar o Watson Speech to Text em minutos

Comece a usar o Watson Speech to Text