¿Qué es Watson Speech to Text?

El servicio Speech to Text proporciona una API para añadir funcionalidades de transcripción de voz a las aplicaciones. Combina información sobre la estructura del lenguaje con la composición de la señal de audio.

Características de Watson Speech a Text

Potente reconocimiento de voz en tiempo real

Transcribe automáticamente el audio de 7 idiomas en tiempo real. Identifique y transcriba rápidamente lo que se esté hablando, incluso desde archivos de audio de calidad inferior, en diversos formatos de audio e interfaces de programación (HTTP REST, Websocket, Asynchronous HTTP).

Motor de voz altamente preciso

Personalice el modelo para mejorar la precisión para el idioma y el contenido que más le interesen, como nombres de productos, sujetos sensibles o nombres de personas. Reconozca diferentes oradores en el audio e identifique palabras clave especificadas en tiempo real con alta precisión y seguridad.

Con soporte a varios casos de uso

Transcriba audio para varios casos de uso, que van desde la transcripción en tiempo real para el audio desde un micrófono, hasta el análisis de 1000s de grabación de audio del call center para generar analítica.

Cómo empezar con Watson Speech to Text en minutos

Cómo empezar con Watson Speech to Text