Qu'est-ce que Watson Speech to Text ?

Le service Speech to Text fournit une API permettant d'ajouter des fonctions de transcription vocale aux applications. Il combine des informations sur la structure des langues avec la composition du signal audio.

Fonctions Watson Speech to Text

Reconnaissance vocale performante en temps réel

Transcrivez automatiquement l'audio à partir de 7 langues en temps réel. Identifiez et transcrivez rapidement ce qui est prononcé, même à partir d'un fichier audio de mauvaise qualité, sur différents formats audio et interfaces de programmation (HTTP REST, Websocket, HTTP asynchrone).

Synthétiseur vocal très précis

Personnalisez votre modèle pour améliorer la précision de la langue et du contenu qui vous importent le plus, tels que les noms de produits, les sujets sensibles ou les noms de personnes. Reconnaissez les différents locuteurs dans votre fichier audio et repérez les mots-clés spécifiés en temps réel avec une grande précision et en toute confiance.

Conçu pour prendre en charge différents cas d'utilisation

Transcrivez l'audio pour différents cas d'utilisation allant de la transcription en temps réel pour l'audio à partir d'un microphone, à l'analyse de milliers d'enregistrements audio de votre centre d'appels pour fournir des analyses significatives.

Initiez-vous à Watson Speech to Text en quelques minutes

Initiation à Watson Speech to Text