Qu'est-ce que Watson Speech to Text ?
Le service Speech to Text fournit une API permettant d'ajouter des fonctions de transcription vocale aux applications. Il combine des informations sur la structure des langues avec la composition du signal audio.
Fonctions Watson Speech to Text
Reconnaissance vocale performante en temps réel
Transcrivez automatiquement l'audio à partir de 7 langues en temps réel. Identifiez et transcrivez rapidement ce qui est prononcé, même à partir d'un fichier audio de mauvaise qualité, sur différents formats audio et interfaces de programmation (HTTP REST, Websocket, HTTP asynchrone).
Synthétiseur vocal très précis
Personnalisez votre modèle pour améliorer la précision de la langue et du contenu qui vous importent le plus, tels que les noms de produits, les sujets sensibles ou les noms de personnes. Reconnaissez les différents locuteurs dans votre fichier audio et repérez les mots-clés spécifiés en temps réel avec une grande précision et en toute confiance.
Conçu pour prendre en charge différents cas d'utilisation
Transcrivez l'audio pour différents cas d'utilisation allant de la transcription en temps réel pour l'audio à partir d'un microphone, à l'analyse de milliers d'enregistrements audio de votre centre d'appels pour fournir des analyses significatives.