Amélioration de la précision des traitements parole-texte
Le bruit provenant de l'audio de l'appelant, tels que le bruit de fond et les échos de la lecture texte-parole, peuvent affecter la précision du traitement parole-texte et causer des interruptions indésirables. Vous pouvez configurer IBM® Voice Gateway pour prendre en compte les environnements bruyants et les échos.
Configuration du seuil de cote de confiance du service Speech to Text
Chaque énoncé que le service Speech to Text traite se voit attribuer une cote de confiance, qui indique à quel point le service est sûr que le texte identifié correspond à l'entrée audio. Vous pouvez configurer Media Relay pour supprimer et ignorer les énoncés parole-texte dont la cote de confiance est inférieure à un certain seuil.
Par défaut, le seuil de la cote de confiance est de 0, ce qui signifie que toutes les réponses sont utilisées. Les valeurs recommandées se situent entre 0 et 1.
- Environnement à un titulaire : Dans la configuration de Media Relay, définissez la valeur de seuil sur la variable d'environnement
WATSON_STT_CONFIDENCE_SCORE_THRESHOLD.- WATSON_STT_CONFIDENCE_SCORE_THRESHOLD=0.2 - Configuration JSON à plusieurs titulaires : Dans le fichier de configuration JSON à plusieurs titulaires, vous pouvez définir différents seuils de confiance pour chaque titulaire. Pour chaque titulaire,
définissez la propriété
confidenceScoreThresholddans l'objetstt.... "stt": { "credentials": { "url": "https://stream.watsonplatform.net/speech-to-text/api", "username": "9h7f54cb-f28f-4a64-91e1-a0657e1dd3f4", "password": "IAB5jfxls0Zt" }, "config": { "model": "en-US_NarrowbandModel", "profanity_filter": true, "smart_formatting": true }, "confidenceScoreThreshold": 0.2 } ... -
Configuration dynamique : Vous pouvez changer le seuil de la cote de confiance dynamiquement au cours d'un appel à l'aide de la balise d'action
vgwActSetSTTConfigde l'API Voice Gateway pour définir le paramètreconfidenceScoreThreshold. Pour plus d'informations, voir Configuration dynamique des services Watson.{ "output": { "vgwAction": { "command": "vgwActSetSTTConfig", "parameters": { "confidenceScoreThreshold": 0.7 } } } }
Suppression des échos de la lecture texte-parole
Durant un appel, l'audio du service Text to Speech que Voice Gateway lit peut être audible via la ligne téléphonique de l'appelant. Cet écho peut être interprété en tant qu'audio de l'appelant et traité par le service Speech to Text, entraînant ainsi des interruptions ou des réponses non valides du service Watson Assistant. Pour réduire ces occurrences, vous pouvez activer la suppression des échos, qui ignore tout énoncé se produisant immédiatement après le début de lecture de l'audio texte-parole. La suppression des échos est prise en charge à partir de la version 1.0.0.4c.
Vous pouvez activer la suppression des échos pour tous les appels en le spécifiant dans la configuration de Voice Gateway, ou bien l'activer et la désactiver dynamiquement durant un appel.
-
Environnement à un titulaire : Dans la configuration de Media Relay, définissez la variable d'environnement
ECHO_SUPPRESSIONsurtrue.Par exemple, sur Docker :
- ECHO_SUPPRESSION=true -
Configuration JSON à plusieurs titulaires : Dans le fichier de configuration JSON à plusieurs titulaires, définissez la propriété
echoSuppressionsurtruesous l'objetstt."stt": { "credentials": { "url": "https://stream.watsonplatform.net/speech-to-text/api", "username": "9h7f54cb-f28f-4a64-91e1-a0657e1dd3f4", "password": "IAB5jfxls0Zt" }, "config": { "model": "en-US_NarrowbandModel", "profanity_filter": true, "smart_formatting": true }, "confidenceScoreThreshold": 0.2, "echoSuppression": true } -
Configuration dynamique : Vous pouvez configurer dynamiquement la suppression des échos durant un appel à l'aide de la balise d'action
vgwActSetSTTConfigde l'API Voice Gateway pour définir le paramètreechoSuppression. Pour plus d'informations, voir Configuration dynamique des services Watson.{ "output": { "vgwAction": { "command": "vgwActSetSTTConfig", "parameters": { "echoSuppression": true } } } }