Activation de l'audio à large bande dans Voice Gateway
IBM Voice Gateway utilise par défaut l'audio à bande étroite, mais vous pouvez configurer Voice Gateway pour utiliser l'audio à large bande lorsque cela est possible. L'activation de l'audio à large bande améliore la qualité de l'audio lu à l'appelant et celle des transcriptions parole-texte. L'audio à large bande est pris en charge dans la version 1.0.0.4 et les versions ultérieures.
Pour utiliser l'audio à large bande, votre liaison SIP ou votre contrôleur SBC doit prendre en charge le codec G.722. Même si l'audio à large bande est configuré dans Voice Gateway, il est uniquement utilisé si l'appareil de l'appelant prend en charge le codec G.722.
Par défaut, Voice Gateway utilise le code G.711 à bande étroite et le modèle en-US_NarrowbandModel du service Watson™ Speech to Text.
Important : Par rapport à la bande étroite, l'activation d'une large bande augmente considérablement la bande passante du réseau qui est requise entre Voice Gateway et les services de parole Watson.
Configuration de l'audio à large bande
Pour configurer l'audio à large bande, définissez la préférence de bande Speech to Text, puis la configuration sur des propriétés et variables d'environnement spécifiques à une large bande. Lorsque l'audio à large bande est activé, il est également utilisé pour la lecture de données audio Text to Speech à l'appelant.
Important : L'audio à bande étroite et l'audio à large bande sont configurés séparément, et la configuration pour les deux bandes peut être définie simultanément. Lorsqu'une large bande est définie comme préférence de bande, elle est utilisée quand cela est possible. Dans les cas où l'audio à large bande ne peut pas être utilisé, l'audio à bande étroite est utilisé.
Pour activer la prise en charge d'une large bande, la préférence de bande doit être définie au minimum sur une large bande et le modèle Speech to Text doit être défini.
Environnements à titulaire unique
Dans la configuration Media Relay, configurez la préférence de bande et le modèle de langage à large bande sur les variables d'environnement associées.
-
Pour les déploiements Docker Engine, définissez les variables d'environnement dans le fichier
docker-compose.yml.version: '2' services: ... media.relay: environment: ... - WATSON_STT_BAND_PREFERENCE=broadband - WATSON_STT_BROADBAND_MODEL=en-US_BroadbandModel -
Pour les déploiements sur Kubernetes dans IBM Container Service, dans le fichier
deploy.json, définissez les paires nom-valeur de la variable d'environnement dans l'objetenvdu conteneurvgw-media-relay."env": [ ... { "name": "WATSON_STT_BAND_PREFERENCE", "value": "broadband" }, { "name": "WATSON_STT_BROADBAND_MODEL", "value": "en-US_BroadbandModel" }]
Le tableau suivant répertorie toutes les variables d'environnement que vous pouvez définir pour configurer l'audio à large bande.
| Variable d'environnement | Description |
|---|---|
WATSON_STT_BAND_PREFERENCE |
Définit la bande audio à privilégier lors de la négociation des codecs audio dans la session. Définissez ce paramètre sur broadband pour utiliser l'audio à large bande quand cela est possible. La valeur par défaut est narrowband. |
WATSON_STT_BROADBAND_MODEL |
Modèle Speech to Text. |
WATSON_STT_BROADBAND_OPTOUT |
Définissez ce paramètre sur true pour refuser la sauvegarde des données transmises via le service Speech to Text sur des serveurs Watson. |
WATSON_STT_BROADBAND_MAXALTERNATIVES |
Nombre de solutions alternatives de reconnaissance vocale à renvoyer depuis le service Speech to Text. Par défaut, la valeur du service Speech to Text est utilisée. |
WATSON_STT_BROADBAND_MODEL_CUSTOMIZATION_ID |
Utilisée pour définir un modèle de langue personnalisé pour la reconnaissance. |
WATSON_STT_BROADBAND_PROFANITY_FILTER |
Définissez ce paramètre sur true pour filtrer le contenu inapproprié sur les transcriptions provenant du service Speech to Text. Par défaut, la valeur du service Speech to Text est utilisée. |
WATSON_STT_BROADBAND_SMART_FORMATTING |
Indique si les dates, heures, séries de chiffres et nombres, numéros de téléphone, valeurs monétaires et adresses Internet doivent être convertis en une représentation plus lisible, conventionnelle dans la retranscription finale d'une demande de reconnaissance. |
Utilisation de la configuration JSON avancée
Dans le fichier de configuration JSON, configurez chaque titulaire pour lequel vous souhaitez activer l'audio à large bande.
- Définissez le paramètre
bandPreferencesurbroadband. - Configurez un objet
broadbandConfigcontenant la valeurmodelet une autre configuration à large bande.
La plupart des paramètres dans l'objet broadbandConfig sont identiques à ceux de l'objet config, qui est utilisé pour définir l'audio à bande étroite. Les exceptions incluent les valeurs model et
d'autres personnalisations qui sont associées au modèle spécifié, telles que les propriétés customization_id et acoustic_customization_id provenant de l'API WebSockets Speech to Text.
...
"stt": {
"credentials": {
"url": "https://stream.watsonplatform.net/speech-to-text/api",
"username": "9h7f54cb-f28f-4a64-91e1-a0657e1dd3f4",
"password": "IAB5jfxls0Zt"
},
"config": {
"model": "en-US_NarrowbandModel",
"profanity_filter": true,
"smart_formatting": true
},
"broadbandConfig": {
"model": "en-US_BroadbandModel",
"profanity_filter": true,
"smart_formatting": true
},
"bandPreference": "broadband",
"confidenceScoreThreshold": 0.7
}
...
Configuration dynamique lors d'un appel
Pour les agents en libre-service, vous pouvez configurer les services Watson de manière dynamique depuis Watson Assistant afin de pouvoir modifier la préférence de bande audio et d'autres paramètres de configuration pendant l'appel. Pour plus d'informations, voir Configuration dynamique des services Watson.
La configuration de l'audio à large bande dans le dialogue Watson Assistant utilise un format similaire à la configuration à plusieurs titulaires. Pour configurer l'audio à large bande dans votre dialogue Watson Assistant, définissez une
commande d'action vgwActSetSTTConfig. Sous les paramètres, définissez bandPreference sur broadband et ajoutez un objet broadbandConfig.
{
"output": {
"vgwAction": {
"command": "vgwActSetSTTConfig",
"parameters": {
"credentials": {
"url": "https://stream.watsonplatform.net/speech-to-text/api",
"username": "9h7f54cb-5epb-80d6-45c3-da41d2bf7a71",
"password": "asxNzDLpIJ6F"
},
"config": {
"model": "en-US_NarrowbandModel",
"profanity_filter": true,
"smart_formatting": true
},
"broadbandConfig": {
"model": "en-US_BroadbandModel",
"profanity_filter": true,
"smart_formatting": true
},
"bandPreference": "broadband",
"confidenceScoreThreshold": 0.7
}
}
}
}