Activation de l'audio à large bande dans Voice Gateway

IBM Voice Gateway utilise par défaut l'audio à bande étroite, mais vous pouvez configurer Voice Gateway pour utiliser l'audio à large bande lorsque cela est possible. L'activation de l'audio à large bande améliore la qualité de l'audio lu à l'appelant et celle des transcriptions parole-texte. L'audio à large bande est pris en charge dans la version 1.0.0.4 et les versions ultérieures.

Pour utiliser l'audio à large bande, votre liaison SIP ou votre contrôleur SBC doit prendre en charge le codec G.722. Même si l'audio à large bande est configuré dans Voice Gateway, il est uniquement utilisé si l'appareil de l'appelant prend en charge le codec G.722.

Par défaut, Voice Gateway utilise le code G.711 à bande étroite et le modèle en-US_NarrowbandModel du service Watson™ Speech to Text.

Important : Par rapport à la bande étroite, l'activation d'une large bande augmente considérablement la bande passante du réseau qui est requise entre Voice Gateway et les services de parole Watson.

Configuration de l'audio à large bande

Pour configurer l'audio à large bande, définissez la préférence de bande Speech to Text, puis la configuration sur des propriétés et variables d'environnement spécifiques à une large bande. Lorsque l'audio à large bande est activé, il est également utilisé pour la lecture de données audio Text to Speech à l'appelant.

Important : L'audio à bande étroite et l'audio à large bande sont configurés séparément, et la configuration pour les deux bandes peut être définie simultanément. Lorsqu'une large bande est définie comme préférence de bande, elle est utilisée quand cela est possible. Dans les cas où l'audio à large bande ne peut pas être utilisé, l'audio à bande étroite est utilisé.

Pour activer la prise en charge d'une large bande, la préférence de bande doit être définie au minimum sur une large bande et le modèle Speech to Text doit être défini.

Environnements à titulaire unique

Dans la configuration Media Relay, configurez la préférence de bande et le modèle de langage à large bande sur les variables d'environnement associées.

Le tableau suivant répertorie toutes les variables d'environnement que vous pouvez définir pour configurer l'audio à large bande.

Tableau 1. Variables d'environnement de l'audio à large bande
Variable d'environnement Description
WATSON_STT_BAND_PREFERENCE Définit la bande audio à privilégier lors de la négociation des codecs audio dans la session. Définissez ce paramètre sur broadband pour utiliser l'audio à large bande quand cela est possible. La valeur par défaut est narrowband.
WATSON_STT_BROADBAND_MODEL Modèle Speech to Text.
WATSON_STT_BROADBAND_OPTOUT Définissez ce paramètre sur true pour refuser la sauvegarde des données transmises via le service Speech to Text sur des serveurs Watson.
WATSON_STT_BROADBAND_MAXALTERNATIVES Nombre de solutions alternatives de reconnaissance vocale à renvoyer depuis le service Speech to Text. Par défaut, la valeur du service Speech to Text est utilisée.
WATSON_STT_BROADBAND_MODEL_CUSTOMIZATION_ID Utilisée pour définir un modèle de langue personnalisé pour la reconnaissance.
WATSON_STT_BROADBAND_PROFANITY_FILTER Définissez ce paramètre sur true pour filtrer le contenu inapproprié sur les transcriptions provenant du service Speech to Text. Par défaut, la valeur du service Speech to Text est utilisée.
WATSON_STT_BROADBAND_SMART_FORMATTING Indique si les dates, heures, séries de chiffres et nombres, numéros de téléphone, valeurs monétaires et adresses Internet doivent être convertis en une représentation plus lisible, conventionnelle dans la retranscription finale d'une demande de reconnaissance.

Utilisation de la configuration JSON avancée

Dans le fichier de configuration JSON, configurez chaque titulaire pour lequel vous souhaitez activer l'audio à large bande.

  1. Définissez le paramètre bandPreference sur broadband.
  2. Configurez un objet broadbandConfig contenant la valeur model et une autre configuration à large bande.

La plupart des paramètres dans l'objet broadbandConfig sont identiques à ceux de l'objet config, qui est utilisé pour définir l'audio à bande étroite. Les exceptions incluent les valeurs model et d'autres personnalisations qui sont associées au modèle spécifié, telles que les propriétés customization_id et acoustic_customization_id provenant de l'API WebSockets Speech to Text.

...
"stt": {
  "credentials": {
  "url": "https://stream.watsonplatform.net/speech-to-text/api",
  "username": "9h7f54cb-f28f-4a64-91e1-a0657e1dd3f4",
  "password": "IAB5jfxls0Zt"
  },
            "config": {
    "model": "en-US_NarrowbandModel",
    "profanity_filter": true,
    "smart_formatting": true
  },
  "broadbandConfig": {
    "model": "en-US_BroadbandModel",
    "profanity_filter": true,
    "smart_formatting": true
  },
  "bandPreference": "broadband",
  "confidenceScoreThreshold": 0.7
}
...

Configuration dynamique lors d'un appel

Pour les agents en libre-service, vous pouvez configurer les services Watson de manière dynamique depuis Watson Assistant afin de pouvoir modifier la préférence de bande audio et d'autres paramètres de configuration pendant l'appel. Pour plus d'informations, voir Configuration dynamique des services Watson.

La configuration de l'audio à large bande dans le dialogue Watson Assistant utilise un format similaire à la configuration à plusieurs titulaires. Pour configurer l'audio à large bande dans votre dialogue Watson Assistant, définissez une commande d'action vgwActSetSTTConfig. Sous les paramètres, définissez bandPreference sur broadband et ajoutez un objet broadbandConfig.

{
  "output": {
    "vgwAction": {
      "command": "vgwActSetSTTConfig",
      "parameters": {
              "credentials": {
                "url": "https://stream.watsonplatform.net/speech-to-text/api",
                "username": "9h7f54cb-5epb-80d6-45c3-da41d2bf7a71",
                "password": "asxNzDLpIJ6F"
              },
            "config": {
                  "model": "en-US_NarrowbandModel",
                  "profanity_filter": true,
                  "smart_formatting": true
              },
        "broadbandConfig": {
                  "model": "en-US_BroadbandModel",
                  "profanity_filter": true,
                  "smart_formatting": true
        },
        "bandPreference": "broadband",
              "confidenceScoreThreshold": 0.7
          }
    }
  }
}