Breitbandaudio in Voice Gateway aktivieren

IBM® Voice Gateway verwendet standardmäßig Schmalbandaudio, Sie können jedoch Voice Gateway so konfigurieren, dass, sofern möglich, Breitbandaudio verwendet wird. Durch die Aktivierung von Breitbandaudio verbessert sich die Qualität der Audiowiedergabe für den Anrufer und die Qualität der Speech to Text-Transkriptionen. Breitbandaudio wird ab Version 1.0.0.4 unterstützt.

Für die Verwendung von Breitbandaudio ist es erforderlich, dass der SIP-Trunk oder der Session Border Controller den Codec G. 722 unterstützen. Selbst wenn Breitbandaudio in Voice Gateway konfiguriert ist, wird es nur verwendet, wenn die Einheit des Anrufers den Codec G. 722 unterstützt.

Voice Gateway verwendet standardmäßig den Schmalbandcodec G. 711 und das Modell en-US_NarrowbandModel des Watson™-Service "Speech to Text".

Wichtig: Im Gegensatz zu Schmalband wird durch die Aktivierung von Breitband die Netzbandbreite, die für Voice Gateway und den Watson-Speech-Services erforderlich ist, erheblich verbessert.

Breitbandaudio konfigurieren

Sie konfigurieren Breitbandaudio, indem Sie die Vorgabe für die Speech to Text-Bandbreite festlegen und anschließend eine beliebige Konfiguration für breitbandspezifische Umgebungsvariablen und Eigenschaften festlegen. Wenn Breitbandaudio aktiviert ist, wird es auch für die Wiedergabe von Text to Speech-Audiowiedergaben an den Anrufer verwendet.

Wichtig: Schmalbandaudio and Breitbandaudio werden gesondert konfiguriert. Die Konfiguration für beide Bandbreiten kann zur selben Zeit erfolgen. Wenn Breitband als Bandvorgabe definiert ist, wird es immer dann verwendet, wenn es möglich ist. In den Fällen, in denen Breitbandaudio nicht verwendet werden kann, wird Schmalbandaudio verwendet.

Zum Aktivieren der Breitbandunterstützung muss mindestens Breitband als Bandvorgabe und das Speech to Text-Modell muss definiert sein.

Single-Tenant-Umgebungen

Definieren Sie in der Media Relay-Konfiguration die Vorgabe und das Sprachmodell für die Bandbreite über die zugehörigen Umgebungsvariablen.

In der folgenden Tabelle sind alle Umgebungsvariablen aufgelistet, die Sie für die Konfiguration von Breitbandaudio definieren können.

Tabelle 1. Umgebungsvariablen für Breitbandaudio
Umgebungsvariable Beschreibung
WATSON_STT_BAND_PREFERENCE Definiert, welches Audioband bevorzugt werden soll, wenn die Audiocodecs in der Sitzung vereinbart werden. Setzen Sie diese Option auf broadband, um Breitbandaudio zu verwenden, sofern möglich. Der Standardwert ist narrowband.
WATSON_STT_BROADBAND_MODEL Das Speech to Text-Modell.
WATSON_STT_BROADBAND_OPTOUT Setzen Sie den Wert auf true, um das Speichern von Daten auszuschließen, die im Speech to Text-Service auf Watson-Servern verarbeitet werden.
WATSON_STT_BROADBAND_MAXALTERNATIVES Die Anzahl der vom Speech to Text-Service zurückzugebenden Spracherkennungsalternativen. Standardmäßig wird der Wert aus dem Speech to Text-Service verwendet.
WATSON_STT_BROADBAND_MODEL_CUSTOMIZATION_ID Wird verwendet, um ein für die Erkennung angepasstes Sprachmodell festzulegen.
WATSON_STT_BROADBAND_PROFANITY_FILTER Setzen Sie den Wert auf true, um vulgäre Ausdrücke aus den Speech to Text-Transkriptionen zu filtern. Standardmäßig wird der Wert aus dem Speech to Text-Service verwendet.
WATSON_STT_BROADBAND_SMART_FORMATTING Gibt an, ob Datumsangaben, Uhrzeiten, Ziffern- und Nummernserien, Telefonnummern, Währungswerte und Internetadressen in der endgültigen Transkription einer Erkennungsanforderung in besser lesbare, konventionelle Darstellungen konvertiert werden sollen.

Erweiterte JSON-Konfiguration verwenden

Konfigurieren Sie in der JSON-Konfigurationsdatei jeden Tenant, für den Sie Breitbandaudio aktivieren möchten.

  1. Setzen Sie den Wert für bandPreference auf broadband.
  2. Konfigurieren Sie ein broadbandConfig-Objekt, das das Modell (model) und Breitbandkonfigurationsangaben enthält.

Die meisten Parameter im broadbandConfig-Objekt stimmen mit denen im config-Objekt überein, das für die Definition von Schmalbandaudio verwendet wird. Zu den Ausnahmen gehören die model-Werte und weitere Anpassungen, die an das angegebene Modell gebunden sind, wie z. B. die Eigenschaften customization_id und acoustic_customization_id für die Speech to Text-WebSockets-API.

...
"stt": {
  "credentials": {
              "url": "https://stream.watsonplatform.net/speech-to-text/api",
  "username": "9h7f54cb-f28f-4a64-91e1-a0657e1dd3f4",
  "password": "IAB5jfxls0Zt"
  },
            "config": {
                "model": "en-US_NarrowbandModel",
    "profanity_filter": true,
    "smart_formatting": true
  },
  "broadbandConfig": {
    "model": "en-US_BroadbandModel",
    "profanity_filter": true,
    "smart_formatting": true
  },
  "bandPreference": "broadband",
  "confidenceScoreThreshold": 0.7
}
...

Dynamische Konfiguration während eines Anrufs

Wenn Sie Self-Service-Agenten verwenden, können Sie Watson-Services in Watson Assistant dynamisch konfigurieren, sodass Sie während des Anrufs die Einstellungen für die Audiobandvorgaben und andere Konfigurationseinstellungen ändern können. Weitere Informationen finden Sie unter Watson-Services dynamisch konfigurieren.

Die Konfiguration von Breitbandaudio im Watson Assistant-Dialog verwendet ein ähnliches Format wie eine Multi-Tenant-Konfiguration. Definieren Sie einen Aktionsbefehl vgwActSetSTTConfig, um Breitbandaudio in Ihrem Watson Assistant zu konfigurieren. Setzen Sie unterhalb der Parameter den Eintrag bandPreference auf broadband und fügen Sie ein broadbandConfig-Objekt hinzu.

{
  "output": {
    "vgwAction": {
      "command": "vgwActSetSTTConfig",
      "parameters": {
              "credentials": {
              "url": "https://stream.watsonplatform.net/speech-to-text/api",
                "username": "9h7f54cb-5epb-80d6-45c3-da41d2bf7a71",
                "password": "asxNzDLpIJ6F"
              },
            "config": {
                "model": "en-US_NarrowbandModel",
                  "profanity_filter": true,
                  "smart_formatting": true
              },
        "broadbandConfig": {
                  "model": "en-US_BroadbandModel",
                  "profanity_filter": true,
                  "smart_formatting": true
        },
        "bandPreference": "broadband",
              "confidenceScoreThreshold": 0.7
          }
    }
  }
}