通話のバージインの構成
バージイン により、IBM® Voice Gateway への発信者は、セルフサービス・エージェントへの通話中に Watson™ を中断できます。 バージインが発生すると、Watson Text to Speech サービスからの音声の再生は停止し、Voice Gateway は、発信者の発話が Watson Assistant に送信されるのを待機します。
バージインについて
-
音声バージイン は、Text to Speech サービスからの音声の再生中に、Media Relay が Speech to Text サービスからの最初の仮説または最終の発話または Watson Assistant からの応答を受け取ったときに発生します。 最初の仮説から最終の発話までの間、Media Relay は新規またはアクティブな音声再生を破棄またはキャンセルします。
Speech to Text サービスからの最終の発話には信頼度スコアが含まれます。これは、書き起こしと発信者の発言内容の一致についてサービスがどの程度確信しているかを示します。 Speech to Text サービスからの仮説で最終でないものには、信頼度スコアは含まれません。 長い発話は、その発話の長さのために、信頼性スコアに関係なくバージインとなります。
- DTMF バージイン は、Text to Speech サービスからの音声を再生中に、発信者がキーを押して DTMF (dual-tone multi-frequency) 入力を提供したときに発生します。 DTMF バージインの無効化または DTMF (Dual-Tone Multi-Frequency) 応答の収集を参照してください。
バージイン後の音声再生の再開
デフォルトでは、バージインが発生すると Voice Gateway は音声再生を停止します。 最終発話の信頼度スコアが信頼度スコアしきい値よりも低い場合はバージイン後に音声再生を再開するように Voice Gateway を構成できます。 この設定を有効にすると、外部ノイズおよび分かりにくい音声からの意図しないバージインの影響を減らすことができ、その結果として通話フローがより自然になります。 バージイン後の音声再生の再開は、バージョン 1.0.0.5 以降で使用可能です。
この設定が有効になっている場合、Media Relay は、Speech to Text サービスから仮説メッセージを受け取ると、再生中の音声を停止します。 Media Relay は、最終発話を受け取ると、その信頼度スコアを信頼度スコアしきい値に照らして評価します。 スコアがしきい値よりも大きい場合、Media Relay は音声再生を取り消します。 スコアがしきい値よりも小さい場合、Media Relay は音声再生を再開します。
-
シングル・テナント環境: Media Relay 構成で、
BARGE_IN_RESUME環境変数をtrueに設定します。例えば、Docker で以下のようにします。
- BARGE_IN_RESUME=true - マルチテナント JSON 構成: JSON 構成ファイルで、各テナントの
sttオブジェクトのbargeInResumeプロパティーをtrueに設定します。"stt": { "credentials": { ... }, "config": { ... }, "bargeInResume": true } - 動的構成: Watson Assistant ダイアログ内で
vgwActSetSTTConfigAPI アクションを設定することによって、この設定およびその他の Speech to Text 構成を通話中に動的に構成できます。 詳細は、『Watson Speech サービスの動的構成』を参照してください。
speech-to-text 処理を無効にすることによる音声バージインの無効化
Voice Gateway による音声再生中の speech-to-text 処理を無効にすることで、音声バージインを完全に無効にすることができます。 speech-to-text 処理が無効になっている場合、発信者は話すことでバージインできませんが、DTMF トーンを使用してバージインできます (DTMF トーンが別途無効にされている場合を除く)。
Voice Gateway 構成に設定することで、すべての通話に対して音声バージインを無効にすることができます。あるいは、通話中に API アクション・タグを使用してバージインを動的に無効および有効にすることもできます。 この構成は、バージョン 1.0.0.4c 以降で使用可能です。
-
シングル・テナント環境: SIP Orchestrator 構成で、
DISABLE_STT_DURING_PLAYBACK環境変数をtrueに設定します。例えば、Docker で以下のようにします。
- DISABLE_STT_DURING_PLAYBACK=true - JSON 構成を使用する場合またはマルチテナント環境: JSON 構成ファイルで、音声バージインを無効にするテナントごとに、
disableSTTDuringPlaybackプロパティーをtrueに設定します。"tenants": [ { "tenantURI": "2345556789", "description": "Voice Gateway Demo US", "whitelistFromUri" : "8765554321", "disableSTTDuringPlayback" : "true", "conversation": { "url": "https://gateway.watsonplatform.net/conversation/api", "workspaceID": "a23de67h-e527-40d5-a867-5c0ce9e72d0d", "password": "InWtiUpYhF1Z", "username": "9h7f54cb-d9ed-46b3-8492-e9a9bf555021" } ... } ] -
動的構成: 通話中に Watson Assistant ダイアログ・ノードの JSON 定義でアクション・タグ
vgwActDisableSTTDuringPlaybackおよびvgwActEnableSTTDuringPlaybackを設定することで、音声バージインを無効および有効にすることができます。 この状態は、通話の期間中保持されるため、音声バージインを無効にするために Watson Assistant ダイアログの初期にvgwActDisableSTTDuringPlaybackアクション・タグを設定できます。 後から、vgwActEnableSTTDuringPlaybackアクション・タグを設定して有効にすることを選択できます。vgwActPauseSTTアクションを使用して speech-to-text 処理が明示的に無効にされている場合、Voice Gateway は、再生トランザクションの完了後、vgwActUnPauseSTTアクションによって再有効化されるまで speech-to-text 処理を再開しません。 アクション・タグの使用について詳しくは、『セルフサービス・エージェント用の API』を参照してください。{ "output": { "vgwAction": { "command": "vgwActDisableSTTDuringPlayback" } } }
最初の仮説または最終の発話からの音声バージインの無効化
音声バージインの量を減らしたいが、speech-to-text 処理をある程度許可する場合、ダイアログ・ノードの JSON 定義で vgwActDisableSpeechBargeIn アクション・タグを設定することで、音声バージインを無効にすることができます。 vgwActDisableSpeechBargeIn アクションでは、Speech to Text サービスからの最初の仮説および最終の発話からの音声バージインが無効になります。これは、主に、早期の迅速なバージインに影響します。
ただし、この場合でも、音声に合成される応答を Watson Assistant から Voice Gateway が受け取ると、バージインが発生することがあります。
{
"output": {
"vgwAction": {
"command": "vgwActDisableSpeechBargeIn"
}
}
}
会話セッション中に変数が設定されると、同じ値が後続のすべてのトランザクションで使用されます。 バージインを再び有効にするには、ダイアログ内で vgwActEnableSpeechBargeIn のアクション・タグを設定します。
DTMF バージインの無効化
JSON ノード定義で vgwActDisableDTMFBargeIn アクション・タグを設定することで、 DTMF バージインを無効にすることができます。 バージインを再び有効にするには、ダイアログ内で vgwActEnableDTMFBargeIn のアクション・タグを設定します。
アクション・シーケンスを使用して、音声バージインと DTMF バージインを同時に無効または有効にすることができます。 例えば、以下のアクション・シーケンスでは、すべての音声バージインと DTMF バージインを無効にし、テキストを音声として再生します。
{
"output": {
"vgwActionSequence": [
{
"command": "vgwActDisableSTTDuringPlayback"
},
{
"command": "vgwActDisableDTMFBargeIn"
},
{
"command": "vgwActPlayText",
"parameters": {
"text": [
"Welcome to our service. Please listen carefully."
]
}
}
]
}
}