Watson の API を組み合わせた音声自動翻訳アプリケーション「Speech to Speech」

Comments

「Speech to Speech」は、IBM Watsonの APIを組み合わせ、リアルタイムで音声を多言語に翻訳するアプリケーションです。以下の一連の処理を動的に行うことで、通訳のようなアプリケーションを簡単に作成することができます。ここでご紹介するWatson APIは無料、期限なし、カード不要で使えるIBM Cloudライト・プランに含まれますので気軽に作ることができます。

  1. 日本語で話した音声を「Speech to Text」 API を使ってテキストに変換
  2. 日本語のテキストを「Language Translator」 API で英語に変換
  3. 変換された英語のテキストを「Text to Speech」 API を使って読み上げ

翻訳できるのは動的な音声のほか、あらかじめ録音された音声ファイル (非圧縮 16KHz モノラル WAV または FLAC フォーマット) を読み込ませることで、同様の翻訳を行います。

Speech to Speech アプリを試してみるサンプルコードを見る (Github)

動画によるアプリ解説

アプリの使い方

URLへアクセス

 

記載URLはサンプルですので必ずしも有効でばありません。ご自身のURLに読み替えて下さい。

ハードウェアのマイクの確認

 

ハードウェアのスピーカーの確認

 

ここでの入出力デバイス確認はMacbookのものですが、適宜ご自身の環境へ読み替えて下さい。

ソース言語の選択

 

ターゲット言語の選択

 

Record Audio ボタン押下で、録音〜翻訳〜再生

 

Optional

  1. 音声ファイルが手元にある場合は、Select Fileボタンでファイルを選択
  2. サンプル音源を再生する場合はPlay Sample 1(or 2)ボタンを押下

Speech to Speech アプリを試してみるサンプルコードを見る (Github)


ダウンロード可能なリソース


コメント

コメントを登録するにはサインインあるいは登録してください。

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Cloud computing
ArticleID=1056090
ArticleTitle=Watson の API を組み合わせた音声自動翻訳アプリケーション「Speech to Speech」
publish-date=01112018