概要

Text to SpeechはWatsonの音声合成機能です。深い言語知識と信号処理技術から自然な音声を合成します。クラウド上でAPIとして提供する音声合成システムであり、幅広い出力フォーマットをサポートしています。日本語のほかにもアメリカ英語やイギリス英語、フランス語、ドイツ語など複数の言語に対応し、各言語は少なくとも男性または女性、あるいは両方の音声を提供します。Watsonは基本的な語彙をあらかじめ学習していますが、さらにカスタマイズ機能により特有の発音を制御できます。また、SSMLによるアノテーション機能を用いると、話速・声の高さ・ポーズの位置などを自由に設定することができます。


用途

音声による入出力やコミュニケーションが必要な場面で使用します。

  • 子供向けのインタラクティブ玩具に発声させる
  • スマートフォンのモバイル・アプリケーションやIoT家電などに発声させる
  • 電話の自動応答システムで,お客様への回答を音声合成する
  • ナビゲーションなどハンズフリーでコミュニケーションしたい場合
  • 他のWatsonAPIの出力手段として用いる(Conversation等)

ユーザーからの入力:

  • ドイツ語のテキスト
  • 英語のテキスト
  • スペイン語のテキスト
  • フランス語のテキスト
  • イタリア語のテキスト
  • 日本語のテキスト
  • ブラジル・ポルトガル語のテキスト
  • カスタマイズ辞書の学習データ(単語など)

サービスの出力:

  • ドイツ語の音声(女性1, 男性1)
  • イギリス英語の音声(女性1)
  • アメリカ英語の音声(女性2, 男性1)
  • スペイン語(標準)の音声(女性1, 男性1)
  • スペイン語(北米)の音声(女性1)
  • スペイン語(ラテンアメリカ)の音声(女性1)
  • フランス語の音声(女性1)
  • イタリア語の音声(女性1)
  • 日本語の音声(女性1)
  • ブラジル・ポルトガル語の音声(女性1)

※音声フォーマット:FLAC, MP3, PCM, WAV, Ogg, WebM, Mu-law/u-law

What can I do for you today

デモを試す

1)まずは デモサイト (英語) を使用してみましょう。初めに、PCのミュートを解除し、ボリュームを調節して音声が聞こえるようにしてください。

 ※ 図はクリック/タップで拡大します

2)Input Text欄で Japanese Text を選択してください。

3)Text の欄に日本語のサンプル文が表示されたのを確認した後、下にある Speak ボタンでText To Speech の生成した音声を再生してください。

デモを見る

さて、いかがでしたか?どのように活用するかは皆さん次第です。

活用例

Watson×Unity!初心者でもできる、
VR 空間で Unity ちゃんとおしゃべりアプリ!

今話題の技術や最新技術への挑戦を応援する【IBM×teratail のコラボ企画】第二弾です。今回は Watson×バーチャルリアリティ(以下 VR)を組み合わせたサンプルのご紹介です。

今すぐ使う

IBM Cloudライト・アカウント

これらのAPIを使ったコグニティブ・アプリ構築ができます。組み合わせたり、単体でも活用いただける製品・サービスも記載しています。

Watson API Start Dash Pack

Watsonをすぐに試したいお客様のためのAPIと技術支援をセットにしたオファリングです。価格は¥980,000(税抜)です。

その他のAPI

コグニティブ・アプリケーションを開発するための、機械学習(ディープ・ラーニング)を活用したサービスが準備されています。