Watson Speech to Textの概要

Speech to Textサービスは、アプリケーションに音声認識機能を追加するAPIを提供します。これは言語構造に関する情報と音声信号を組み合わせています。

Speech to Text デモを試す

1)まずは デモサイト (英語,IBM外のWebサイトへ) を使用してみましょう。初めに、音声が聞こえるように設定してください。[Voice Model]にて「Japanese」を含むいずれかを選択し、[Play Sample]をクリックしてください。

speech-to-text-1

 

2)画面下部に、テキストが入力されるのが確認できます。

speech-to-text-2

 

3)次に、自分の音声を録音もしくはファイルアップロードし、テキスト化されることを確認してみてください。

speech-to-text-3

デモを見る

 

さて、いかがでしたか?どのように活用するかは皆さん次第です。

→ 音声認識 Speech To Text を試してみる (英語,IBM外のWebサイトへ)

→ 開発資料

Watson Speech to Textの機能

強力なリアルタイム音声認識

7種の言語の音声をどれでもリアルタイムで自動的に書き起こすことができます。さまざまなオーディオ・フォーマットやプログラミング・インターフェース(HTTP REST、WebSocket、非同期HTTP)に対応し、品質の低い音声からであっても、何が議論されているかを素早く特定して書き起こします。

高精度の音声エンジン

モデルをカスタマイズして、お客様が最も関心のある言語やコンテンツ(製品名、機密の主題、個人の名前など)に関する精度を向上することができます。音声内の異なる話者を認識する他、指定されたキーワードをリアルタイムで高い精度と信頼性で見つることもできます。

さまざまなユース・ケースをサポート

マイクの音声のリアルタイム書き起こしから、コール・センターでの何千もの音声記録の分析まで、幅広いさまざまなユース・ケースで音声の書き起こしを利用でき、意味ある分析を行うことができます。

Watson Speech to Textをすぐに始める

Watson Speech to Textを始める