IBM Watson Blog

IBM Watson の仕組み:機械学習で洞察の精度を高める(前編)

記事をシェアする:

IBM のAI(Augmented Intelligence、拡張知能)であるIBM Watson。Watson は IBM が展開する人工知能の技術を応用した仕組みのことで、話し言葉などの自然言語といった非構造化データの洞察を得意とする。

書籍や論文などのドキュメントから得た内容を分析し、人間にとっての最適解を提案できるのが Watson の強みだ。導入した企業ではすでにサービスの運用も始まっている

Watson は一体どのように学習し、洞察をしているのだろうか。

  • どう情報を収集するのか
  • 収集した情報をどう解釈しているのか
  • Watson はインプットした専門知識をどう強化していくのか

に分けて紹介しよう。

 

どう情報を収集するのか

Watson にとって必要不可欠なのが分析する元となる情報。Watson は情報を全自動で収集するわけではなく、書籍や論文などのドキュメント、Webページなど、それぞれの領域で必要なデータを人間の手で Watson にインプットする必要がある。例えば医療の分野なら医療系の論文、人材領域なら過去のマッチングデータなどだ。

これらの情報のデータベースを「知識のコーパス(分析する基となるデータベース)」と呼ぶ。

curating the content

「知識のコーパス」を構築するうえで、少なからず古い情報や誤った知識も蓄積してしまうことがある。例えば医療分野なら、今は使われていない抗がん剤を用いた治療法などがそうだ。それらの古い情報を専門家が手動で除外していく。

ingestion

蓄積した質の高い情報を Watson が処理し、より効果的にコンテンツと連係するための「メタデータ」を構築する。この工程を経ることで、Watson はより的確な洞察ができるようになるのだ。

cancer

例えば「がん」という用語があるとする。がんには非常に多くのタイプが存在し、それぞれのタイプごとに異なった症状と治療法がある。がんの治療は非常に複雑で、例えば併発した別の病気を患っていたり、最適だとされる治療法が合わないケースもある。

metadata

Watson は読み込んだデータからメタデータを構築し関連付けることで、このような複雑な病気の関係性も考慮できるようになる。そして患者がどの種類のがんを患っているのかを分析し、どう治療するのがベストなのかを医師に提案できる。

この学習方法は我々と似ている。例えば我々が何か新しいことを学ぼうとしたとき、まず片っ端から書籍やWebを読み込み、得た情報を自分なりに関連付けて解釈しているはずだ。

 

Watson は収集した情報をどう解釈しているのか

machine learning

Watson が情報を収集する仕組みは分かった。では Watson はどう情報を解釈しているのか。インプットした情報を解釈するには「機械学習」を用いて、専門家が情報の解釈の方法を教える必要がある。

input

「機械学習」にはさまざまな手法があるが、Watson の場合はまず「質問」と「回答」をペアでインプットする。

例えば「Q:パリで一番高い建物は?」→「A:エッフェル塔」などだ。このような Q&A のパターンを大量にインプットし、対話を継続的に行うことで、特定分野における対話の関連性を記憶していく。

ひと通りインプットが終わったら、次は Watson の理解度を高めるため、対話の内容を専門家がレビュー。レビュー結果は Watson を構築するシステムにフィードバックされ、所定分野での知識と言語的解釈の変化に適応できるように機械学習をする。

現在、Watson は上記のような簡単な質疑応答だけでなく、いわゆる予測分析のような証拠に基づいた潜在的な応答や推奨も提案できるようになった。今後は情報に隠れた洞察やパターンを特定するようになる見込みだ。

次回は『Watson はインプットした専門知識をどう強化していくのか』を説明しよう。

 

More IBM Watson Blog stories

Watson Assistant のさらなる進化 ー新たな価格プラン

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog

「継続的な成長と発展なくして、改善・達成・成功という言葉に意味はない」— ベンジャミン・フランクリン Watson Assistant は、常にチャットボット市場をけん引し続けてきました (IBM ではチャットボットでは ...続きを読む


テキストの発話速度の調整方法

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog

cURLコマンドの<prosody>要素を使用して、テキストの発話速度の制御がいかに簡単かを学びます。 開発者は、最近、私が答えようとしていた質問を受けました。cURLPOSTを使用してIBM Watson  ...続きを読む