IBM Watson Blog

継承するべき「知見」の学習と蓄積に不可欠なこと

記事をシェアする:

今、求められる「技能」や「知見」の継承

知見を継承しているイメージ画像年初から展示会やイベントに参加する中で気づいたことがあります。それは、製造業系の展示会の場合、熟練の技術者や担当者が持つ「技能」や「知見」の継承を訴求する展示ブースが必ずある、ということです。例えば、「技能」の継承に関する展示ブースでは、画像診断、音響診断のソリューションが紹介されていました。非構造化データ(画像、音声)をディープラーニングに学習させることで熟練の技術者が持つ「技能」の継承が可能となり、経験が浅い技術者をサポートできることを訴求していました。

周知のように、製造現場における熟練の技術者や担当者が持つ「匠の技」は、日本の製造業における強みです。ただ、熟練の技術者や担当者の高齢化、労働力人口の減少、生産拠点の海外への移転といった要因によって、「技能」や「知見」の継承が困難になっていくと予想されています。いや、既に、課題になっている、とも言えます。

では、「知見」の継承の場合はどうか。「知見」は製造業に限定されることではありません。「ノウハウ」と言い換えたほうが納得いただきやすいかもしれませんが、熟練の担当者の「経験に基づく工夫」などは一般的にはマニュアル化されていません。熟練の担当者ご自身が何らかの形で書き記している場合、それはどこにあるのか。それは、日報や報告書といった文書に記されていることが多そうです。しかし、これらのタイプの文書は、特定の構造を持たないことから非構造化データとなります。一定の規則や構造に沿って記述されている構造化データと比べると、必要な情報が探しにくく、そのままの状態では分析に利用できないという課題が非構造化データにはあります。

「知見」が蓄積されている文書データに最適な学習方法とは

「知見」の継承で目指すのは、(1)自然言語処理によって非構造化データである日報や報告書といった文書に記述されている文章を分割して、(2)キーワードの関係性や出現頻度を分析し、(3)文書データから「知見」を取り出すテキストマイニングの実現です。そして、テキストマイニングの前工程として、文書から情報を抽出する作業が必要になります。ここで活用できるのが機械学習です。

機械学習はデータを繰り返し学習し、学習によって捉えられた傾向を法則化します。そして、法則化が済むと、その法則を自動化してさらに学習します。

ここで留意すべき点は、法則化や自動化のためのプログラムを書いているわけではない、ということです。機械学習の進め方の1つに、「教師あり学習」があります。これは、正解データを用意することで意図通りの法則化の実現を目指すものです。熟練の担当者の協力が得られる場合は、この「教師あり学習」を選ぶことが推奨されます。

文書データへの「意味付け」こそが、「知見」の継承に不可欠

「教師あり学習」向けに用意した文書が、何について書かれているのか。あるいは、何を必要としている人に役立つのか。これが事前に分かっていれば、文書を登録する際に整理をしておくことで、検索が行いやすくなりますよね。

ご存知の方が多いと思いますが、データに「意味付け」を行う文字や、データの分類に用いられる単語や短いフレーズのことを「タグ」と言います。そして、データに「タグ」をつける作業のことを「アノテーション」と言います。

上述した「教師あり学習」において、文書データがきちんと「アノテーション」されて正解データとなっていれば、学習を正しく行えることになります。さらに、製品番号や製品名のような一般語ではない言葉を「カスタムタグ」として「アノテーション」すれば、有用性が高く活用しやすくなります。

IBM Cloud上で提供しているIBM Watson Knowledge StudioというAPIを活用いただくと、熟練の担当者の「知見」に基づいて定義したルールを用いて「アノテーション」しながら、品質が高い情報を抽出できるようになります。言い方を変えると、IBM Watson Knowledge Studioを用いて単語や属性を選んで紐づけることで、機械学習用の正解データを作成できます……画像のような直感的で分かりやすいインタフェースを用いて。

IBM Watson Knowledge Studioの画面

IBM Watson Knowledge Studioのユーザーインターフェース。画面は英語ですが日本語も利用できます

そして、IBM Watson Knowledge Studioは、正解データと機械学習を用いて「アノテーション」のルールを組み込んだ「アノテーター」を作成し、共有できます。人間の目で「アノテーション」を行う「ヒューマン・アノテーション」と異なり、「アノテーター」は自動的な「アノテーション」を実現する正解データのための情報抽出器であり、IBM Watson Explorer、IBM Watson Discoveryから利用できます。

大量のデータ検索と意思決定支援のためのAPI:IBM Watson Discovery

前章でWatson APIの1つであるIBM Watson Knowledge Studioを用いたアノテーターの作成に言及してきました。続いて、蓄積された非構造化データからのAI検索について、同じくWatson APIであるIBM Watson Discoveryを紹介します。

IBM Watson Discoveryは、文書の取り込み機能を提供します。次に、取り込んだ文書から情報の抽出と「意味付け」を行います(このことを「エンリッチ」と言います)。ここでIBM Watson Knowledge Studioで作成した「アノテーター」が利用可能です。そして、キーワードや自然文による検索機能を提供します。

熟練の担当者の「知見」が蓄積された文書を取り込み、アノテーションしながら抽出された情報を蓄積し、その情報も活用しながら必要な情報を探しやすくする。これが、IBM Watson Discoveryで実現できるのです。

このIBM Watson Discoveryを採用くださった国内のお客様の1社が、デロイト トーマツ コンサルティング合同会社です。

デロイト トーマツ コンサルティングは、グローバルに事業を展開し輸出入を行っている顧客企業のために、自由貿易協定(FTA)を戦略的に活用するWebサービスを提供。関税率などの定量的な情報を検索可能にすることで、国際通商業務における課題の解決を支援しています。ただ、FTAで作成される協定文書で関税率について記述されているのは半分に過ぎません。協定文書の残りの半分と税関当局が発行する通達集に記述されているのは、輸出入手続きや規制、注意事項などのルールであり、規則性がない「文章」で書かれた非構造化データなのです。

コンプライアンス違反を犯すことなく輸出入を行うためには、顧客企業はルールを正しく理解および運用する必要があります。そこで、デロイト トーマツ コンサルティングは、顧客企業が守るべきルールを探し出すための社内ツールを構築するべく、自然言語解析や機械学習を含むAIのアプローチを検討。その社内ツールのためのAI基盤として、IBM Watson Discoveryを採用いただきました。

ここでIBM Watson Discoveryの機能解説を事細かに行うよりも、実際に本番運用を開始している事例をご一読いただくと、目的の情報や有益な洞察を引き出すためにIBM Watson Discoveryがどのように役立っているかをご理解いただきやすいと思います。先に紹介したIBM Watson Knowledge Studioを用いてどのような文書の「アノテーション」から取り組み、IBM Watson Discoveryを用いた照会の運用をどの程度の期間で開始できたのか。ぜひ、事例PDFをダウンロードいただきご確認ください。

関連情報


More IBM Watson Blog stories

AI for AI:IBMがWatson Studioの新機能AutoAIを発表

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog...

AIの民主化により、あらゆる業界で機械学習とデータ・サイエンスのスキルに対する需要が著しく高まっています。この ...続きを読む


AutoAI お役立ち情報

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog...

AutoAIについてより詳しい情報を知りたい、実際にさわってみたいという方は、ぜひこちらのページもご覧ください ...続きを読む


IBM Cloud Pak for Dataに対応したWatson Assistantの進化

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog

IBM Watsonは、オンプレミスのWatson Assistantプラットフォームに新しい機能を提供しまし ...続きを読む