IBM Cloud Blog

IBM Cloud と IBM Watson で AI ナレッジ発掘サービスを短期で立ち上げ

記事をシェアする:

IBM Cloud をベースとした AI サービスを JIEC が提供

安全で可用性が高くコスト効果に優れるクラウド環境で IBM Watson API を利用

 

” Watson を使用した manaBrain も Retriever も、API サービスの活用から IBM Cloud Object Storage などデータの置き場まで IBM Cloud に統一して提供することにより、お客さまがデータ通信料を気にせずご利用いただけるサービスになります。それが可能なのも IBM Cloud の特徴だと思います “

株式会社JIEC ビジネス企画開発本部 ソリューション開発部 企画開発課 課長 河内 優氏
*お客様事例カタログより

 

IBM Cloud は、Microsoft、Goole、AWSと比べると最も多くのサービスを、最も安価に提供するクラウドであるとレポート(英語)されています。

増加し続けるデータを永続的に安全に保管・管理する IBM Cloud Object Storage は、自動的にコストを最適にしてくれるオプション Smart Tier を提供しています。またIBM Cloudの 東京リージョン内の3つのデータセンターで構成されたアベイラビリティー・ゾーン間の通信、世界中にあるIBM Cloudのデータセンター間の通信ともに無償で利用できます。

このような IBM Cloud のサービスとメリットを活用し、株式会社JIEC(以下、JIEC)は、AIチャットボットとAIナレッジ発掘サービスで構成される「manaBrain」シリーズを提供しています。Kubernetes など最新技術をサポートする IBM Cloud を開発・運用基盤として活用することで開発はスムーズに進み、短期間でのサービス立ち上げに成功しました。

 

ここでは、その「manaBrain」シリーズの中から、AI自然文検索サービス「manaBrain Retriever」をご紹介します。


著者: 株式会社JIEC ビジネス企画開発本部ソリューション開発部 鈴木一平

AI自然文検索サービス「manaBrain Retriever」

 

概要

manaBrain Retriever」は、IBM Watson を活用したAI ナレッジ発掘サービスです。自然言語の検索文と、検索対象の文書のそれぞれを解析し、利用者の意図に則した文書を抽出すると同時に、AI で解析した結果も提示します。これにより利用者は、大量の文書から必要な情報を取得できることはもちろん、単純な検索では得られない新たな”気付き”(=発見)を得ることができます。

 

サービスの特徴

当サービスでは文書を自然言語で簡単に検索できる仕掛けを用意しています。

利用者は一つ以上の書庫を作成できます。書庫にはPDF、HTML、Microsoft Word、Excel、PowerPoint、画像、テキストなどの各種ファイルを登録できます。一つまたは複数の書庫に登録された大量の文書から、Discovery サービス単体での利用時には高度な検索をする場合は、DQL (Discovery Query Language) という専用の言語で検索する必要があるのですが、弊社のサービスでは、自然言語検索の結果から、AI によりタグ付けされた情報での絞り込み検索や類似文書を検索することが GUI 上のクリック (タッチ) 操作のみでできます。

また、高評価と低評価を元に検索結果の順序を変更する学習機能、同義語やストップワード設定による検索の効率化、検索したい文を登録した言語に翻訳して検索する機能などを備えており、これらも全て GUI で操作することができます。

さらに、Discovery のエンリッチ(強化)機能が提供する標準モデルを拡張することもできます。エンリッチ機能は対象の文書データにAIがメタ情報を付加する機能で、これにより検索精度が向上します。Watson Knowledge Studio で作成した独自のカスタムモデルを、manaBrain Retriever のエンリッチのモデルとして指定することもできます。

 

ユースケース

manaBrain Retriever」は大量の文書から「気付き」を得ることのできるサービスです。以下にユースケースの例を示します。
例えば、製品の故障対応報告書を「manaBrain Retriever」に登録したとします。過去の報告書の中から、故障の際の対応方法について調査したい場合、製品の修理方法だけでなく、対応における抜け漏れの確認、類似する状況の対応、同じ部品から生じた異なる現状など、多角的に分析することができます。

登録する文書 どんな時に 気付き、発見
製品の故障対応報告書 故障サービス対応者が修理の対応時に
過去の修理情報から適切な修理方法を
見つけたい
・修理方法
・対応の抜け漏れ・現在の故障と類似する状況
・原因となった部品と同じ物から生じた他の現象
営業報告書 商品・サービスの提案の担当者が新規
提案用の資料作成をヒントが欲しい
・担当者:担当している案件と類似する事例
・管理職:成功(失敗)する営業活動に共通すること
問合せ履歴

FAQ、マニュアル

ヘルプデスクや Web サイトでの問合せ
対応を効率化したい
・質問への回答

・よく質問される問合せはどれか

輸出入取引に関する

・法規制

・社内規則

製品・サービスの海外輸出入において
法規制など考慮すべき点の抜け漏れを
なくしたい
・営業上必要となる法規制や規則文書

 

manaBrain Retrieverによる検索方法

実際に検索を行う操作を紹介します。manaBrain Retriever の Web アプリケーションでは検索条件を指定し結果を表示する画面で主な操作を行います。
「自然言語検索」のフィールドに検索条件を入力します。この場合「Vue のパフォーマンス改善」という条件を入力すると、確信度が高い順に結果が表示されます。

 

manaBrainRetriever 1

 

このとき、ユーザーが文書に設定した「タグ」や AI がエンリッチテキストとして設定する「キーワード」の値をもとに、結果から絞り込みできます。

「タグ」や「キーワード」にチェックを入れると、これらの付加情報が文書と合わせて表示されます。表示された付加情報の値をクリックすると、その値を用いて絞り込みが行われます。例えば「タグ」として設定している「Qiita」をチェックすると、検索条件に「タグ」として「Qiita」が設定されていることが加わり、結果もあわせて更新されます。

 

manaBrainRetriever 2

 

さらに追加された検索条件の「Qiita」をクリックすると、否定検索(「Qiita」のタグが付けられていないものを検索)をすることもできます。

 

manaBrainRetriever 3

 

検索条件はいくつでも追加することができ、簡単な操作で検索条件を変えながら目的の文書を探し出すことができます。
さらにもともと意図していなかった新たな発見や気づきを得ることができるかもしれません。

 

manaBrainRetriever 4

 

対応している言語

日本語、英語、イタリア語、韓国語、スペイン語、ドイツ語、フランス語、ポルトガル語の8つの言語の文書を登録することができます。検索に用いる自然言語や結果の翻訳は上記に加えて、中国語も指定することができます。

 

サービスの仕組み

利用者が直接触れるフロントエンドはオープンソース・ソフトウェアで Web アプリケーションを実装しています。サーバーサイドのバックエンドは全て IBM Cloud のサービスを組み合わせて実現しています。ランタイムはクラウド・ネイティブ・アプリケーションを支えるKubernetesのマネージドサービスである IBM Cloud Kubernetes Service、データストアとしては拡張性が高く、高性能で稼働する No SQL の分散マネージドデータベースである IBM Cloudant、大量の文書を対象に検索し効率的に洞察を得る Discovery、言語間の翻訳機能を提供する Language Translator、高い耐久性と回復力を持ち大量データの保管にも最適な IBM Cloud Object Storage により構成され、サーバーサイド・アプリケーションは Node.js で実装して稼働しています。

これまではダラス・リージョンやシドニー・リージョンを利用することが多かったのですが、東京リージョンを利用するとレスポンスタイムがとても速いです。また、海外リージョンにデータを預けることが不安だったお客さまにも安心してご利用いただくことができ、一つ敷居が下がったのではないかと思います。

 

IBM Watson の魅力

190以上のサービスが提供されている IBM Cloud 上で利用できるAIサービスには、「照会応答系」、「知識探索系」、「画像系」、「音声系」、「心理系」など様々なサービスがあり、すぐに使用できる状態で整備されています。専門的なAIサービスをポータル画面からオーダーするだけですぐに使えること、少ないデータでもトレーニングによりコンテキストに応じて賢くできること、サービスを組み合わせることでより付加価値の高いアプリケーションが開発できることが IBM Watson の魅力だと思います。

さらに2018年末からは多くのAIサービスとそれらと組み合わせて利用できるランタイムやサービスが IBM Cloud 東京リージョンでも利用できるようになり、より手軽に利用できるようになりました。東京リージョンは複数の可用性ゾーンで構成され、業務適用において考慮すべき非機能要件が充足できます。

なお、弊社がサービスのベースとして採用した Discovery は、大量のデータを検索するとともに、適切な意思決定を支援する「知識探索系」の AI サービスです。

 

manaBrain実現における工夫

まず検索対象となる文書の登録について、抽出・分析したデータを Discovery サービスに、実体を IBM Cloud Object Storage サービスに保管します。この時に任意のタグを付けたり、メモや関連文書を登録することができます。登録する単位は、細かく設定できる10件以内の登録機能と、ディレクトリーを丸ごと登録する一括登録機能があり、登録後の更新や削除も含めて、全て GUI で操作することができます。これは Discovery サービス単体では実現できない機能であり、学習データの準備をより簡単に実施することができます。クラウド上のストレージ以外に実体を保管するご相談にも応じています。

次に検索のしやすさについてですが、検索対象の書庫を選び (複数選択可能)、自然言語で検索します。検索結果として表示されるタグやエンリッチ情報をクリックするだけで絞り込み検索や否定検索をすることができ、検索結果の絞り込みを支援します。また、書庫は言語を設定する必要がありますが、例えば中国語やフランス語で自然言語を入力して、日本語の書庫を検索することができます。この場合、検索結果としてはテキストやハイライトの箇所は日本語で表示されますが、結果を翻訳する機能を組み合わせることで実現しています。

翻訳には Language Translator の翻訳モデルをそのまま使用しています。標準の翻訳モデルでは入出力とも英語以外に変換することができないため、例えば、前述のフランス語であれば、英訳したものを和訳する、ということをしています。翻訳モデルをカスタマイズしたい、または、翻訳サービスを別のものに切り替えたい、などのご相談にも応じております。

 

おわりに

JIEC は2018年12月からこのサービスを提供しています。お客さまが複雑な AI をいかに簡単に使っていただけるかを追及してサービスを開発し、現在も機能を拡充しています。詳しい情報は以下のサイトで是非ご確認ください。お客さまの実データによるデモなども準備いたしますので、お気軽にお問い合わせください。
http://retriever.manabrain.biz/

 

 

 

株式会社JIEC ビジネス企画開発本部ソリューション開発部

鈴木一平   i.suzuki@jiec.co.jp

 

 

JIECは1985年の創業以来、「プロフェッショナル・サービス」を社是に掲げ、企業情報システムの根幹を支える基盤技術を強みとして、金融・旅行・運輸・通信などの大規模なシステム開発に従事してきました。特にIBMの技術力を生かし、ビジネスのためのAIであるWatsonを活用したサービスの開発に注力。今後もAIなどの最先端技術を活用したサービスの開発に尽力していきます。
JIECはIBMのWith Watsonプログラムにおける最も高いレベルである、WithWatson Premierメンバーです。
なお、2020年4月1日付でSCSK株式会社と合併します。

 

参考情報

 


Posted by Tomoyuki Tatsuno, Product marketing IBM Japan, Ltd.

More IBM Cloud Blog stories

AI & データ関連Webセミナーのご案内

IBM Data and AI, IBM Watson Blog, アナリティクス...

自席からご参加いただけるWebセミナーです!開催当日は、チャットでQ&Aも行えます。開催翌日からは、録 ...続きを読む


【潜入レポ】開発メンバーが語るWatson Discovery最前線

Data Science and AI, IBM Watson Blog

今年最初のIBM社内セミナー “Technology at a glance”が開催されました。研究開発の旬な ...続きを読む


クラウドコスト:IBMは最も安価であり、AWSは依然として高額のまま変わらず

IBM Cloud Blog

IBM Cloudは、比類のないコスト削減を実現します   Flexeraの調査結果を引用した最近の ...続きを読む