ナレッジ・グラフとは

 

ナレッジ・グラフとは

ナレッジ・グラフはセマンティック・ネットワークとも呼ばれ、オブジェクト、イベント、状況、概念などの現実世界のエンティティーのネットワークを表し、それらの間の関係を示します。この情報は通常、グラフ・データベースに保存され、グラフ構造として視覚化されるため、ナレッジ「グラフ」という用語が使用されます。

ナレッジ・グラフは、ノード、エッジ、ラベルという3つの主要コンポーネントで構成されています。あらゆるオブジェクト、場所、人物がノードになることができます。エッジはノード間の関係を定義します。例えば、ノードはIBMのような顧客や、Ogilvyのような代理店である可能性があります。エッジは、この関係をIBMとOgilvy間の顧客関係として分類します。

Aは主語、Bは述語、Cは目的語をそれぞれ表します。

また、ナレッジ・グラフの定義はさまざまであり、ナレッジ・グラフはナレッジ・ベースやオントロジーと何ら変わらないことを示唆する研究があることも注目に値します。こうした研究では、この用語が2012年のGoogleのナレッジ・グラフによって普及したと主張しています。

オントロジー

オントロジーはナレッジ・グラフのコンテキストでも頻繁に言及されますが、ここでも、オントロジーとナレッジ・グラフの違いについてはまだ議論があります。最終的に、オントロジーはグラフ内のエンティティーの正式な表現を作成するのに役立ちます。これらは通常、分類法に基づいていますが、複数の分類法を含めることができるため、独自の個別の定義が維持されます。ナレッジ・グラフとオントロジーは、ノードとエッジなど同様の方法で表現され、リソース記述フレームワーク(RDF)トリプルに基づいているため、視覚化では互いに似ている傾向があります。

オントロジーの例として、マディソン・スクエア・ガーデンのような特定の会場を調べることが挙げられます。オントロジーは、時間などの変数を使用して、その場所でのイベントを区別します。ニューヨーク・レンジャーズのようなスポーツチームでは、シーズン中にそのアリーナで一連の試合が開催されます。これらはすべてホッケーの試合であり、すべて同じ会場で行われます。ただし、各イベントは日時によって区別されます。

Webオントロジー言語(OWL)とは、インターネットの永続性のためにオープン・スタンダードを推進する国際コミュニティーであるWorld Wide Web Consortium(W3C)によってサポートされて、広く採用されているオントロジーの一例です。最終的に、この知識の組織化は、人々やサービスがより効率的に情報にアクセスし、処理できるようにするために存在するデータベース、API、機械学習アルゴリズムなどの技術インフラストラクチャーによってサポートされています。

トラック上を転がるボールの3Dデザイン

最新のAIニュース + インサイト 


AIやクラウドなどについて、専門家が厳選したインサイトやニュースを、Thinkニュースレターで毎週お届けします。

ナレッジ・グラフの仕組み

ナレッジ・グラフは通常、さまざまなソースからのデータ・セットで構成されており、その構造は頻繁に異なります。スキーマ、ID、コンテキストが連携して、多様なデータに構造を提供します。スキーマはナレッジ・グラフのフレームワークを提供し、IDは基礎となるノードを適切に分類し、コンテキストはその知識が存在する設定を決定します。これらの要素は、複数の意味を持つ単語を区別するのに役立ちます。これにより、Googleの検索エンジン・アルゴリズムなどの製品は、ブランドである「Apple」と果物である「リンゴ」の違いを判別できるようになります。

機械学習を活用したナレッジ・グラフは、自然言語処理(NLP)を利用して、セマンティック・エンリッチメントと呼ばれるプロセスを通じてノード、エッジ、ラベルの包括的なビューを構築します。データが取り込まれると、このプロセスにより、ナレッジ・グラフは個々のオブジェクトを識別し、異なるオブジェクト間の関係を理解できるようになります。この実用的な知識は、関連性があり性質が類似する他のデータ・セットと比較され、統合されます。ナレッジ・グラフが完成すると、質問応答システムと検索システムは、指定されたクエリーに対する包括的な回答を取得して再利用できるようになります。消費者向け製品は時間を節約する能力を発揮しますが、同じシステムをビジネス環境にも適用して、手動によるデータ収集と統合作業を排除し、ビジネス上の意思決定をサポートできます。

ナレッジ・グラフを中心としたデータ統合の取り組みは、新しい知識の創造をサポートし、これまで実現できなかったデータ・ポイント間の接続を確立することもできます。

Mixture of Experts | ポッドキャスト

AIを解読する:1週間のニュースのまとめ

エンジニア、研究者、製品リーダーなど、世界をリードするパネリストがAIに関する最新のニュースとインサイトをお届けします。

ナレッジ・グラフのユースケース

消費者向けの人気のあるナレッジ・グラフが数多く存在し、企業全体の検索システムに対するユーザーの期待を高めています。これらのナレッジ・グラフには、次のようなものがあります。

  • DBPediaとWikidataは、Wikipedia.org上のデータに関する2つの異なるナレッジ・グラフです。DBPediaはWikipediaのインフォボックスのデータで構成されますが、Wikidataは二次的および三次的なオブジェクトに重点を置いています。どちらも通常はRDF形式で公開されています。
  • Googleナレッジ・グラフは、Google検索エンジン結果ページ(SERP)を通じて表示され、ユーザーの検索内容に基づいて情報を提供します。このナレッジ・グラフは、Freebase、Wikipedia、CIA World Factbookなどから取得したデータを基に、5億個を超えるオブジェクトで構成されています。

さらにナレッジ・グラフは、次のような他の業界でも応用できます。

  • 小売業:ナレッジ・グラフはアップセルおよびクロスセル戦略に使用され、人口統計グループ全体の個々の購入行動や人気の購入傾向に基づいて製品を推奨します。
  • エンターテイメント:ナレッジ・グラフは、Netflix、SEO、SNSなどのコンテンツ・プラットフォーム向けの人工知能(AI)ベースの推奨エンジンにも活用されています。これらのプロバイダーは、クリックやその他のオンライン・エンゲージメント行動に基づいて、ユーザーが読んだり視聴したりできる新しいコンテンツを推奨します。
  • 金融:このテクノロジーは、金融業界における顧客確認(KYC)やマネーロンダリング対策にも使用されています。これらにより、金融犯罪の防止と捜査に役立ち、銀行機関が顧客間の資金の流れを把握し、違反顧客を特定できるようになります。
  • ヘルスケア:ナレッジ・グラフは、医療研究内の関係性を整理および分類することで、ヘルスケア業界にもメリットをもたらします。この情報は、診断を検証し、個人のニーズに基づいて治療計画を特定することで医療提供者を支援します。
関連ソリューション
IBM® watsonx Orchestrate

IBM® watsonx Orchestrateを使用すると、スケーラブルなAIアシスタントとエージェントを簡単に設計し、反復的なタスクを自動化し、複雑なプロセスを簡素化できます。

watsonx Orchestrateの詳細はこちら
自然言語処理ツールとAPI

ライブラリー、サービス、アプリケーションの強力かつ柔軟なポートフォリオにより、人工知能のビジネス価値を促進します。

NLPソリューションはこちら
AIコンサルティングとサービス

AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。

AIサービスはこちら
次のステップ

IBM® watsonx Orchestrateを使用すると、スケーラブルなAIアシスタントとエージェントを簡単に設計し、反復的なタスクを自動化し、複雑なプロセスを簡素化できます。

watsonx Orchestrateの詳細はこちら NLPソリューションはこちら