ナレッジ・グラフですか?
黒と青の背景
ナレッジ・グラフ

ナレッジ・グラフ、関連するエンティティのコレクションを表すセマンティックメタデータのネットワークについて学びます。

注目の製品

IBM Watson Discovery

IBM Watson Assistant


ナレッジ・グラフとは?

セマンティックネットワークとも呼ばれるナレッジ・グラフは、実世界のエンティティのネットワークを表します。オブジェクト、イベント、状況、または概念-そしてそれらの間の関係を示しています。 この情報は通常、グラフデータベースに保存され、グラフ構造として視覚化され、知識「グラフ」という用語を促します。

ナレッジ・グラフは、ノード、エッジ、ラベルの3つの主要コンポーネントで構成されています。 任意のオブジェクト、場所、または人をノードにすることができます。 エッジはノード間の関係を定義します。 たとえば、ノードはIBMのようなクライアントであり、Ogilvyのようなエージェンシーである可能性があります。 エッジは、IBMとOgilvyの間の顧客関係として関係を分類します。

Aは主語を表し、Bは述語を表し、Cはオブジェクトを表します

ナレッジ・グラフの定義はさまざまであり、調査 (PDF、183 KB) (リンクはibm.comの外部にあります) があることも注目に値します。これは、ナレッジ・グラフが知識ベースまたはオントロジーと同じであることを示唆しています。 代わりに、この用語は2012年にGoogleのナレッジグラフによって普及したと主張しています。

オントロジー

オントロジーは知ナレッジ・グラフの文脈でも頻繁に言及されます。繰り返しになりますが、オントロジーがナレッジ・グラフとどのように異なるかについてはまだ議論があります。 最終的に、オントロジーは、グラフ内のエンティティの正式な表現を作成するのに役立ちます。 これらは通常、分類法に基づいていますが、複数の分類法を含めることができるため、独自の個別の定義を維持します。 知識グラフとオントロジーは同様の方法で (つまり、ノードとエッジを介して) 表され、 Resource Description Framework (RDF) トリプルに基づいているため、視覚化では互いに類似している傾向があります。

オントロジーの例は、マディソンスクエアガーデンのような特定の会場を調べる場合です。 オントロジーは、時間などの変数を使用して、その場所でのイベントを区別します。 ニューヨークレンジャースのようなスポーツチームは、そのアリーナでホストされるシーズンでゲームシリーズがあります。 それらはすべてホッケーゲームであり、すべて同じ会場にあります。 ただし、各イベント日時によって区別されます。

Webオントロジー言語 (OWL) は、広く採用されているオントロジーの例であり、インターネットの寿命に関するオープンスタンダードを擁護する国際コミュニティであるWorld Wide Webコンソーシアム (W3C) によってサポートされています。  最終的に、この知識の組織化は、データベース、API、機械学習アルゴリズムなどの技術インフラストラクチャによってサポートされます。これらは、人々とサービスが情報にアクセスしてより効率的に処理するのに役立ちます。


ナレッジ・グラフの仕組み

ナレッジ・グラフは通常、さまざまなソースからのデータセットで構成されており、構造が異なることがよくあります。 スキーマ、アイデンティティとコンテキストは、多様なデータの構造を提供するために協働します。 スキーマはナレッジ・グラフのフレームワークを提供し、IDは基礎となるノードを適切に分類し、コンテキストはその知識が存在する設定を決定します。 これらのコンポーネントにより、複数の意味で言葉を分類します。 これにより、Googleの検索エンジンアルゴリズムなどの製品で、ブランドのAppleと果物のAppleの違いを判断できます。

機械学習を活用したナレッジ・グラフは、自然言語処理 (NLP) を利用して、セマンティックエンリッチメントと呼ばれるプロセスを通じてノード、エッジ、ラベルの包括的なビューを構築します。 データが取得された場合、このプロセスにより、ナレッジ・グラフで個々のオブジェクトを識別し、異なるオブジェクト間の関係を理解できます。 次に、この実用的な知識が比較され、他のデータセットと統合されます。これらのデータセットは、本質的に関連性があり、類似しています。 ナレッジ・グラフが完成すると、質問応答および検索システムが、指定されたクエリに対する包括的な回答を取得して再利用できるようになります。 消費者向け製品は時間を節約する能力を示していますが、手動のデータ収集と統合作業をすることなくビジネスの意思決定をサポートするよう、同じシステムをビジネス環境に適用することもできます。

ナレッジ・グラフを中心としたデータ統合の取り組みは、新しい知識の作成をサポートし、これまで実現されていなかった可能性のあるデータポイント間の接続を確立することもできます。


ナレッジ・グラフの使用事例

多くの人気のある消費者向けのナレッジ・グラフがあり、企業全体の検索システムに対するユーザーの期待を設定しています。 これらのいくつかのナレッジ・グラフを含む:

  • DBPediaとWikidataは、Wikipedia.orgのデータに関する異なる2つのナレッジ・グラフです。 DBPediaはウィキペディアのインフォボックスからのデータで構成されていますが、ウィキデータは二次および三次オブジェクトに焦点を当てています。 どちらも一般的にRDF形式で公開されます。  
  • Googleナレッジ・グラフは、Google検索エンジンの結果ページ(SERP)で表され、ユーザーが検索した内容に基づいて情報を提供します。 このナレッジ・グラフは、5億を超えるオブジェクト、Freebase、Wikipedia、CIA WorldFactbookなどからのデータで構成されています。

ただし、ナレッジ・グラフは、次のような他の業界にも適用されます。

  • 小売:ナレッジ・グラフは、アップセルおよびクロスセル戦略用であり、個々の購入行動および人口統計グループ全体での人気のある購入傾向に基づいて製品を推奨します。
  • エンターテイメント:ナレッジ・グラフは、Netflix、SEO、ソーシャルメディアなどのコンテンツプラットフォーム用の人工知能 (AI) ベースのレコメンデーションエンジンにも活用されます。 これらのプロバイダーは、クリックやその他のオンラインエンゲージメント行動に基づいて、ユーザーが読んだり見たりできる新しいコンテンツを推奨しています。
  • ファイナンス:このテクノロジーは、金融業界でのKYC (Know-Your-Customer) およびマネーロンダリング防止イニシアチブにも使用されています。 これらは、金融犯罪の防止と調査をサポートし、銀行機関が顧客全体の資金の流れを理解し、準拠していない顧客を特定できるようにします。
  • ヘルスケア:ナレッジ・グラフは、医学研究内の関係を整理および分類することにより、医療業界にも利益をもたらしています。 この情報は、診断を検証し、個々のニーズに基づいて治療計画を特定することにより、プロバイダーを支援します。  

ナレッジ・グラフとIBM

IBM Cloud 、Watsonサービス、WatsonにStudioおよびオープンソース技術をサポートエンタープライズナレッジ・グラフ取り組みを使用できます。 ドキュメントから独自のナレッジ・グラフを作成し、さまざまなビジネスドメインから生成された非構造化テキストコンテンツから洞察を引き出します。

詳細については、IBMidにサインアップして、IBMCloudアカウントを作成してください


関連ソリューション

IBM Cloud

IBM CloudをRed Hatとともに利用することで、市場をリードするセキュリティー、企業の拡張性、オープンなイノベーションが可能になり、クラウドとAIのすべての可能性を引き出すことができます。


IBM Watsonの製品

Watson AIを活用してアプリケーションにAIを導入し、より正確な予測を実現します。


IBM Watson Studio

AIモデルを構築、実行、管理します。 オープンソース・コードやビジュアル・モデリングを使用して、任意のクラウド上でデータを準備し、モデルを構築できます。 結果の予測と最適化を行うこともできます。