Watson Discoveryのフィーチャー

Continuous Relevancy Training

詳細はこちら

最も関連性の高い回答を一定期間にわたって自動的にDiscoveryに学習させることができます。ユーザーとの対話から自動的に学習するため、Discoveryの関連性を手動でトレーニングする時間と労力を省くことができます。より典型的なモデルについて人工的に構成された学習セットではなく、実際の使用データに基づいてトレーニングします。データと使用法が変化するにつれてトレーニングが自動的に更新されるため、新しいトレーニング・データを手動で作成する必要がありません。

Watson Recommends

詳細はこちら

Discoveryアプリケーションのパフォーマンスをプロアクティブな方法でモニターし、向上させます。この新機能を使用して、合計照会数や上位キーワードなどの文書検索に関する定量的なメトリックの詳細を表示できます。また、一定期間にわたるメトリックの傾向が得られ、新しいコンテンツの追加、同義語の定義、追加のトレーニングの実行などが行われるため、パフォーマンスが向上します。

Point and Click

詳細はこちら

最新のフレームワークにより、コードの記述なしで接続できます。DiscoveryツールのUIで単純なポイント・アンド・クリック機能を使用するだけで、分析対象のデータ・ソースを選択できます。現在はBox、Sharepoint、Salesforceなど、複数のサイロ・ソースからデータを統合しており、まもなく20以上の追加ソース(データベース、Webサイト、コンテンツ管理システムを含む)を統合します。

組み込みNLP

詳細はこちら

Watson Discoveryには自然言語処理が組み込まれています。いくつかのオプションを選択するだけで、センチメント、エンティティー、コンセプト、意味役割などを抽出することができます。

Relevancy Training

詳細はこちら

Discoveryサービスをトレーニングして、お客様のコーパスのために照会結果の関連性を向上させることができます。トレーニング・データをDiscoveryに提供すると、このサービスはWatsonの機械学習技法を使用して、コンテンツと質問に含まれたシグナルを見つけ出します。シグナルを見つけると、このサービスは結果を並べ替えて、最も関連性の高い結果を上部に表示します。トレーニング・データを追加するにつれて、サービスの返す結果の順序が、より正確で洗練されたものになります。

Domain Customization

詳細はこちら

Discoveryは、お客様の分野に固有の用語を学習して理解することができます。Watson Knowledge Studioを使用して構築されたカスタム機械学習モデルを使用するだけで、コーパスのエンリッチメントをカスタマイズできます。

Passage Retrieval

詳細はこちら

Passage Retrievalには、検索基準を満たす特定の一節を、定義されたテキスト・チャンクとしてユーザーに返すオプションがあります。

Document Similarity

詳細はこちら

Document Similarityでは、お客様が既知のドキュメントIDを指定することができます。これにより、Discoveryが分析を実行して文書の最も重要な面を理解し、テキスト上で類似した文書をコレクション内から見つけることができます。

Anomaly Detection

詳細はこちら

Anomaly Detectionを使用して、時系列内の異常なデータ・ポイントを見つけ出し、詳細な検討ができるように、それらのポイントにフラグを立てます。異常検出の使用例として、ニュース・アラートの識別、イベントの検出、トレンドの検出などがあります。

Discovery News

詳細はこちら

Discovery Newsは継続的に更新される豊富なニュース記事のデータ・セットで、Discoveryに組み込まれています。

Knowledge Graph(ベータ版)

詳細はこちら

Knowledge Graphはお客様の企業の「ナレッジ・ハブ」として機能し、エンタープライズ・サーチ、要約、推奨エンジン、およびその他の意思決定プロセスに使用できます。Knowledge Graphは、エンティティーと関係を抽出して曖昧さを取り除き、アルゴリズム技術を使用して関係をエンリッチし、関連性アルゴリズムを使用して結果にランク付けをすることによって、非構造化データからカスタム・ナレッジ・グラフを自動的に作成します。

Element Classification

詳細はこちら

Element Classificationを使用すると、管理文書を迅速に解析して、重要な要素を変換、識別、分類することができます。最先端の自然言語処理を使用して、文書の要素からパーティー(対象者)、ネーチャー(要素のタイプ)、およびカテゴリー(特定のクラス)を抽出できます。

Document Deduplication(ベータ版)

詳細はこちら

Discovery Newsコレクションを照会する場合、またはプライベート・データ・コレクションに複数の同一の(またはほぼ同一の)文書が含まれている場合、Document Deduplicationを使用して照会結果からそれらを除外することができます。

Visual Insights(試験版)

詳細はこちら

Visual Insightsは実験的な機能です。これを使用すると、Discoveryが理解したセマンティック要素、関係、コンセプトで識別されたコネクションを視覚的に検討できます。コレクションについて詳しく学んでから、Discoveryを使用して、新しいアプリケーションや既存のソリューションに統合できる照会を作成し、ユーザーに必要な情報を提示することができます。

Document Segmentation

詳細はこちら

HTMLの見出しタグに基づいて、Word、PDF、およびHTMLの文書をセグメントに分割できます。一度分割すると、各セグメントは個別の文書となり、個別にエンリッチされ、索引付けされます。照会はこれらのセグメントを別個の文書として返すため、Document Segmentationを使用して、文書の個々のセグメントに対する集計を実行したり、文書でなくセグメントに対して関連性の高いトレーニングを実行したりすることができます。これにより、結果の再ランク付けが向上します。

Query Expansion

詳細はこちら

照会範囲を完全一致だけにとどめず、拡張することができます。例えば、「car」の照会を拡張して、「automobile」や「motor vehicle」も含めることができます。照会範囲の拡張は、Discovery APIを使用して照会拡張用語のリストをアップロードすることで可能です。通常、照会拡張用語は一般的な用語の同義語、反意語、または典型的なミススペルです。