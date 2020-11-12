NLP、NLU、NLGの3つの自然言語処理の概念の違い

ノートPCを一緒に使っている自信を持ったビジネスマンの画像

共同執筆者

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

Rishi Vaish

VP and Head

IBM Software, Cloud and AI Acceleration

自然言語処理（NLP）、自然言語理解（NLU）、および自然言語生成（NLG）はすべて関連するトピックですが、それぞれ異なります。大まかに言うと、NLUとNLGはNLPのコンポーネントにすぎません。この2つの用語は重なる部分があるため、会話の中で混同されることはよくありますが、この記事では、それぞれの用語を個別に定義し、その違いを要約して、曖昧さを明確にします。

 

自然言語処理とは何か？

計算言語学から発展した自然言語処理は、コンピューター・サイエンス、人工知能、言語学、データサイエンスなど、さまざまな分野の方法を使用して、コンピューターが書き言葉と口頭の両方の形式で人間の言語を理解できるようにします。計算言語学は言語の側面に重点を置いていますが、自然言語処理では、言語翻訳や質疑応答などのタスクを完了するために機械学習とディープラーニング技術を使用することを重視しています。自然言語処理は、非構造化データを取得し、それを構造化データ形式に変換することで機能します。これは、固有表現の識別（Named Entity Recognitionと呼ばれるプロセス）と、単語の語根を調べるトークン化、ステミング、レマティゼーションなどの方法を使用した単語パターンの特定を通じて行われます。例えば、「called」などの単語の拡張子（-ed）は過去形であることを示しますが、基本は現在進行形の動詞と同じ不定詞（to call）です。

NLPアルゴリズムは多数存在しますが、言語タスクのタイプごとに異なるアプローチが使用される傾向があります。例えば、隠れマルコフ連鎖は、品詞のタグ付けによく使用される傾向があります。リカレント・ニューラル・ネットワークは、適切なテキスト・シーケンスを生成するのに役立ちます。N-gramsは、単純言語モデル（LM）であり、文やフレーズに確率を割り当てて、応答の精度を予測します。これらの技術は連携して、チャットボットなどの一般的なテクノロジーや、AmazonのAlexaやAppleのSiriなどの音声認識製品をサポートします。しかし、その用途はそれより広く、教育や医療などの他の業種・業務にも影響を与えています。

自然言語理解とは

自然言語理解は自然言語処理のサブセットであり、テキストと音声の構文と意味の分析を使用して文の意味を判断します。構文は文の文法構造を指し、意味論はその意図する意味を暗示します。NLUは、関連するオントロジーである単語とフレーズ間の関係を指定するデータ構造も確立します。人間は会話の中でこのようなことを自然に行いますが、機械が異なるテキストの意図する意味を理解するためには、これらの分析を組み合わせる必要があります。

同音異義語と異形同音異義語を区別する人間の能力は、言語のニュアンスをうまく表しています。例えば、次の2つの文を考えてみましょう。

  1. アリスが流れに向かって泳いでいます。
  2. レポートの現在のバージョンは、フォルダー内にあります。

最初の文では、「current（流れ）」という言葉が名詞です。その前にある動詞「swimming（泳ぐ）」という動作は、読み手にさらなる文脈を提供するため、私たちは海の水の流れを指していると結論づけることができます。2番目の文では、「current（現在の）」という言葉を形容詞として使用しています。それが表す名詞「バージョン」はレポートの複数の反復を示しているため、ファイルの最新のステータスを参照していることがわかります。

これらのアプローチは、消費者の態度を理解するためにデータ・マイニングでも一般的に使用されます。特に、センチメント分析によりブランドは顧客からのフィードバックをより細かく監視できるようになり、ソーシャル・メディアの肯定的なコメントと否定的なコメントをクラスター分類したり、ネット・プロモーター・スコアを追跡したりできるようになります。企業は、否定的なセンチメントのコメントをレビューすることで、製品やサービス内の潜在的な問題領域をより迅速に特定し、それに対処することができます。

自然言語生成とは

自然言語生成は、自然言語処理の別のサブセットです。自然言語理解はコンピューターの読み取り理解に焦点を当てていますが、自然言語生成によりコンピューターは書き込みが可能になります。NLGは、何らかのデータ・インプットに基づいて人間の言語テキスト応答を生成するプロセスです。このテキストは、Text to Speechサービスを通じて音声形式に変換することもできます。

NLGには、情報の整合性を維持しながら、入力されたドキュメントから要約を生成するテキスト要約機能も含まれます。抽出要約は、That's Debatableで使用されているキー・ポイント分析を強化するAIイノベーションです。

当初、NLGシステムはテンプレートを使用してテキストを生成していました。いくつかのデータやクエリーに基づいて、NLGシステムはMad Libsのゲームのように空白を埋めていきます。しかし、時間の経過とともに、自然言語生成システムは、隠れマルコフ連鎖、リカレント・ニューラル・ネットワーク、Transformerのアプリケーションにより進化し、リアルタイムでのより動的なテキスト生成が可能になりました。

NLUと同様に、NLGアプリケーションは、形態論、辞書、構文、および意味に基づいて言語ルールを考慮し、応答を適切に表現する方法を選択する必要があります。次の3段階でこれに取り組みます。

  • テキスト計画：この段階では、一般的なコンテンツが論理的に作成され、順序付けされます。
  • 文の計画：この段階では、句読点とテキストの流れを考慮し、コンテンツを段落と文に分割し、必要に応じて代名詞や接続詞を組み込みます。
  • 実現：この段階では、文法の正確性が考慮され、句読点や活用語に関するルールが確実に遵守されるようになります。例えば、動詞runの過去形はrunではなくranです。

NLP、NLU、NLGの概要

  • 自然言語処理（NLP）は非構造化言語データを構造化データ形式に変換して、機械が音声とテキストを理解し、関連するコンテキストに応じた応答を定式化できるようにすることを目的としています。そのサブトピックには、自然言語処理と自然言語生成が含まれます。
  • 自然言語理解（NLU）は、文法と文脈による機械の読解に重点を置き、文の意図した意味を判断できるようにします。
  • 自然言語生成（NLG）は、機械による特定のデータセットに基づいたテキスト生成、または英語やその他の言語でのテキストの構築に焦点を当てています。

AI用にデータを導入

自然言語処理とそのサブセットは、医療診断やオンライン・カスタマー・サービスなど、今日の世界で数多くの実用的な用途で使用されています。

IBMの最新のNLP研究の一部をご覧いただくか、Watson Natural Language UnderstandingなどのIBM製品の一部をご覧ください。このテキスト分析サービスは、テキスト・データからカテゴリー、概念、エンティティー、キーワード、関係、センチメント、構文に関する洞察を提供し、ユーザーのニーズに迅速かつ効率的に対応できるようにします。AI向けにデータを大規模に分析および導入することで、ビジネスが正しく軌道に乗るのを支援します。
