自然言語生成(NLG)とは

共同執筆者

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

自然言語生成(NLG)とは

自然言語生成(NLG)とは、人工知能(AI)を使用して、構造化データと非構造化データから自然言語出力を作成することです。NLGにより、コンピューターと生成 AIアプリケーションが、人間が理解できる言語でユーザーと対話できるようになります。自然言語理解(NLU)とともに、NLGは自然言語処理のサブカテゴリーです。

NLGシステムは、Business Intelligence(BI)ツールやチャットボットなど、エンタープライズ製品とコンシューマー製品の両方ですでに広く使用されています。音声アシスタントはNLGを通じてユーザーとコミュニケーションを取ります。

ビジネス・リーダーは、NLGを使用して複雑なデータをテキストに生成して重要な知見を抽出します。AIモデルが人間の言語でアウトプットを生成するときは常に、それが職場でのNLGになります。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

NLGの種類

NLGには、抽出型と抽象型の2つの主要なタイプがあります。

  • 抽出型NLGは、ソース・テキストから正確な単語やフレーズを直接抽出します。これは、法律文書など、特定の文言が重要な場合に使用されます。抽象化NLGと比較すると、抽出型NLGは、新しいコンテンツをアウトプットするのではなく、ソース文書からコピーするため、よりシンプルです。

  • 抽象NLGは、ソース文書に基づいてパラフレーズを行い、新しいコンテンツを生成することで、新しいアウトプットを作成します。これはより複雑なプロセスであり、Transformerなどのより高度なモデルを必要とします。技術的な環境では抽出型NLGが好まれるのに対し、抽象型NLGはよりクリエイティブな用途でその力を発揮します。

オフィスでミーティングをするビジネスチーム

IBMお客様事例

お客様のビジネス課題(顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など)を解決した多岐にわたる事例のご紹介です。

NLGの仕組み

NLGは、構造化データと非構造化データのインプットを精緻化し、自然言語出力を生成するという多段階のプロセスを経て機能します。コンピューター科学者のEhud Reiter1によると、典型的なNLGプロセスの段階は以下のとおりです。

  • シグナル分析:NLGシステムは、最終的なアウトプットに必要なインプット・データを決定します。シグナル分析またはデータ分析の段階では、パターン認識によってコンテンツの主題とトピック間の関係が特定されます。インプット・データには、ユーザー・プロンプト、データベース・コンテンツ、およびPDF、ドキュメント、音声言語録音などの非構造化言語コンテンツが含まれます。エンティティー認識は、NLP システムが議論されている内容を理解するのに役立ちます。

  • データの解釈:NLPモデルはデータ分析段階の結果から知見を生成します。データが既に利用可能な洞察を用いて前処理されている場合、このステップは回避されます。NLPシステムは品詞を識別し、NLUを使用して構文と意味を評価し、意味を理解します。

  • 文書計画:この段階では、どの情報をどのような形式で伝えるかを特定します。NLGシステムは、利用できるデータとユーザー・プロンプトに応じて、最終的なアウトプットのアプローチを決定します。

  • マイクロプランニング: コミュニケーションの内容と形式を決定した後、NLGシステムは最終的なアウトプットの文と段落構造を計画します。

  • 表面実現: NLGシステムは計画を実行に移し、前のステップの結果に基づいて自然言語出力を生成します。

NLGとNLPの比較

NLGは、自然言語処理(NLP)、つまり人間の言語を理解して操作するために機械学習(ML)モデルを使用する自然言語処理(NLP)のコンピューター・サイエンスの一分野です。

また、コンテンツ生成、特に新しい書き言葉や話し言葉のアウトプットに関わるNLPの一部です。たとえば、対話型AIチャットボットはNLGを使用して、ユーザーのインプットにリアルタイムで応答します。

NLPは自然言語入力をデータに変換し、NLGはデータを使用して自然言語出力を生成します。

NLPは、コンピュータが人間の言語をどのように分析し理解するかを研究する、計算言語学の一分野です。NLPは計算言語学の実践です。

ディープラーニングと大規模言語モデル(LLM)の開発により、 NLPの進歩が可能になり、コンテンツ作成を処理する多くの生成AIアプリケーションを強化できるようになりました。

NLGとNLUの比較

自然言語理解(NLU)は、NLPのもう一つのサブセットです。NLUは、文法や言語的な意味に焦点を当てるのではなく、人間の言語を総合的に理解しようとします。NLUは、意味解析と構文解析を用いて、感情、感情、意図を含む自然言語入力を、文脈に沿って完全に理解します。

NLUは、コンピューターが自然言語入力を人間に近い方法で理解することを可能にします。人々が会話をする際、使われている言葉の定義以上のものを処理します。話し手の文字どおりの言葉の背後にあるより深い意味を自然に理解できるのです。

ソフトウェア・アプリケーションが予測テキストの選択肢を提供する場合、NLUを使用してユーザーの意図を理解し、NLGを適用して文を完成させます。NLP、NLU、NLGは連携して動作し、コンピューターがユーザーと通信できるようにします。

NLGのモデルと方法論

多くのNLGシステムは、トランスフォーマーなどの高度なAIモデルを使用して、トレーニングデータとユーザーのインプットから新しいテキストを作成します。

ただし、これらのモデルが開発される前に、NLGは他の手段によって実現されていました。NLGモデルと手法には、次のものがあります。

  • テンプレート

  • ルールベースのシステム

  • Transformer(トランスフォーマー)

テンプレート

テンプレートベースのシステムは、インプット・データとして変数を含む定義済みの文テンプレートを使用します。テンプレートは、最も初期かつ最もシンプルなNLGの一種であり、文と文書の構造が一貫しているコンテキストに適しています。しかし、テンプレートベースのシステムは、定義済みのユースケース以外には適応できません。

テンプレートの例としては、「[年][月]に、当社の[場所]店舗では、[商品]を[個数]個販売した」のようになります

このテンプレートはロケーションベースの売上報告には優れていますが、料理レシピの生成には適用できません。

ルールに基づいたシステム

ルールベース・システムは、一連の事前定義されたルールとロジックに従ってテキストを生成します。初期のルールベース・システムは、領域専門家の話し方や書き方を模倣するために開発されました。プログラマーは専門家にインタビューを行い、それに基づいてテキスト生成のための対応するルールを作成していました。

「if-then」システムは、ルールベースプログラミングの一般的な例です。例えば、天気予報用のNLGソフトウェアでは、気温が華氏32度(摂氏0度)を下回る場合、「氷点下」と表現するように指示することができます。

統計的機械学習アルゴリズム

隠れマルコフ連鎖などの統計的機械学習アルゴリズムは、大規模なデータセットのパターンを特定し、新しいデータを使用して予測と決定を行います。

現在のインスタンスに基づいて新しいインスタンスを生成します。NLGの場合、マルコフ連鎖やその他の統計モデルが、互いに後続する可能性の高い単語を生成します。

統計モデルはテンプレートやルールベースのシステムよりも柔軟ですが、大量のトレーニング用データが必要です。

ディープラーニング・モデル

ディープラーニング・モデルは、統計アルゴリズムにとどまらないAIテクノロジーの進歩であり、より自然なテキストを生成できます。カレント・ニューラル・ネットワーク(RNN)は、NLGに適用されるディープラーニング・モデルの一例です。

RNNは、文章内の単語などの連続データを処理し、機械翻訳などの知識を転送できます。

Transformer

トランスフォーマー・モデル・アーキテクチャーは、利用可能な最も効果的なNLGテクノロジーの一部を強化します。GPTやBERTなどのトランスフォーマーベースのモデルは、自己注意メカニズムを使用してインプット・シーケンス内の長距離依存関係を取得し、コンテキストをより深く理解します。

ChatGPT、Claude、その他のトランスフォーマーを搭載したチャットボットは、リアルな人間の言語アウトプットを生成できます。

自然言語生成のユースケース

NLGは、生成AIのランドスケープのあらゆる場所で見られ、AIが自然言語で人間と直接コミュニケーションするために使用されています。 Siriから感情分析まで、NLGのユースケースには次のようなものがあります。

  • 音声アシスタント: Siri、Alexa、その他の音声アシスタントは、NLGを使用して音声言語でユーザーのリクエストに応答します。また、音声認識にNLPとNLUを使用して、ユーザーが何を望んでいるかを理解します。

  • バーチャル・アシスタント: チャットボットとバーチャル・アシスタントはNLGを使用して顧客との対話を自動化します。多くの組織では、バーチャル・アシスタントを使用してカスタマー・サービスに関する初期の問い合わせに対応し、必要に応じて人間の担当者にエスカレーションします。バーチャル・アシスタントはNLGを通じてユーザーとやり取りすることもあります。

  • 機械翻訳: 機械翻訳は、機械学習モデルを使用して言語間で自動的に翻訳することです。NLGシステムはアウトプット生成を処理し、時間のかかる翻訳プロセスを簡素化します。人間の翻訳者やローカリゼーションの専門家は、必要に応じてアウトプットを検証および編集できます。

  • データの要約と報告:NLGシステムは、複雑なデータを理解しやすい要約やアウトラインに変換します。記事やレポートの集計と要約を合理化することで、予測をより効率的に行うことができます。ビジネス・リーダーは、データに裏付けされた意思決定のために、NLGを搭載したBIツールを使用しています。他の企業は、AIとNLGを使用して、顧客向けのコンテンツを作成しています。

  • コンテンツ生成:生成AIモデルが自然言語コンテンツを出力しているのであれば、それはNLGが機能している証拠です。企業は、製品の説明、Eメール・マーケティング・キャンペーン、ソーシャル・メディアの投稿、その他の短い形式のコンテンツを自動化するために、NLGを使用することを選択できます。

  • 感情分析:NLGシステムは、オーディエンスのフィードバックとコミュニケーションに基づいて、テキストの要約とレポートを作成します。企業は、製品レビュー、ソーシャル・メディア・プラットフォーム、フォーラムへの投稿、その他のオンライン場所からユーザー生成コンテンツを取得し、NLPとNLGを使用してユーザーの感情を特定できます。

関連ソリューション
IBM® watsonx Orchestrate

IBM® watsonx Orchestrateを使用すると、スケーラブルなAIアシスタントとエージェントを簡単に設計し、反復的なタスクを自動化し、複雑なプロセスを簡素化できます。

watsonx Orchestrateの詳細はこちら
自然言語処理ツールとAPI

ライブラリー、サービス、アプリケーションの強力かつ柔軟なポートフォリオにより、人工知能のビジネス価値を促進します。

NLPソリューションはこちら
AIコンサルティングとサービス

AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。

AIサービスはこちら
次のステップ

IBM® watsonx Orchestrateを使用すると、スケーラブルなAIアシスタントとエージェントを簡単に設計し、反復的なタスクを自動化し、複雑なプロセスを簡素化できます。

watsonx Orchestrateの詳細はこちら NLPソリューションはこちら
脚注

1 「Natural Language Generation」Ehud Reiter、2024年9月