IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
自然言語生成(NLG)とは、人工知能(AI)を使用して、構造化データと非構造化データから自然言語出力を作成することです。NLGにより、コンピューターと生成 AIアプリケーションが、人間が理解できる言語でユーザーと対話できるようになります。自然言語理解(NLU)とともに、NLGは自然言語処理のサブカテゴリーです。
NLGシステムは、Business Intelligence(BI)ツールやチャットボットなど、エンタープライズ製品とコンシューマー製品の両方ですでに広く使用されています。音声アシスタントはNLGを通じてユーザーとコミュニケーションを取ります。
ビジネス・リーダーは、NLGを使用して複雑なデータをテキストに生成して重要な知見を抽出します。AIモデルが人間の言語でアウトプットを生成するときは常に、それが職場でのNLGになります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
NLGには、抽出型と抽象型の2つの主要なタイプがあります。
抽出型NLGは、ソース・テキストから正確な単語やフレーズを直接抽出します。これは、法律文書など、特定の文言が重要な場合に使用されます。抽象化NLGと比較すると、抽出型NLGは、新しいコンテンツをアウトプットするのではなく、ソース文書からコピーするため、よりシンプルです。
抽象NLGは、ソース文書に基づいてパラフレーズを行い、新しいコンテンツを生成することで、新しいアウトプットを作成します。これはより複雑なプロセスであり、Transformerなどのより高度なモデルを必要とします。技術的な環境では抽出型NLGが好まれるのに対し、抽象型NLGはよりクリエイティブな用途でその力を発揮します。
NLGは、構造化データと非構造化データのインプットを精緻化し、自然言語出力を生成するという多段階のプロセスを経て機能します。コンピューター科学者のEhud Reiter1によると、典型的なNLGプロセスの段階は以下のとおりです。
シグナル分析:NLGシステムは、最終的なアウトプットに必要なインプット・データを決定します。シグナル分析またはデータ分析の段階では、パターン認識によってコンテンツの主題とトピック間の関係が特定されます。インプット・データには、ユーザー・プロンプト、データベース・コンテンツ、およびPDF、ドキュメント、音声言語録音などの非構造化言語コンテンツが含まれます。エンティティー認識は、NLP システムが議論されている内容を理解するのに役立ちます。
データの解釈:NLPモデルはデータ分析段階の結果から知見を生成します。データが既に利用可能な洞察を用いて前処理されている場合、このステップは回避されます。NLPシステムは品詞を識別し、NLUを使用して構文と意味を評価し、意味を理解します。
文書計画:この段階では、どの情報をどのような形式で伝えるかを特定します。NLGシステムは、利用できるデータとユーザー・プロンプトに応じて、最終的なアウトプットのアプローチを決定します。
マイクロプランニング: コミュニケーションの内容と形式を決定した後、NLGシステムは最終的なアウトプットの文と段落構造を計画します。
表面実現: NLGシステムは計画を実行に移し、前のステップの結果に基づいて自然言語出力を生成します。
NLGは、自然言語処理(NLP)、つまり人間の言語を理解して操作するために機械学習(ML)モデルを使用する自然言語処理(NLP)のコンピューター・サイエンスの一分野です。
また、コンテンツ生成、特に新しい書き言葉や話し言葉のアウトプットに関わるNLPの一部です。たとえば、対話型AIチャットボットはNLGを使用して、ユーザーのインプットにリアルタイムで応答します。
NLPは自然言語入力をデータに変換し、NLGはデータを使用して自然言語出力を生成します。
NLPは、コンピュータが人間の言語をどのように分析し理解するかを研究する、計算言語学の一分野です。NLPは計算言語学の実践です。
ディープラーニングと大規模言語モデル(LLM)の開発により、 NLPの進歩が可能になり、コンテンツ作成を処理する多くの生成AIアプリケーションを強化できるようになりました。
自然言語理解(NLU)は、NLPのもう一つのサブセットです。NLUは、文法や言語的な意味に焦点を当てるのではなく、人間の言語を総合的に理解しようとします。NLUは、意味解析と構文解析を用いて、感情、感情、意図を含む自然言語入力を、文脈に沿って完全に理解します。
NLUは、コンピューターが自然言語入力を人間に近い方法で理解することを可能にします。人々が会話をする際、使われている言葉の定義以上のものを処理します。話し手の文字どおりの言葉の背後にあるより深い意味を自然に理解できるのです。
ソフトウェア・アプリケーションが予測テキストの選択肢を提供する場合、NLUを使用してユーザーの意図を理解し、NLGを適用して文を完成させます。NLP、NLU、NLGは連携して動作し、コンピューターがユーザーと通信できるようにします。
多くのNLGシステムは、トランスフォーマーなどの高度なAIモデルを使用して、トレーニングデータとユーザーのインプットから新しいテキストを作成します。
ただし、これらのモデルが開発される前に、NLGは他の手段によって実現されていました。NLGモデルと手法には、次のものがあります。
テンプレート
ルールベースのシステム
統計的機械学習アルゴリズム
ディープラーニング・モデル
Transformer(トランスフォーマー)
テンプレートベースのシステムは、インプット・データとして変数を含む定義済みの文テンプレートを使用します。テンプレートは、最も初期かつ最もシンプルなNLGの一種であり、文と文書の構造が一貫しているコンテキストに適しています。しかし、テンプレートベースのシステムは、定義済みのユースケース以外には適応できません。
テンプレートの例としては、「[年][月]に、当社の[場所]店舗では、[商品]を[個数]個販売した」のようになります。
このテンプレートはロケーションベースの売上報告には優れていますが、料理レシピの生成には適用できません。
ルールベース・システムは、一連の事前定義されたルールとロジックに従ってテキストを生成します。初期のルールベース・システムは、領域専門家の話し方や書き方を模倣するために開発されました。プログラマーは専門家にインタビューを行い、それに基づいてテキスト生成のための対応するルールを作成していました。
「if-then」システムは、ルールベースプログラミングの一般的な例です。例えば、天気予報用のNLGソフトウェアでは、気温が華氏32度(摂氏0度)を下回る場合、「氷点下」と表現するように指示することができます。
ディープラーニング・モデルは、統計アルゴリズムにとどまらないAIテクノロジーの進歩であり、より自然なテキストを生成できます。カレント・ニューラル・ネットワーク(RNN)は、NLGに適用されるディープラーニング・モデルの一例です。
RNNは、文章内の単語などの連続データを処理し、機械翻訳などの知識を転送できます。
NLGは、生成AIのランドスケープのあらゆる場所で見られ、AIが自然言語で人間と直接コミュニケーションするために使用されています。 Siriから感情分析まで、NLGのユースケースには次のようなものがあります。
音声アシスタント: Siri、Alexa、その他の音声アシスタントは、NLGを使用して音声言語でユーザーのリクエストに応答します。また、音声認識にNLPとNLUを使用して、ユーザーが何を望んでいるかを理解します。
バーチャル・アシスタント: チャットボットとバーチャル・アシスタントはNLGを使用して顧客との対話を自動化します。多くの組織では、バーチャル・アシスタントを使用してカスタマー・サービスに関する初期の問い合わせに対応し、必要に応じて人間の担当者にエスカレーションします。バーチャル・アシスタントはNLGを通じてユーザーとやり取りすることもあります。
機械翻訳: 機械翻訳は、機械学習モデルを使用して言語間で自動的に翻訳することです。NLGシステムはアウトプット生成を処理し、時間のかかる翻訳プロセスを簡素化します。人間の翻訳者やローカリゼーションの専門家は、必要に応じてアウトプットを検証および編集できます。
データの要約と報告:NLGシステムは、複雑なデータを理解しやすい要約やアウトラインに変換します。記事やレポートの集計と要約を合理化することで、予測をより効率的に行うことができます。ビジネス・リーダーは、データに裏付けされた意思決定のために、NLGを搭載したBIツールを使用しています。他の企業は、AIとNLGを使用して、顧客向けのコンテンツを作成しています。
コンテンツ生成:生成AIモデルが自然言語コンテンツを出力しているのであれば、それはNLGが機能している証拠です。企業は、製品の説明、Eメール・マーケティング・キャンペーン、ソーシャル・メディアの投稿、その他の短い形式のコンテンツを自動化するために、NLGを使用することを選択できます。
感情分析:NLGシステムは、オーディエンスのフィードバックとコミュニケーションに基づいて、テキストの要約とレポートを作成します。企業は、製品レビュー、ソーシャル・メディア・プラットフォーム、フォーラムへの投稿、その他のオンライン場所からユーザー生成コンテンツを取得し、NLPとNLGを使用してユーザーの感情を特定できます。
IBM® watsonx Orchestrateを使用すると、スケーラブルなAIアシスタントとエージェントを簡単に設計し、反復的なタスクを自動化し、複雑なプロセスを簡素化できます。
ライブラリー、サービス、アプリケーションの強力かつ柔軟なポートフォリオにより、人工知能のビジネス価値を促進します。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。
1 「Natural Language Generation」Ehud Reiter、2024年9月