思考の連鎖(CoT)プロンプトとは

共同執筆者

Vrunda Gadesha

AI Advocate | Technical Content Author

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

Vanna Winland

AI Advocate & Technology Writer

Chain of Thought(CoT)は、大規模言語モデル(LLM)のアウトプットを強化するプロンプト・エンジニアリング手法であり、特に複数ステップの推論を伴う複雑なタスクに有効です。一貫した一連の論理ステップを使用して段階的な推論プロセスを通じてモデルを導くことで、問題解決を容易にします。

プロンプト・エンジニアリングは、人工知能において、インプット(プロンプト)を調整して最も正確なモデル出力を取得するために使用されます。この研究では、LLMの推論を引き出す思考の連鎖プロンプティングの概念が導入されています。1この論文では、モデルに中間推論ステップを生成するように促すことで、算術、常識、記号推論などの多段階の問題を正確に解決する能力が大幅に向上すると主張しています。

研究者たちは、LLMが自然言語で「口に出して考える」能力に触発され、パラメーターのサイズが増えるにつれて、推論の能力と精度も向上したと指摘します。このため、CoTプロンプティングは新たな能力、またはモデルのサイズや複雑さがスケールアップするにつれて現れる能力とみなされます。大規模なLLMは、大規模なデータセットでのトレーニングからより微妙な推論パターンを学習しているため、パフォーマンスが向上する傾向があります。

ただし、さまざまなベンチマークにわたって問題解決の精度を向上させる方法は、モデル・サイズの増大だけではありません。指示チューニングの進歩により、より小さなモデルでもCoT推論を実行できるようになりました。たとえば、IBM® Granite Instructモデルは、CoTタスクの指示プロンプトと模範で構成される特殊なトレーニング・データセットを使用してファイン・チューニングされます。模範とは、モデルが理想的な応答として使用するプロンプトの例です。

CoTプロンプティングが効果的なのはなぜですか?

思考の連鎖プロンプティングは、複雑な問題を管理可能な中間ステップに分解し、決定的な回答に順次導き出すことで、人間のような推論プロセスをシミュレーションします。2この段階的な問題解決構造は、推論プロセスが明確かつ論理的、効果的であることを確実にすることを目的としています。

標準のプロンプト形式では、モデル出力は通常、提供されたインプットに対する直接の応答です。例えば、「空は何色ですか?」というプロンプトを入力すると、AIは「空は青です」などのシンプルで直接的な応答を生成します。

しかし、CoTプロンプティングを使用して空が青い理由を説明するように要求すると、AIはまず「青」が何を意味するのか(原色)を定義します。AIは、大気によって他の色が吸収されるため、空が青く見えるのではないかと推測します。この応答は、AIが論理的な議論を構築する能力を示しています。

プロンプトを構築するには、ユーザーは通常、プロンプトの最後に指示を追加します。ユーザーは通常、「推論の手順を説明してください」や「段階的に回答を説明してください」などの指示をプロンプトに追加します。本質的に、このプロンプト手法は、LLMに結果を生成するだけでなく、その回答に至った一連の中間ステップの詳細も要求します。3

プロンプト・チェーンは、複雑なタスクを分解するために、相互に連続して構築される複数のプロンプトを使用して信頼性を向上させるために、生成AIアプリケーションで使用されるもう1つの一般的な方法です。プロンプト・チェーンやCoTなどの手法は、単に正しく聞こえる回答に飛びつくのではなく、問題を段階的に推論できるようにモデルを導きます。この方法は、モデルの推論の透明性を高めるため、オブザーバビリティーとデバッグにも役立ちます。これらの手法の主な違いは、プロンプト・チェーンでは、複数のプロンプトを順序付けしてタスクを段階的に分解するのに対し、CoTプロンプティングでは一つのプロンプト内でモデルの推論プロセスを引き出します。

プロンプトの先を考え、コンテキスト全体を把握する

Thinkニュースレターで業界ニュース、AIツール、プロンプト・エンジニアリングの最新トレンドを先取りしましょう。さらに、メールに直接お届けする新しい解説、チュートリアル、専門家の洞察にアクセスできます。IBMプライバシー・ステートメントをご覧ください。

購読ありがとうございます。登録が完了しました。

思考の連鎖プロンプティングはどのように機能しますか?

思考の連鎖プロンプティングは、大規模言語モデル(LLM)を活用して一連の推論ステップを明確に表現し、新しいタスクのための類似の推論チェーンを生成するようにモデルを導きます。これは、推論プロセスを説明する模範的なプロンプトによって実現され、複雑な推論の課題に対処するためのモデルの能力が向上します。4このプロンプト手法の流れを理解するために、古典的な数学用語の問題、つまり多項式を解くことに取り組んでみましょう。

サンプル:多項方程式を解くための思考の連鎖プロンプティングはどのように機能するか?

思考の連鎖(CoT)プロンプティングは、問題解決プロセスを分解して、LLMが一連の論理的ステップに従うようにガイドすることにより、多項式方程式を解くのに大いに役立ちます。5CoTプロンプティングが多項式方程式にどのように対処できるかを見てみましょう。

二次方程式を解く例を考えてみましょう。

インプット・プロンプト:二次方程式を解く:x2 - 5x + 6 = 0

このプロンプトをIBM watsonx.aiチャットに入力すると人間の質問とAI支援の回答との間の会話の内容を確認できます。

このタイプのアウトプットを生成するため、CoTの基礎は以下の画像のように機能します。思考の連鎖の最終的な回答は、「方程式x2 − 5x + 6 = 0の解はx = 3x = 2である」となります」

思考の連鎖のバリエーション

思考連鎖(CoT)プロンプティングは、さまざまな革新的なバリエーションに進化し、それぞれが特定の課題に対処し、独自の方法でモデルの推論能力を強化するように調整されています。これらの適応では、CoTの適用性を異なる領域に拡張するだけでなく、モデルの問題解決プロセスを改善します。6

ゼロショット思考の連鎖

zero-shot思考の連鎖バリエーションでは、モデル内の固有の知識を活用して、事前の具体的なサンプルや手元のタスクのファイン・チューニングなしで問題に取り組みます。このアプローチは、カスタマイズされたトレーニングデータが利用できない可能性のある新しい問題タイプや多様な問題タイプに対処する場合に特に役立ちます。7このアプローチでは、標準的なプロンプティングやfew-shotプロンプティングの特性を活用できます。

例えば、「フランスの国境に接している、国旗が赤と白で構成されている国の首都は何ですか?」という質問に取り組む場合、zero-shot CoTを使用するモデルは、組み込まれた地理と国旗の知識を利用してスイスという回答につながるステップを導き出します。そのようなクエリーについて明確にトレーニングされていないにもかかわらず、この回答にたどり着きます。

自動的な思考の連鎖

自動的な思考の連鎖(自動COT)は、効果的な推論経路の生成と選択を自動化することにより、プロンプトを作成するときの手動作業を最小限に抑えることを目的としています。このバリエーションは、CoTプロンプティングの拡張性とアクセシビリティを強化し、より広範なタスクとユーザーに対応します。8, 9

例えば、「5個のリンゴを購入して既に3個の場合、合計何個ですか」のような数学の問題を解決するために、自動CoTシステムは中間ステップを自動的に生成できます。例えば、「3個から始める」や「既存の3個にリンゴを5個追加」、最終的には「リンゴ総数 = 8」になるなどの工程が含まれ、人間の介入なしに推論プロセスを合理化できます。

マルチモーダルな思考の連鎖

マルチモーダル思考の連鎖は、CoTフレームワークを拡張して、テキストや画像などのさまざまなモダリティからのインプットを組み込むことで、モデルが複雑な推論タスクのために多様なタイプの情報を処理および統合できるようにします。10

例えば、混雑したビーチの風景の写真が提示され、「このビーチは夏に人気がある可能性は高いでしょうか?」と尋ねると、マルチモーダルCoTを採用するモデルでは視覚的な手がかりを分析できます。海岸の占有率、気象条件などの手がかりや、季節的な人気に関するテキストの理解など、モデルが詳細な応答を導き出すのに役立ちます。「ビーチは混雑していることから人気が高いことを示しており、夏にはさらに増加する可能性がある」という回答が考えられるかもしれません。

思考連鎖を促すこれらのバリエーションは、CoTアプローチの柔軟性と適応性を見せるだけでなく、AIの推論と問題解決能機能における将来の発展の大きな可能性を示唆しています。

AI Academy

AIの専門家になる

ビジネスの成長を促進するAIへの投資を優先できるように知識を習得します。今すぐ無料のAI Academyを試して、貴社のAIの未来をリードしましょう。

利点と限界

CoTプロンプティングは、複雑な推論タスクにおける大規模言語モデル(LLM)のパフォーマンスを向上させる強力な手法であり、精度、透明性、多段階推論能力の向上など、さまざまな領域で大きなメリットをもたらします。しかし、高品質のプロンプトの必要性、計算コストの増加、敵対的な攻撃に対する感受性、推論や理解における定性的な改善を評価する際の課題など、その限界を考慮することが不可欠です。これらの限界に対処することで、研究者や実務家は、さまざまなアプリケーションでのCoTプロンプティングの責任ある効果的なデプロイメントを確保できます。11

ソート・プロンプトの連鎖のメリット

ユーザーは、思考の連鎖プロンプティングの中で多くのメリットを得ることができます。例えば次のような課題があります。

  • プロンプト出力の向上:CoTプロンプトは、複雑な推論タスクをよりシンプルで論理的なステップに分解することで、LLMのパフォーマンスを向上させる。
  • 透明性と理解:中間推論ステップを生成することで、モデルがどのように結論に到達するのかが透明化され、意思決定プロセスがユーザーにとってより理解しやすくなる。
  • 多段階推論:問題の各コンポーネントに体系的に取り組むことで、CoTプロンプティングでは多くの場合、特に複数ステップの推論を必要とする課題において、より正確で信頼性の高い回答を導きます。多段階推論とは、複雑な論理演算をより小さな連続ステップに分割することで実行する能力を指します。この認知スキルは、複雑な問題を解決し、意思決定を行い、因果関係を理解するために不可欠です。
  • 細部へのこだわり:ステップ・バイ・ステップの説明モデルは、詳細な分解によって理解を促す教授法に似ているため、CoTプロンプトは教育的文脈で有用である。
  • ダイバーシティー:CoTは、数理推論、常識的な推論、複雑な問題解決など、幅広いタスクに適用でき、柔軟性の高い活用が実証されています。

思考プロンプトの連鎖の制限

ここでは、思考の連鎖を採用する際に発生する可能性のある限界がいくつかあります。
  • 品質管理:CoTプロンプティングの効果は、提供されるプロンプトの質に大きく依存するため、モデルを正確に誘導するためには、注意深く練られたサンプルが必要となります。
  • 高い計算能力:複数の推論ステップを生成および処理するには、標準的なシングルステッププロンプトと比較して、より多くの計算能力と時間が必要です。したがって、この手法はどの組織でも導入するコストが高くなります。
  • コンセプトのミスリード:もっともらしいが正しくない推論経路が生成され、誤解を招いたり、誤った結論に至る危険性がある。
  • 費用と労力がかかる:効果的なCoTプロンプトを設計するには、問題領域とモデルの機能を深く理解する必要があり、より複雑で労力がかかる。
  • モデルの過剰適合:プロンプトの推論のスタイルやパターンにモデルが過剰に適合する潜在的なリスクがあり、様々なタスクに対する一般化機能が低下する可能性があります。
  • 評価と検証:CoTは解釈可能性と正確性を高めることができるが、推論や理解の質的向上を測定することは困難である。これは、人間の認知に固有の複雑さと、言語表現を評価する主観的な性質によるものです。ただし、CoTプロンプトの有効性を評価するためにいくつかのアプローチを使用できます。お例えば、モデルの応答をベースライン・モデルまたは人間の専門家の応答と比較すると、相対的なパフォーマンスの向上についての洞察が得られます。さらに、LLMによって生成された中間推論ステップを分析することで、推論や理解の向上を直接測定することは難しいとしても、意思決定プロセスに関する貴重な洞察を得ることができる。

思考の連鎖の進歩

思考の連鎖(CoT)の進化は、自然言語処理(NLP)機械学習、急成長中の生成AI分野など、いくつかの領域にわたる相乗的な進歩の証です。これらの進歩は、CoTを複雑な問題解決の最前線に推進しただけではなく、さまざまなアプリケーションにおけるその利便性を強調しました。ここでは、主要な開発状況を掘り下げ、指定された用語を統合して、CoTの進歩状況の包括的な全体像を把握します。

プロンプト・エンジニアリングとオリジナルのプロンプト

プロンプト・エンジニアリングのイノベーションにより、モデルの理解と元のプロンプトとの相互作用が大幅に向上し、より微妙で文脈に沿った推論経路が可能になりました。この開発は、CoTの有効性を高度化する上で重要でした。12

記号推論と論理推論

記号推論タスクと論理的推論タスクへの統合により、モデルの抽象的思考と推論の能力が向上し、CoTによるロジックベースの課題への取り組みに大きな飛躍をもたらしました。13

例えば、記号推論は、2 + 3 = 5などの数式を解くことです。この場合、問題は構成要素(追加と数値)に分解され、モデルは学習した知識と推論ルールに基づいて正しい回答を導き出します。一方、論理的推論は、「すべての鳥は飛ぶことができるので、ペンギンは鳥である」など、前提や仮定から結論を導き出すことです。次にモデルは、提供された情報に基づいてペンギンが飛ぶことができるかどうかを判断します。CoTプロンプティングを記号推論タスクと論理的推論タスクに統合することで、LLMは抽象的思考と推論能力の向上を実証できるようになり、より複雑で多様な問題に取り組むことができるようになりました。

創造性の向上

生成AITransformerアーキテクチャーのアプリケーションによりCoTに革命が起こり、創造性と深みを示す洗練された推論パスの生成が可能になりました。この相乗効果により、CoTの適用可能性が広がり、教育機関向けの領域と実践領域の両方に影響を与えています。14

モデルの小規模化と自己一貫性

進歩により、より小さなモデルがCoT推論に効果的に関与できるようになり、高度な推論能力に民主的にアクセスできるようになりました。CoT内の自己一貫性に重点を置くことで、生成された経路の論理的な健全性を確保し、モデルによって導き出される結論の信頼性を高めることができます。15

思考の連鎖のユースケース

思考の連鎖(CoT)の方法論は、複雑な問題を理解しやすい推論ステップに分解することができるため、幅広い分野に適用されています。これらのユースケースは、CoTの汎用性だけでなく、システムが問題解決や意思決定タスクをどのように処理するかを変革する可能性も示しています。後続セクションでは、CoTが効果的に適用されたいくつかの代表的なユースケースについて説明します。

AIアシスタント

チャットボットにCoTを統合し、最先端のNLP技術を活用することで対話型AIが変革し、チャットボットはより深いレベルの理解と問題解決能力を必要とする、より複雑なやり取りを実行できるようになりました。

このような進歩は、総じて、CoTの能力が飛躍的に伸びたこととチャットボットとCoTモデルの統合が重要であることを意味します。また、AI主導の意思決定と問題解決プロセスに革命をもたらす可能性が浮き彫りになっています。チャットボットの対話機能とCoTモデルの高度な推論能力を組み合わせることで、より幅広いタスクやアプリケーションを処理できる、より高度で効果的なAIシステムを構築できるのです。

さらに、さまざまなアプリケーションとCoTモデルとの統合によって、AIシステムがユーザーのニーズや好みをよりよく理解し、それに対応できるようになり、全体的なユーザー体験を向上させることができます。自然言語処理(NLP)の手法をCoTモデルに統合すると、チャットボットがユーザー・インプットをより人間のように理解して応答できるようになり、より引き込まれる、直感的かつ効果的な対話体験を生み出せるようになります。

カスタマー・サービス用チャットボット

高度なチャットボットはCoTを活用して、顧客の問い合わせをよりよく理解し、対応しています。顧客の問題を処理しやすい単位に細かく分解することで、チャットボットはより正確で有益な応答を提供できるようになり、顧客満足度が向上し、人間の介入の必要性が減ります。

研究とイノベーション

研究者はCoTを利用して、複雑な科学的問題を解決する際の思考プロセスを構造化し、イノベーションを促進しています。このような構造化されたアプローチにより、探索のプロセスが推進され、新しい仮説の立案が可能になります。

コンテンツの作成と要約

コンテンツ作成において、CoTは思考や情報を論理的に整理することにより、構造化された概要や要約を生成し、コンテンツの一貫性と品質を高めます。

教育と学習

CoTは教育テクノロジー・プラットフォームで活用され、複雑な問題に対して段階的な説明を生成するのに役立っています。プロセスを理解することが最終的な回答と同じくらい重要である数学や科学などの科目では、特に価値があります。CoTベースのシステムは、問題解決の手順に沿って学習者をガイドし、理解と知識の定着が向上します。

AI倫理と意思決定

CoTは、特に倫理的な配慮が必要なシナリオにおいて、AI主導の意思決定の背後にある推論を明らかにするために重要です。透明性の高い推論経路を提供することによって、CoTにより倫理基準や社会規範に沿ったAI主導の意思決定を行うことができます。

これらのユースケースでは、さまざまな分野におけるCoTによる変革の可能性が明らかに示されています。また、問題解決と意思決定のプロセスを再定義するCoTの能力を垣間見ることができます。CoTが進化を続けるにつれて、用途が拡大し、この方法論が技術と社会の進歩を構成するものとしてさらに組み込まれることが予想されます。

CoTプロンプトは、人間の認知プロセスを模倣して複雑な推論タスクを実行するAIの能力が、飛躍的に進歩したことを示しています。推論の中間ステップを明確にすることで、CoTはLLMの問題解決能力を強化するだけでなく、透明性と解釈可能性も高めます。本質的な制限事項があるにもかかわらず、AIモデルの推論能力を拡張するために、CoTのバリエーションと用途の検討は今も続いています。これは、AIの認知機能が今後も強化されることを示しています。

関連ソリューション
IBM watsonx.ai

AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。

watsonx.aiの詳細はこちら
人工知能ソリューション

IBMの業界をリードするAIの専門知識とソリューションのポートフォリオを活用して、AIをビジネスの業務に利用しましょう。

AIソリューションの詳細はこちら
人工知能(AI)コンサルティングおよびサービス

IBMコンサルティングAIサービスは、企業がAIをトランスフォーメーションに活用する方法を再考するのに役立ちます。

AIサービスの詳細はこちら
次のステップ

AIを使用することで、IBM Concertはお客様のオペレーションに関する重要な洞察を明らかにし、改善のためのアプリケーション固有の推奨事項を提供します。Concertがどのようにビジネスを前進させることができるかをご覧ください。

Concertの詳細はこちら ビジネス・プロセス自動化ソリューションの詳細はこちら