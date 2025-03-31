OpenAIのo1、DeepSeek-R1、GoogleのGemini 2.5などの推論モデルがAIインテリジェンス・ベンチマークのトップを競う中、AIの統合を検討する企業は、「モデルの肥大化」と呼ばれるものにますます警戒するようになっています。これは、モデルが不必要に大きく複雑になり、計算コストとモデルのトレーニング時間が増加し、企業が必要とする応答を提供できる速度が低下するという現象です。

OpenAIのo1とDeepSeek-R1は、思考の連鎖（CoT）推論を使用して、複雑な問題をステップに分割し、前例のない性能と以前のモデルよりも高い精度を達成しています。しかし、CoTは推論中に膨大な計算リソースを要求し、その結果、出力時間が長くなり、高遅延が発生することになるのだとIBM VP兼AIインフラストラクチャー・ポートフォリオ・リーダーのVolkmar UhligはIBM Thinkのインタビューで語っています。

Atom Of Thoughts（Aot）からChain of Draft（Cod）に至るまで、新クラスの新たなプロンプト手法が登場して、さまざまな新しい論文で説明されるようになり、モデルがより迅速に問題を解決できるよう支援することで、CoTの効率性と精度を高め、コストやレイテンシーを削減しようとしています。

AI科学者でありスタートアップ企業の創業者であるLance Elliott氏は、思考の連鎖の新しいオフショットをプロンプト・エンジニア用ツールキットのバリエーションだと考えています。「一般的な家庭工作ツールキットには通常のハンマーが入っていますが、これがCoTに当たります」とIBM Thinkで語っています。「AoTは、ドライウォールの切断や調整が必要な状況に使用される特殊なハンマーを使用するようなものです。ドライウォール作業には通常のハンマーを使用することもできますが、ドライウォール用ハンマーがあり、適切な使用方法を知っているのであれば、それを使用することが推奨されます。」

IBMのAIテクニカル・ソリューション・アーキテクトであるVyoma Gajjar氏は、これらの新しいCoTは、特に「小規模なモデル用に、特定のユースケースに対する正確な回答を得られるよう、よりコスト効率の高い方法を探している」企業にとって、可能性を秘めていると考えています。