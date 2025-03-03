IBM Researchのシニア・プログラム・マネージャーであるAbraham Danielsは、AI業界の焦点が、単により強力なシステムの構築から、実用的なシステムの開発へと変化していることを示しています。高度なAIの運用コストが大きな考慮事項となっているため、企業にとって、この変化は非常に重要である可能性があります。

モデルは単純な回答を提供するよりも、深い推論を行う際にはるかに多くの計算リソースを消費し、そのためコストも高くなります。ハイブリッド推論により、企業はタスクの複雑さに応じて計算レベルを調整することで、AI支出を最適化できます。

Anthropicは最近、" 拡張思考モード、" を備えたClaude 3.7 Sonnetをリリースしました。これにより、ユーザーは必要に応じてより詳細な分析をリクエストできます。IBMも同様に、Graniteモデルに「トグル」機能を装備して、ユーザーが強化的な推論を実行するタイミングを制御できるようにしました。

「私たちは、市場の他の推論モデルとは異なる哲学でハイブリッド推論を構築しました」とAnthropic社の広報担当者はIBM Thinkに語りました。「私たちのアプローチは、人間の脳の仕組みに基づいています。人間には、速い思考と深い思考という 2 つの別々の脳があるわけではありません。Anthropic では、推論は別個の機能ではなく、すべてのモデルの機能に深く統合する必要があるものであると考えています。このアプローチは、Claudeがすべてのアプリケーションにわたってお客様とどのように統合しているかに基づいています。マーケティング資料のブレーンストーミングなど、迅速な対応が必要な場合もありますが、複雑な財務分析や業界の研究など、より深く、長い思考が必要な場合もあります。当社は、これらの機能の両方を、お客様がアクセスして使用できるように、可能な限りシンプルかつコスト効率の高いものにしたいと考えました。」

このアプローチにより、AIの思考プロセスの透明性が高まります。「モデル自体はまだブラックボックスですが、少なくともアウトプットについては、モデルがどのようにしてその結論に至ったかを確認することができます」とDaniels氏は振り返ります。この可視性により、結果が改善され、説明可能性に関する懸念に対処することができます。これは規制された業界にとって特に重要なことです、と彼は言います。

Daniels氏と他の専門家は、この開発が、簡単な質問の不必要な計算オーバーヘッドを排除するという現実的なニーズに対処するものであると考えています。

「すべてのタスクに膨大な推論は必要なく、基本的に複雑な処理が必要な場合には、レイテンシとコストの両面でより多くのリソースを割く能力が得られるのです」と、IBM Researchの技術製品管理ディレクターであるKate Souleはポッドキャストで述べています。