汎用人工知能（AGI）というアイデアについては、人間と同等に幅広いタスクを考察する、推論、学習できるAIであり、長い間議論されてきました。AGIは何年も先の話だと主張する専門家もいれば、実現しないかもしれないと考える専門家もいます。別のキャンプでは、AGIは優先すべき適切な目標ではないと主張する専門家もいます。IBMのシニア・リサーチ・サイエンティストであるMarina Danilevskyは、「他の非言語ドメインにおけるこれらのモデルの力を忘れてはなりません」と、ポッドキャストのエピソード「Mixture of Experts」で述べました。「このテクノロジーの活用できる場所を実際に広げれば、AGIを追いかける（代わりに）、もっと興味深く、より実際的で、より実用的な段階まで到達できます」

Sutton氏は慎重な姿勢をとります。彼は、AIが5年以内に人間レベルの知能に到達する可能性は4分の1で、15年以内に50％と推定しています。これは、AGIがまだ数十年先になると予測することが多い同業者と比較すると、非常に楽観的な予測です。

「まだブレークスルーが必要です」と彼は認めました。「でも、私たちは近づいています。最大の欠落部分は、どのようにしてAIシステムをラベル付けされたデータセットでなく、より自然な方法で経験から学習させるかです。」

Sutton氏が説明するように、最大の課題の1つは、人間が行うような長期的な計画と抽象化、つまり複雑な問題をより小さく、管理可能な断片に分解する能力を、AIに教えることです。

「街を歩きながら、すべての小さな筋肉の動きについては考えていません。道路を横断するという目標について考えます。AIは、より高い抽象度で、そのような学習を行う必要があります」とSutton氏は説明しました。

強化学習に関する彼の重要な貢献の1つは、AIがマイクロマネジメントに行き詰まってしまうのではなく、段階的に学習できるようにする時間的抽象化の概念です。これは、長い時間の期間にわたって推論する必要があるAIシステムにとって重要になる可能性があります。これは、今日のモデルが苦労している問題です。

たとえば、AIアシスタントは1つの質問に対する返答を生成することはできても、複数の対話にわたって論理的な会話を維持することや、フライト、ホテル、アクティビティの調整を伴う休暇の予約のような、時間をかけて展開する複雑なタスクを計画することに苦戦する可能性があります。Sutton氏は、強化学習とより優れた長期推論アルゴリズムが、この限界を克服する鍵となると考えています。