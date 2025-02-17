あなたの猫はChatGPTよりも賢いかもしれません。人工知能は今や詩を書いたり、法科大学院の試験に合格したりできるようになりましたが、それでも、トラ猫が窓枠をよじ登ったり獲物に襲いかかったりするような基本的な推論能力には及んでいません。
AIが人間の知識を掌握する能力と、動物の物理世界の理解に匹敵できないというギャップは、よりインテリジェントなマシンを追求する上での重要な課題として浮上しています。MetaのチーフAI科学者である Yann LeCun氏は先週、パリで開催されたAIセーフティー・サミットでこの問題にスポットライトを当て、構造、ダイナミクス、因果関係の内部表現を形成するAIシステムの「世界モデル」が人工知能の進歩の鍵となる可能性があると主張しています。
しかし、一部の著名な研究者は、このアプローチが見かけほど画期的であるかどうかを疑問視しています。
「AIは1950年代から世界モデルを使用しており、 AIのいくつかのサブフィールドは世界モデルに完全に依存しています」とカリフォルニア大学バークレー校のコンピューター・サイエンス教授、Stuart J. Russell氏はIBM Thinkに語りました。「これは、数学が物理学に役立つ可能性を示唆するのと同程度の斬新性と独創性です。」
この議論では、事実上あらゆる領域で人間レベルの学習と推論に匹敵するかそれを超える一般人工知能（AGI）、つまりAIシステムを実現するための追求が激化していることが浮き彫りになっています。チェスや言語処理などの狭いタスクに優れた今日の特殊なAIシステムとは異なり、AGIは推論能力、物理的理解、適応性を組み合わせ、世界をより根本的に理解する必要があります。
大手テクノロジー企業はこの課題に対してさまざまなアプローチをとってきました。OpenAIはGPTシリーズを通じて言語モデルのスケールアップに注力し、より高度な推論を実現しています。Google DeepMindは、AlphaFoldやAlphaGoといったシステムを使用して特定のドメインをターゲットにしつつ、より一般的な機能を目指しています。一方、Metaはテキストだけではなく現実世界のインタラクションから学ぶことの重要性を強調しています。
「人間の知能を再現しようとするのはやめてください」とLeCun氏はサミットで述べました。「私たちは、猫やネズミの知能を再現することすらできないのです。どんな飼い猫でも、非常に複雑な行動を計画することができます。」
近年、AIシステムは特定の領域のベンチマークでスコアを急速に高めています。しかしLeCun氏は、研究者がモラベックのパラドックスと呼ぶものを指摘しています。これは、人間が簡単だと思うスキルは、機械にとっては習得が最も難しいことが多いという観察結果です。
「人間や動物ができて当然と考えていることは、複雑ではないと私たちは考えています。しかし実際は、とても複雑なのです」とLeCun氏は述べます。「そして、言語を操作したり生成したり、チェスをしたり、囲碁をしたりといった、人間に特有なことは、比較的簡単であることがわかりました。」
このパラドックスは、AIが一見基本的な物理的・知覚能力に苦戦している一方で、知的能力が必要とされるタスクには優れているというものであり、一部の専門家は懐疑的な見方をしています。
「一連の網膜画像から、例えばマトリックスの方程式に至るまでのプロセスには、人類において何万年もかかり、概念形成と数学化の累積的なプロセスが必要でした」とRussell氏は述べます。「現在のディープラーニング・システムでは、これに似たものは見たことがありません。」
現在の限界を説明するために、LeCun氏は驚くべき比較を指摘しました。現代のLLMは、何兆ものトークン（人間が読むのに50万年かかる量のテキスト）でトレーニングを行っているそうです。しかし、起きている時間がわずか約16,000時間しかない4歳児は、視覚だけで同等の量のデータを処理します。
「4歳の子どもは、視覚認識という形で最大規模のLLMと同じくらい多くのデータを見ています。目の見えない子どもにとっては、それは触覚で認識できます」とLeCun氏は述べます。「これはいろいろなことを物語っています。テキストに基づいてトレーニングしただけでは、決して人間レベルの知能に到達することはできません。」
この観察により、研究者は新たなアプローチを採用するようになりました。MetaのLeCun氏のチームでは、「汎用人工知能（AGI）」という用語を完全にやめ、「高度機械知能」（AMI）という用語を好んで使用しています。「その理由は、人間の知能が実際には非常に特殊であるため、それをAGIと呼ぶのはある種の誤かいを招きかねないからです」とLeCun氏は述べます。
LeCun氏は、AIの進化のあり方を全面的に再考する必要があると考えています。人間の脳をコピーしようとするのではなく、AIが世界について学習し、理解する方法そのものをを変ることを望んでいます。彼は、動画を見るだけで物理物体がどのように振る舞うかを学習するように、AIは「感覚」を通じて情報を取り込むことで、現実についての独自の心象を構築する必要があると主張しています。このようなAIシステムは、物事を一貫して記憶し、物事を成し遂げるために段階的に行動を計画する方法を知っている必要があります。
コンピューター科学者の意見は、AIシステムが世界についてどのように独自の理解を深めていくかという点で異なります。ワシントン大学名誉教授のPedro Domingos氏は、進歩は可能だがすぐには起こらないと考えています。「AIが独自の世界モデルを開発することは全面的に可能ですが、その方法がまだわかっておらず、さらなる研究が必要です」とIBM Thinkに語りました。
現在のAIの能力は、特に複雑な作業を処理する場合、人間レベルの推論に達していません。Russell氏は次のように述べています。「1960年代以降、シンプルで統一された世界モデルを使用すると、完全に解決不可能な推論および計画の問題が発生することがわかってきました。（休暇を計画するために、必要な8億回の筋肉活動の正確な順序を事前に把握することを想像してみてください。）」人間は情報処理の仕方が異なると彼は指摘します。「人間がこれを克服するために使う主なツールは階層です。つまり私たちは、大規模で高レベルのアクションから、このEメールで次の文字「i」を入力するために指を動かすなどの小さく低レベルのアクションに至るまで、さまざまな抽象化レベルで多くのモデルを操作しています。」
