您的家猫可能比 ChatGPT 更聪明。虽然 AI 如今能写诗，能通过法学院考试，但它仍无法匹敌虎斑猫在窗台穿梭、扑击猎物的基本推理能力。
AI 虽已掌握大量人类知识，却无法具备动物对物理世界的理解能力，这一差距已成为研发更智能机器过程中的核心挑战。Meta 的首席 AI 科学家 Yann LeCun 上周在巴黎 AI 安全峰会上，将这一问题推至公众视野，他认为“世界模型”（即能对结构、动态及因果关系形成内部表征的 AI 系统）或许是推动人工智能发展的关键。
然而，一些前沿研究人员质疑这种方法是否如表面那般具有开创性。
“AI 自 20 世纪 50 年代起就开始使用世界模型，且 AI 的多个子领域完全依赖世界模型运转，” 加州大学伯克利分校计算机科学教授 Stuart J. Russell 告诉 IBM Think。“这种说法既无新意也谈不上巧妙，就好比说‘数学或许对物理学有用’一样。”
这场辩论凸显出，人们对实现人工通用智能 (AGI) 的追逐正愈演愈烈（AGI 是指在几乎所有领域都能达到或超越人类学习、推理水平的 AI 系统）。如今的专用 AI 系统仅擅长国际象棋、语言处理等特定任务，而 AGI 需从更本质层面理解世界，融合推理能力、物理认知与适应能力。
各大科技公司采用了不同策略应对这一挑战：OpenAI 依托其 GPT 系列，专注于扩大语言模型规模，以实现更复杂的推理能力；Google DeepMind 则借助 AlphaFold、AlphaGo 等系统深耕特定领域，同时朝着更通用的能力方向研发；与此同时，Meta 则强调从真实世界互动中学习的重要性，而非仅依赖文本数据。
“我们连重现猫或老鼠的智力都做不到，更别提人类智能了，”LeCun 在峰会上表示，“任何家猫都能规划出极为复杂的行动。”
近年来，AI 系统在特定领域基准测试中的得分飞速提升。但 LeCun 提到了研究人员口中的莫拉维克悖论 (Moravec's paradox)：人类觉得容易的技能，对机器而言往往最难掌握。
“人类和动物能轻松做到的事，我们会觉得理所当然、并不复杂，但实际上这类能力的实现难度极高，”LeCun 表示。“而我们原本认为人类独有的技能，比如语言运用、下棋、下围棋等，反倒是相对容易实现的。”
AI 在人类所谓智力要求极高的任务中表现出色，却在看似基础的肢体与感知能力上力不从心——这一悖论引发了部分专家的质疑。
“从视网膜图像序列到麦克斯韦电磁方程这样的知识，人类花了数万年才掌握，这是一个概念形成与数学化的累积过程，”Russell 表示。“在当前的深度学习系统中，我还没看到类似的能力。”
为了说明当前 AI 的局限性，LeCun 举了一个惊人的对比：现代大语言模型需用数万亿个词元训练，而人类要读完这些文本得花五十万年；但一个四岁的孩子仅清醒了约 16,000 小时，却能仅通过视觉感知处理等量的数据。
“一个四岁孩子通过视觉感知获取的数据量，堪比最大的大语言模型所处理的文本量；而盲童依赖的则是触觉，”LeCun 表示。"这说明了很多问题。仅靠文本训练，我们永远无法实现人类水平的智能。”
这一观察结果促使研究人员探索新的研发方向。在 Meta，LeCun 的团队甚至彻底弃用了“人工通用智能”这一术语，转而使用“高级机器智能”(AMI)。LeCun 解释道：“原因在于人类智能其实具有很强的专业性，因此称其为 AGI 本身就是用词不当。”
LeCun 认为，我们需要彻底重新思考 AI 的演进方向。他并非要复制人脑，而是希望改变 AI 认知、理解世界的方式。他认为，AI 需要通过“感知”获取信息，构建自身对现实的认知图景，比如通过观看视频来学习物理对象的行为规律。这类 AI 系统需要持续记忆信息，并掌握分步规划行动以完成任务的能力。
关于 AI 系统如何形成自身的世界认知，计算机科学家们意见不一。华盛顿大学名誉教授 Pedro Domingos 认为，实现这一目标是可行的，但无法一蹴而就。“构建能自主开发世界模型的 AI 是完全可行的，但我们目前还不清楚具体方法，仍需更多研究，” 他告诉 IBM Think。
当前 AI 的能力尚不及人类的推理水平，尤其是在处理复杂任务时。正如 Russell 所言：“自 20 世纪 60 年代起，我们就知道，使用简单统一的世界模型会引发完全难以解决的推理与规划问题。（试想一下，要规划一次假期，就得提前确定所需的 8 亿次肌肉活动的精确顺序——这根本不现实。）”他指出，人类的信息处理方式截然不同：“人类克服这一难题的核心工具是分层结构。我们会在多个抽象层级使用不同模型，上至宏观的高级行动…… 下至细微的低级操作，比如移动手指在这封邮件中输入下一个字母‘i’。”
IBM Granite 是我们开放式、性能优异、值得信赖的 AI 模型系列，专门为企业量身定制，并经过优化，可以帮助您扩展 AI 应用程序。深入了解语言、代码、时间序列和护栏选项。
企业认识到，他们无法使用不信任的基础模型来扩展生成式 AI。下载摘录内容以了解为何 IBM 及其旗舰产品“Granite 模型”被评为“出色表现者”。
深入了解 watsonx 组合中基础模型库，从容自信地为您的业务扩展生成式 AI。
借助 IBM 业界领先的人工智能专业知识和解决方案组合，让人工智能在您的业务中发挥作用。
通过增加 AI 重塑关键工作流程和运营，最大限度提升体验、实时决策和商业价值。