它外形可爱小巧，略显滑稽，并且支持使用 Python 编程。这就是 Reachy Mini，一款由 Hugging Face 设计的紧凑型开源机器人，面向开发者、普通消费者甚至儿童使用。自从 Hugging Face 在 7 月宣布发布以来，这款已开启预售的 Reachy Mini 超出了预期——据最近被这家 AI 公司收购的机器人公司 Pollen Robotics 称。
2025 年正成为具身 AI 的元年。根据纳斯达克的数据，市场预计将从2023年的127.7亿美元增长到2030年的1247.7亿美元。英伟达也宣布了首个开源人形基础模型 GROOT N1。机器人已经开始投入工作：Amazon 在 2025 年 7 月刚刚部署了其第 100 万台机器人，而 Google Waymo 到 2025 年 5 月已完成了超过 1000 万次出行服务 。
但机器人是否已为融入日常生活做好准备？IBM Think 就此采访了致力于实现这一未来的创始人们。
Anto Patrex 今年辞去了一家大型 AI 公司的工作，创立了 CosmicBrain，这家初创公司旨在应对机器人学最大的挑战之一：数据。
“很多人已经开始构建和使用 AI 来增强机器人技术，”他在接受 IBM Think 采访时表示。“这也是我辞职的原因之一。我感觉如果今天不投身这个领域，我会错过很多。”
CosmicBrain 构建仿真模型，利用通过任何可穿戴智能眼镜收集的人类任务数据来训练机器人。“看看那些具身智能公司开发的机器人，它们目前主要通过遥操作进行训练，”Patrex 解释说。“这种方法缺乏可扩展性，因此当它们被部署到实际的仓库或农田时，会缺乏多样化的数据集。”
这个想法是？打造一个面向所有人的、即插即用的机器人应用商店：无论是开发者、学生，还是愿意训练其机器人的公司。“我们正在为机器人创建一个类似 Google Play 商店或苹果 App Store 的应用商店，”他说。“这就像现代版的《黑客帝国》。我们将有数十万种技能集，你只需直接接入，机器人就会知道该怎么做。”
Patrex 表示，计划在未来两年内收集超过 5000 万小时的视频。下一步将是利用这些数据生成合成数据。
“有很多事情我们实际上无法在现实世界中完成，”他说。“如果机器人失手让包裹滑落怎么办？它该如何捡起？我们可以教会这些机器人做这些事，或者识别 100 种不同的水果，比如区分采摘樱桃与番茄、苹果和橙子。”
CosmicBrain 认为其对机器人生态系统潜在的影响，类似于 Scale AI（专注于数据标注）以及 Google、Microsoft、Meta、OpenAI 或 Anthropic 对生成式 AI 繁荣的影响。“只不过 Scale AI 出售了他们的数据，”他说。“我们不会出售我们的数据。相反，我们将以 API 形式出售技能集，因此数据将保留在公司内部。”
几天前，特斯拉首席执行官 Elon Musk 预测，特斯拉的 Optimus 机器人可能带来 30 万亿美元的收入， 而 Patrex 相信这一点。“很快，你会看到（每个人）……都在制造机器人、维修机器人、为机器人喷漆、训练机器人，”Patrex 说。“这将形成一个巨大的经济体。”
对于斯坦福大学生物工程学副教授、OpenMind 创始人 Jan Liphardt 而言，这个未来已在成为现实。OpenMind 是一个开放、AI 原生的机器人软件堆栈，计划今年在旧金山开设第一家门店。
“这一切发生在今年，而不是 2037 年，”Liphardt 告诉 IBM Think 。“而且不止我们一家在这么做。”
作为科幻机器人的长期爱好者，Liphardt 观察到了虚构机器人与其实现实生活中工业机器之间的差距。“我们许多人都看过人与机器人互动的电影，”他说。“直到几年前，机器人的制造目的还是为了移动一块金属并将其焊接到另一块金属上，用于工业用途。我们在电影中看到、在科幻小说中读到的那种机器人，与我们身边看到的机器人之间存在着巨大的差距。”
这种情况在生成式 AI 的繁荣浪潮中发生了改变。
“就像几年前一样，我开始研究 LLM，”他说。“我好奇地想看看，输出的集合是否能从文本扩展到现实世界中的行动。”
他开始编写软件来控制家用机器人——帮助孩子做作业、对陌生来客吠叫，甚至绘制公园地图。“LLM 不仅能编写计算机代码，还能向硬件发出命令，”Liphardt 说。“这让我非常兴奋。”
他认为，LLM 解决了诸如数据融合（即将来自多个来源的数据整合起来，以生成连贯且信息丰富的输出的过程）等核心挑战。“使用语言描述物理世界的一个优势在于，它自然地契合了大语言模型的工作方式——它们非常擅长理解、延续和基于这种输入生成故事。”
然而，并非一切都按预期运行。例如，他的一个机器人倾向于对无家可归者吠叫。“当然，这不是我们编程设定的，”他说。“但认为无家可归者可怕的想法，必定存在于训练数据中。”
“（训练数据中的）这种偏见并非机器人特有，”Liphardt 说。“对我来说，重要的是简单地观察到这一点，然后思考控制或治理这项技术的良好方法。而这同样是一个悬而未决的难题。如果你思考一下对齐治理与大语言模型的交叉领域，那是一个比任何机器人软件开发都要大得多的问题。”
推动开发人员的采用，或许是最终将机器人技术推向主流的关键。这正是 Hugging Face 进军该领域背后的赌注。“凭借更便宜的硬件和开源 AI，我们认为这可能是机器人技术的‘ChatGPT 时刻’，”Hugging Face 首席执行官 Clément Delangue 在最近一期 TBPN 播客节目中表示。
位于旧金山的开源人形机器人公司 K-Scale Labs 也基于同样的前提进行工作。他们将于 2025 年 12 月开始发货 K-Bot——一款具备基本移动能力、语音控制和预定义指令集的个人机器人。
“我认为，拥有一个真正开源、开发者优先的平台非常重要，”K-Scale Labs 创始人兼首席执行官 Benjamin Bolte 在一次采访中说道。
曾在特斯拉和 Meta 任职的 Bolte 相信，就像个人电脑或游戏主机的早期阶段一样，真正的增长将来自早期采用者、开发者和爱好者。
K-Scale Labs 将赌注押在几个关键用例以及开放性上。“试图规定一切应该如何运作是错误的做法，”Bolte 说。“如果我们真的能让人们去试验机器人，并亲自构建产品体验，我认为将会形成一个庞大的下游生态，就像针对人形机器人的应用开发人员生态系统一样。”
在基于对 Reachy 2（一款由 Pollen Robotics 开发制造的全开源人形机器人）的兴趣之上，该公司推出了 Reachy Mini——一款仅接受预购的个人机器人。这不是一个完整的人形机器人，但有望成为能在您家中移动、交谈、倾听并感知其环境的日常助手。
“其应用范围非常广阔，”Pollen Robotics（今年早些时候被 Hugging Face 收购的机器人公司）高级产品经理 Anne-Charlotte Passanisi 表示。“我们正在构建基础模块，让人们能够创造奇妙的事物。目标是打造一款任何人都能编程的、适合家庭的机器人。我们尚未完全实现，但潜力巨大。”
