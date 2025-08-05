それは、キュートで小さく、格好よく、Pythonでプログラム可能です。開発者、一般消費者、さらには子供も使用できるように設計されたHugging Faceのコンパクトなオープンソース・ロボット、Reachy Miniをご紹介します。そして、AI企業に最近買収されたロボティクス企業Pollen Roboticsによると、Hugging Faceが7月にリリースを発表して以来、事前販売されているReachy Miniは期待以上のものを提供しています。
2025年は、物理的なAIの年となりそうです。NASDAQによると、市場規模は2023年の127億7,000万米ドルから2030年までに1,247億7,000万米ドルに成長すると予測されています。NVIDIAはまた、初のオープン・ヒューマノイド基盤モデルであるGROOT N1を発表しました。そして、ロボットはすでに実用化されています：アマゾンは2025年7月に100万台目のロボットをデプロイしたばかりであり、GoogleのWaymoは2025年5月までに1,000万台以上の乗り物を提供しました。
しかし、ロボットは日常生活の準備ができているのでしょうか。IBM Thinkでは、その未来に向けて構築している創業者たちと出会いました。
Anto Patrex氏は今年、大手AI企業を辞め、ロボティクスの最大の課題の1つであるデータに取り組むスタートアップ企業、CosmicBrainを設立しました。
「多くの人がロボティクスを強化するためにAIの構築と使用を始めました」とIBM Thinkとのインタビューで述べています。「それが、私が仕事を辞めた理由の1つです。今日この分野にいてなければ、多くのことを逃すだろうと感じました」
CosmicBrain社は、ウェアラブルなスマートグラスを通じて収集された人間のタスクデータを使用して、ロボットをトレーニングするためのシミュレーションモデルを構築しています。「物理インテリジェンス企業のロボットを調べると、それらはテレオペレーションを使ってトレーニングされています」とPatrex氏は説明します。「これはスケーラブルな方法ではないので、実際の倉庫や農業の現場にデプロイするとき、多様なデータセットが得られません」
アイデアは？開発者、学生、ロボットのトレーニングに意欲的な企業など、すべての人を対象としたプラグアンドプレイ・アプリ・ストアです。「私たちはロボット用のGoogle PlayストアやApp Storeを作成しています」と同氏は言います。「それは現代のマトリックスのようなものです。当社には、プラグインできる何十万ものスキルセットがあり、ロボットは何をすべきかを理解します」
Patrex氏によると、今後2年間で5,000万時間以上のビデオを収集する計画だと述べています。次のステップは、このデータを使用して合成データを生成することです。
「現実の世界には、実際にできないことがたくさんあります」と同氏は言います。「ロボットが荷物を見逃したらどうなるでしょうか？どうやってそれを自動化するのでしょうか？ロボットにそうするように教えたり、100種類の異なる果物を認識するように教えたりできます。たとえば、さくらんぼを拾うのではなく、トマト、リンゴ、オレンジを拾うなどです」
CosmicBrain社は、データ・アノテーションに特化したScale AIや、Google、Microsoft、Meta、OpenAI、またはAnthropicが生成AIブームの中で行ったようなロボティクス・エコシステムに潜在的な影響を与える可能性があると考えています。「例外スケールAIはデータを販売しました」と同氏は言います。「当社はデータを販売することはありません。むしろ、スキルセットをAPIとして販売するので、データは会社に定着します」
数日前、テスラのCEOであるイーロン・マスクは、テスラのオプティマスロボットが30兆米ドルの収益をもたらす可能性があると予測し、Patrex氏はそれに参入しました。「間もなく、見ることができるでしょう。[皆さんが]ロボットの構築、ロボットの修理、ロボットの塗装、ロボットのトレーニングなどをしている光景を」とPatrex氏は言いました。「大きな経済になるでしょう」
その未来はすでに、スタンフォード大学のバイオエンジニアリング准教授であり、オープンでAIネイティブなロボット向けソフトウェアスタックであるOpenMindの創設者であるJan Liphardtにとって実現しつつあります。OpenMindは今年サンフランシスコで初のショップをオープンする予定です。
「これは2037年ではなく今年起きていることです」とLiphardt氏はIBM Thinkに語っています。「それは私たちだけではありませんでした」
SFロボットの長年のファンであるLiphardt氏は、架空のロボットと現実の産業機械とのギャップを観察しました。「私たちの多くは、人々がロボットと対話する映画を見たことがあります」と同氏は言います。「数年前まで、ロボットは産業用として、金属の断片を動かし、それを別の金属片に溶接するように作られていました。映画で見たりサイエンスフィクションで読んだりする種類のロボットと、私たちの周りに見た種類のロボットの間には、この大きなギャップがありました」
こうした状況は、生成AIブームの中で変化しました。
「私は数年前と同じようにLLMを考えていました」と同氏は言います。「一連のアウトプットをテキストから現実世界でのアクションに拡張できるかどうかが知りたいと思っていました」
同氏は、子供たちの宿題を手伝ったり、馴染みのないゲストに話しかけたり、さらには公園を地図化したりするなど、ホームロボットを制御するソフトウェアの作成を始めました。「LLMはコンピューター・コードを作成できるだけでなく、ハードウェアにコマンドを発行することもできます」とLiphardt氏は語りました。「それは私にとって本当にエキサイティングなものでした」
同氏は、LLMがデータ融合、つまり複数のソースからのデータを統合して一貫性のある有益なアウトプットを生成するプロセスなどのコア的な課題を解決すると信じています。「言語を使用して物理的な世界を説明することの利点の1つは、大規模な言語モデルの仕組みに自然と適合することです。つまり、大規模な言語モデルは、そのインプットを理解し、次に進め、そこからストーリーを生成するのに優れています」
それでも、すべてが意図したとおりに機能するわけではありません。たとえば、同氏のロボットの1つはホームレスに話しかける傾向があります。「もちろん、私たちはそれをプログラムしていませんでした」と同氏は言います。「しかし、ホームレスは恐怖であるという考えは、学習データの中に必ずあるものです」
「この[トレーニングデータのバイアス]はロボットに特有のものではありません」とLiphardt氏は語ります。「そして、私にとって重要なのは、それを観察し、テクノロジーを制御または管理するための適切な方法を考察することです。そして、それは完全に未解決の問題でもあります。アライメント・ガバナンスと大規模な言語モデルの接点を考察すると、これはどのロボット・ソフトウェアの取り組みよりもはるかに大きな問題です」
開発者の導入を促進することで、最終的にはロボティクスを主流にすることができるかもしれません。それがHugging Faceの宇宙への動きの背後にある賭けです。「より安価なハードウェアとオープンソースのAIがあれば、これはロボティクスにとってChatGPTの瞬間になると考察する」と、Hugging FaceのCEOであるClément DelangueはTBPNの最近のポッドキャストエピソードで語りました。
サンフランシスコに本拠を置くオープンソースのヒューマノイドロボット工学企業であるK-Scale Labsも、同じ施設で取り組んでいます。基本的な運動、音声制御、事前定義されたコマンドセットを備えたパーソナルロボットであるK-Botの出荷を2025年12月に開始する予定です。
K-Scale Labsの創設者兼CEOであるBenjamin Bolte氏は、インタビューでこう述べています。「オープンソースの開発者向けプラットフォームを持つことは非常に重要だと思います」
元TeslaおよびMetaエンジニアであるBolte氏は、PCやゲーム機の初期の頃と同様に、真の成長は早期導入者、開発者、愛好家からもたらされると信じています。
K-Scale Labsは、いくつかの重要なユースケースとオープン性に賭けています。「すべてがどのように機能すべきかを規定しようとするのは間違ったアプローチです」とBolte氏は言います。「人々が実際にロボットを実験し、製品エクスペリエンスを自分たちで実際に構築できれば、ヒューマノイドのためのアプリ開発者エコシステムのような、大規模な下流が生じると考えています」
Pollen Roboticsが開発・製造した完全にオープンソースのヒューマノイドロボット、Reachy 2への関心を受けて、同社は予約注文のみで入手可能なパーソナルロボット、Reachy Miniを開発しました。これは完全なヒューマノイド・ロボットではなく、家の内を動き、話し、聞き、環境を視覚化することができる日常的なアシスタントの可能性があります。
「アプリケーションの範囲は膨大です」と、今年の初めにHugging Faceに買収されたロボティクス企業、Pollen Robotics社のシニア・プロダクト・マネージャーであるAnne-Charlotte Passanisi氏は言います。「私たちは、人々が素晴らしいものを作り出せるようにするためのブロックを構築しています。目標は、誰でもプログラムできる家族向けロボットです。当社はまだその段階にありませんが、その可能性は計り知れません」
