その未来はすでに、スタンフォード大学のバイオエンジニアリング准教授であり、オープンでAIネイティブなロボット向けソフトウェアスタックであるOpenMindの創設者であるJan Liphardtにとって実現しつつあります。OpenMindは今年サンフランシスコで初のショップをオープンする予定です。

「これは2037年ではなく今年起きていることです」とLiphardt氏はIBM Thinkに語っています。「それは私たちだけではありませんでした」

SFロボットの長年のファンであるLiphardt氏は、架空のロボットと現実の産業機械とのギャップを観察しました。「私たちの多くは、人々がロボットと対話する映画を見たことがあります」と同氏は言います。「数年前まで、ロボットは産業用として、金属の断片を動かし、それを別の金属片に溶接するように作られていました。映画で見たりサイエンスフィクションで読んだりする種類のロボットと、私たちの周りに見た種類のロボットの間には、この大きなギャップがありました」

こうした状況は、生成AIブームの中で変化しました。

「私は数年前と同じようにLLMを考えていました」と同氏は言います。「一連のアウトプットをテキストから現実世界でのアクションに拡張できるかどうかが知りたいと思っていました」

同氏は、子供たちの宿題を手伝ったり、馴染みのないゲストに話しかけたり、さらには公園を地図化したりするなど、ホームロボットを制御するソフトウェアの作成を始めました。「LLMはコンピューター・コードを作成できるだけでなく、ハードウェアにコマンドを発行することもできます」とLiphardt氏は語りました。「それは私にとって本当にエキサイティングなものでした」

同氏は、LLMがデータ融合、つまり複数のソースからのデータを統合して一貫性のある有益なアウトプットを生成するプロセスなどのコア的な課題を解決すると信じています。「言語を使用して物理的な世界を説明することの利点の1つは、大規模な言語モデルの仕組みに自然と適合することです。つまり、大規模な言語モデルは、そのインプットを理解し、次に進め、そこからストーリーを生成するのに優れています」

それでも、すべてが意図したとおりに機能するわけではありません。たとえば、同氏のロボットの1つはホームレスに話しかける傾向があります。「もちろん、私たちはそれをプログラムしていませんでした」と同氏は言います。「しかし、ホームレスは恐怖であるという考えは、学習データの中に必ずあるものです」

「この[トレーニングデータのバイアス]はロボットに特有のものではありません」とLiphardt氏は語ります。「そして、私にとって重要なのは、それを観察し、テクノロジーを制御または管理するための適切な方法を考察することです。そして、それは完全に未解決の問題でもあります。アライメント・ガバナンスと大規模な言語モデルの接点を考察すると、これはどのロボット・ソフトウェアの取り組みよりもはるかに大きな問題です」