Goldstein氏は、この画期的な進歩により、リアルタイムの文字起こしが強化され、音声アシスタントが改善され、企業向けのよりスマートなAIカスタマー・サービス・エージェントが実現できると指摘しています。アイデアは、AIモデルを人間の脳信号に近づけることで、特にノイズの多い現実世界の状況では、何十万時間ものトレーニングを必要とせずに性能を向上させることができるという考え方があります。

「ニューラル信号や人間のニューラル表現を使用して将来の音声テキスト変換モデルを制約すれば、これらのモデルのパフォーマンスが向上する可能性がある」とGoldstein氏は述べています。「でも推測の域を出ません。私たちはそれを直接テストしていません。」

文字起こしだけでなく、意味を脳の働きに似た形で表現したデータで訓練された、未来の音声アシスタントを想像してみてください。これにより、トレーニングに必要なデータ量が減り、コールセンターや運転支援システムなどの予測不可能な環境での堅牢性が向上します。

この研究は支援技術にも期待しています。内部言語シグナルを解読することで、変性疾患を抱えている人や話す能力を失った個人のコミュニケーションを回復できる可能性があります。大規模な言語モデルは足場として機能し、大まかなニューラル意図を文法的に一貫した言語に変換するのに役立ちます。

「問題が認知的ではなく、筋肉の制御に関するものであれば、最終的には脳から意味を解読し、人々のコミュニケーションを支援するデバイスを構築するかもしれません」と彼は言います。「しかし、この研究では侵入的な方法を用いました。実用化のために何かを構築している場合は、非侵襲的に動作する必要があり、それらの信号はよりノイズが多くなります。」

また推測のフロンティアでありマインドリーディングですGoldstein氏は慎重です。「話すことは、思考を形成するプロセスの一部です」と彼は言います。「私たちは、頭の中ですべてを完全に形にして、ただ『送信』を押すだけのわけではありません。概念レベルでは何かを把握できるかもしれませんが、必ずしもきめ細かい社内モノローグは必要ありません。」

それでも、この研究の初期の証拠からは、言葉が話される前の脳信号に意味論的コンテンツの痕跡が見つかっており、十分な解像度とコンテキストがあれば機械は誰かの意図を予測できる可能性があることを示唆しています。