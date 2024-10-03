高スループットのデータ・ローダーのアイデアは、研究者がモデルのトレーニング中に観察した実用的な問題から生まれました。作業には、進歩的に効率的なGPUを維持しながら、複数のデバイスで大量のデータを処理できるツールが必要だったからです。IBM Researchがこのリリースに関するブログで述べているように、「これはすべて、単に仕事を成し遂げるために必要なツールを作っていた研究者チームのおかげである」。

IBM ResearchのDavis Werheimer氏は、大規模なトレーニングの際に発生する可能性のある課題のいくつかを次のように説明しています。「大規模なトレーニングに関しては、80/20ルールのようなものがあります。公開されているすべての文献の80％は、GPUメモリと通信および計算の間のアルゴリズムのトレードオフに関するものです。しかし、実際に何かを構築しようとすると、時間の80%は、パイプラインが最も狭いボトルネックの速度で実行されるため、他のすべての現実的な問題の長大なロングテールに依存する可能性があります。」

IBMチームはトレーニング・プラットフォームを開発しながら、ボトルネックに直面し続けていました。「GPUの使用がますます向上するにつれて、データ・ローダーがボトルネックになることが増えています」とWertheimer氏は観察しています。

この認識により、二重の開発プロセスが生まれました。「一方で、トレーニング・プラットフォームを進化させ、もう一方ではデータ・ローダーを絶えず進化させて、トレーニング・プラットフォームからの速度要求に遅れを取らず、ボトルネックを避けるようにすることができました」と彼は説明します。