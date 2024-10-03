Gagasan untuk pemuat data throughput tinggi berasal dari masalah praktis yang diamati para ilmuwan riset selama pelatihan model, karena pekerjaan mereka membutuhkan alat yang dapat memproses data dalam jumlah besar di beberapa perangkat—semua sambil mengikuti GPU yang semakin efisien. Seperti yang dicatat oleh IBM® Research dalam blognya tentang rilis tersebut, “Ini semua berkat tim peneliti yang hanya membangun alat yang mereka butuhkan untuk menyelesaikan pekerjaan.“

Davis Wertheimer dari IBM® Research menjelaskan beberapa tantangan yang dapat muncul selama pelatihan skala besar: “Ada aturan 80/20 dalam hal pelatihan skala besar. Delapan puluh persen dari semua literatur yang diterbitkan melihat pertukaran algoritmik antara memori GPU dan komunikasi dan komputasi. Tetapi ketika Anda benar-benar mencoba membangun sesuatu, 80% dari waktu, Anda dapat bergantung pada ekor yang sangat panjang dari semua masalah praktis lainnya karena pipa berjalan dengan kecepatan hambatan tersempit.”

Saat tim IBM® mengembangkan platform pelatihan mereka, mereka terus menghadapi kemacetan. “Ketika kita menjadi lebih baik dan lebih baik dalam menggunakan GPU kita, semakin sering hambatannya adalah pemuat data,” kata Wertheimer.

Realisasi ini mengarah pada proses pengembangan ganda. “Ada perjalanan paralel, di satu sisi, mengembangkan platform pelatihan kami, dan di sisi lain, terus mengembangkan pemuat data kami untuk mengimbangi tuntutan kecepatan dari platform pelatihan kami agar tidak terjadi kemacetan,” jelasnya.