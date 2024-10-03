نشأت فكرة أداة تحميل البيانات عالية الإنتاجية من مشكلات عملية لاحظها الباحثون أثناء تدريب النماذج، إذ كانوا يحتاجون إلى أداة تستطيع معالجة كميات كبيرة من البيانات عبر أجهزة متعددة، مع مواكبة وحدات المعالجة الرسومية (GPU) التي تزداد كفاءة باستمرار". وكما تشير IBM Research في مدونتها إلى الإصدار، "كل ذلك بفضل فريق من الباحثين الذين كانوا ببساطة يبنون الأدوات التي يحتاجونها لإنجاز المهمة".

يشرح Davis Wertheimer من IBM Research بعض التحديات التي قد تظهر أثناء التدريب واسع النطاق: "هناك قاعدة 80/20 عندما يتعلق الأمر بالتدريب واسع النطاق. حيث يركز ثمانون بالمئة من جميع المؤلفات المنشورة في المفاضلات الخوارزمية بين ذاكرة GPU والاتصالات والحوسبة. ولكن عندما تحاول بناء شيء ما فعلياً، تجد أنك تكرس 80% من الوقت لمواجهة كم هائل من المشكلات التطبيقية الأخرى، لأن سير العمل تحدده سرعة أشد نقاط الضعف (عنق الزجاجة).

بينما طور فريق IBM منصة تدريبهم، استمروا في مواجهة العقبات. ويلاحظ Wertheimer: "عندما نتطور بشكل أفضل في استخدام وحدات معالجة الرسومات (GPU) الخاصة بنا، فإن العقبات في كثير من الأحيان تكمن في أداة تحميل البيانات".

وقد أدى هذا الإدراك إلى عملية تطوير مزدوجة. ويوضح قائلاً: "لقد كانت هناك رحلة موازية: من ناحية تطوير منصة التدريب الخاصة بنا، ومن ناحية أخرى، العمل على تطوير أداة تحميل البيانات باستمرار لمواكبة متطلبات السرعة من منصة التدريب لتجنب أي عوائق أمامها".