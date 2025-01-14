يعرف الطفل الصغير أنه يجب ألا يضع مجموعة مكعبات كبيرة فوق المكعبات الأصغر. روبوت؟ ليس كثيرًا. على الأقل حتى الآن.
تتفوق نماذج الذكاء الاصطناعي التقليدية في معالجة النصوص والبيانات الرقمية، لكنها تواجه صعوبة في الفيزياء الأساسية التي يفهمها الأطفال بشكل طبيعي. وتهدف NVIDIA إلى تغيير ذلك باستخدام NVIDIA Cosmos، وهي منصة جديدة تم الإعلان عنها في 2025 والتي تعلم الآلات الكيفية التي يعمل بها العالم المادي.
تركز التقنية على "النماذج العالمية"، وهي أنظمة الذكاء الاصطناعي التي تشكل تمثيلات داخلية للبنية والديناميكيات والعلاقات السببية. يمكن لهذه النماذج أن تغير كيفية تعامل الروبوتات والمركبات ذاتية القيادة مع بيئات العالم الحقيقي والمساعدة في مجالات مثل التنبؤ بالطقس والطب.
يقول Juan Bernabé-Moreno، مدير البحث IBM في أوروبا لأيرلندا والمملكة المتحدة: "النماذج العالمية تغير بشكل جذري كيفية إدراك الأنظمة وتفاعلها مع بيئاتها". "فعوضاً عن الاكتفاء بتحويل المدخلات إلى مخرجات، تقوم هذه النماذج بإنشاء خرائط ذهنية داخلية تظهر الهيكل، وتكشف آليات الحركة، وتحدد العلاقات بين السبب والنتيجة". وهذا ما يُمكّن من التعامل مع البيانات غير المنظمة بمرونة أكبر، والتكيف مع الظروف غير المرئية، واستنتاج المعلومات بناءً على عدد أقل من الأمثلة أو التعليمات المباشرة.
تتضمن منصة Cosmos نماذج تأسيسية يمكنها إنشاء محاكاة قائمة على الفيزياء لغرض التدريب. أنظمة الذكاء الاصطناعي، إلى جانب الأدوات المتقدمة، التي تقول NVIDIA إنها تستطيع معالجة وتصنيف 20 مليون ساعة من الفيديو في أسبوعين فقط باستخدام منصتها Blackwell – وهي مهمة كانت ستستغرق أكثر من ثلاث سنوات باستخدام معالجات مركزية تقليدية.
بينما تقوم نماذج الذكاء الاصطناعي الأخرى بتوليد النصوص أو الصور، تركز Cosmos على التفاعلات القائمة على الفيزياء في البيئات الصناعية وبيئات القيادة. يمكن للمطورين تخصيص النظام باستخدام بياناتهم الخاصة، مثل لقطات من روبوتات المستودعات أو المركبات ذاتية القيادة. وقد جذبت المنصة بالفعل شركاء مثل Uber، التي ترى فيها مسارًا سريعًا محتملاً نحو المركبات ذاتية القيادة.
تقوم NVIDIA بإصدار النماذج بموجب ترخيص مفتوح من خلال منصات مثل Hugging Face. يصف الرئيس التنفيذي Jensen Huang ذلك بأنها قد تكون "نقطة تحول مثل ChatGPT" محتملة في مجال الروبوتات، مشيرًا إلى أن نماذج الأساس يمكن أن تضفي طابعًا ديمقراطيًا على الذكاء الاصطناعي المادي، تمامًا مثلما أحدثت نماذج اللغة الكبيرة (LLMs) تحولاً في عملية توليد النصوص.
أبدى Armand Ruiz، نائب رئيس قسم المنتجات في IBM Software والمتخصص في منصات الذكاء الاصطناعي، رأيه في مشروع Cosmos في منشور على LinkedIn، واصفاً نظام تدريب الروبوتات بأنه "تحفة تقنية"... يمثل النظام المفتوح المصدر، الذي تم تدريبه على 20 مليون ساعة من اللقطات الواقعية، محاولة Nvidia إنشاء نماذج أساس لحركة الروبوتات وتفاعلها.
كتب Ruiz أن "الأفضل هو أن المشروع مفتوح المصدر!"، مشيرًا إلى أن Cosmos يمكنها محاكاة سيناريوهات مثل سقوط الصناديق في المستودعات، وتسمح للشركات بتخصيص التدريب باستخدام بياناتها الخاصة. يعمل النظام مع منصة المحاكاة Isaac الخاصة بـ NVIDIA، على الرغم من أن أدائه في العالم الحقيقي لم يتم اختباره بعد.
استخدم باحثو IBM هذا المفهوم في تنبؤات الطقس من خلال نموذج Prithvi-Climate-and-Weather الأساسي. يقول Moreno: "لقد استوعب النموذج آليات الحركة الفيزيائية للعمليات العالمية التي تحدث في الغلاف الجوي". "يمكن أن يُستخدم لإنشاء محاكاة تلتزم بالقوانين الفيزيائية، ولإجراء تنبؤات بمستويات تفصيلية متعددة، بالإضافة إلى تصغير النطاق إلى دقة مختلفة".
دخلت ثلاث شركات في هذا المجال: Uber، وشركة Figure AI لصناعة الروبوتات، ومطور المركبات الذاتية القيادة Waabi، حيث وقعت جميعها لتنفيذ هذه التقنية. تأتي المنصة بترخيص نموذج مفتوح يتيح التخصيص.
أوضح Yann LeCun كبير علماء الذكاء الاصطناعي في Meta، أن نموذج العالم هو نظام يراقب بيئته ويتوقع ما قد يحدث لاحقًا، مع الأخذ في الاعتبار معرفته الحالية والعوامل المجهولة التي قد تؤثر على النتائج المستقبلية. ويشير إلى أن نماذج لغة الذكاء الاصطناعي الحالية تستخدم نسخة أبسط من هذا النهج: فهي تنظر فقط إلى المعلومات الماضية لإجراء التنبؤات، دون أخذ الإجراءات الممكنة المختلفة أو المتغيرات المجهولة في الحسبان.
إن قدرة النموذج العالمي على محاكاة السيناريوهات قبل تطبيقها في العالم الحقيقي يمكن أن توفر المال على الشركات وتجنبها وقوع الحوادث في مجال الروبوتات.
يقول Moreno: "تتيح النماذج العالمية للآلات إمكانية تخطيط الحركات والتفاعلات في مساحات محاكاة، والتي غالبًا ما تسمى 'التوائم الرقمية'، قبل محاولة تنفيذها في العالم المادي". "يقلل هذا بشكل كبير من تكلفة التجربة والخطأ، ويخفف من مخاطر السلامة ويسرع ويسرّع عملية تدريب الآلات على مهام مثل التجميع في المصانع، أو الخدمات اللوجستية للمستودعات، أو الروبوتات الخدمية".
يشير Moreno إلى أن مبادئ المحاكاة هذه قد جذبت انتباه الباحثين الطبيين، الذين اكتشفوا فرصًا في مجال تطوير الأدوية وعلاج الأمراض.
ويقول Moreno "في مجال الرعاية الصحية، تعمل النماذج العالمية على توحيد البيانات من مجالات متعددة - الجينومية والبروتينية والنسخية والكيميائية - لالتقاط تعقيدات الأنظمة البيولوجية على نطاق واسع". "هذه النظرة الشاملة تُمكّن الباحثين والأطباء من الكشف عن الأنماط المخفية في مجموعات البيانات الطبية الحيوية الضخمة، مما يتيح مهام مثل التنبؤ باضطراب الجينات، وتصنيف حالة المرض، ونمذجة استجابة العلاج".
ومع ذلك، فإن تحقيق هذه التطبيقات الطموحة في مجال الرعاية الصحية يتطلب موارد حوسبية استثنائية. تدريب هذه النماذج يتطلب قوة معالجة هائلة وموارد، حتى مع الأجهزة المتخصصة. ستتوفر الدفعة الأولى من نماذج Cosmos في كتالوج واجهة برمجة التطبيقات (API) الخاص بشركة NVIDIA هذا العام، إلى جانب أدوات لمعالجة بيانات الفيديو.
الاستثمار في قوة الحوسبة قد يفتح أبوابًا جديدة في مختلف الصناعات. من خلال نماذج الذكاء الاصطناعي العالمية، يمكن للمجموعات إنشاء توائم افتراضية لعملياتها من أجل اختبار التغييرات الكبيرة قبل تنفيذها بأمان. يمكن أن تسمح هذه المحاكاة المتطورة للشركات بتجربة إعدادات مختلفة - سواء كانت تخطط لتصميم مستودع جديد، أو إضافة روبوتات إلى سير عملها - دون تعطيل أعمالها في العالم الحقيقي.
يقول Moreno: "عادة ما تعمل أساليب الذكاء الاصطناعي التقليدية للذكاء الاصطناعي التوليدي على بيانات نصية أو رقمية بحتة، تفتقر إلى القدرة على التفكير في الأشياء والقوى المادية". "من خلال ترميز القواعد التي تحكم التفاعلات في العالم الحقيقي، يمكن للنماذج العالمية محاكاة النتائج والتنبؤ بها بما يتجاوز النصوص أو الصور".
