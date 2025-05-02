يبدأ كل التعلم الآلي بمجموعة بيانات أو مجموعة من البيانات. يمكن أن تتكون مجموعة البيانات من جداول بيانات أو لقطات فيديو أو صفحات ويب أو ملفات PDF أو أي نوع آخر من البيانات. بشكل عام، كلما زاد عدد بيانات التدريب التي يتم إدخالها في النموذج، كان أداء النموذج أفضل. ولكن الأمر لا يتعلق فقط بكمية البيانات، فجودة البيانات مهمة للغاية أيضًا.

تتكون بيانات تدريب الذكاء الاصطناعي من ميزات، تُعرَف أيضًا بالسمات، والتي تَصِف البيانات. على سبيل المثال، قد تتضمن مجموعة البيانات الخاصة بقطعة من معدات المصنع درجة الحرارة وسرعة التذبذب ووقت آخر عملية إصلاح. تتم "تغذية" هذه البيانات إلى خوارزمية التعلم الآلي، وهي مجموعة من التعليمات التي تم التعبير عنها من خلال جزء من التعليمات البرمجية التي تعالج بيانات الإدخال من أجل إنشاء المخرجات. تزويد الخوارزمية بالبيانات يعني إدخال بيانات إليها، ثم يتم بعد ذلك معالجتها وتحليلها لإنتاج المخرجات. النموذج الرياضي المدرَّب هو نتيجة هذه العملية. وهذه النماذج هي الأساس لجميع الابتكارات الحديثة تقريبًا في الذكاء الاصطناعي.

بعض النماذج تستخدم معالجة اللغة الطبيعية (NLP)، والتي يمكن استخدامها لتعليم الآلات القراءة والتحدث بلغة الإنسان. تُتيح رؤية الكمبيوتر للنماذج الأخرى تفسير المعلومات المرئية. لكن كل شيء يبدأ ببيانات التدريب.