ميزات البيانات أو متغيراتها هي سمات مجموعة البيانات التي تستخدمها نماذج التعلم الآلي لاتخاذ القرارات ووضع التنبؤات. على سبيل المثال، بالنسبة إلى نموذج رؤية حاسوبية مصمم لتحديد أنواع النباتات، قد تتضمن ميزات البيانات شكل الورقة ولونها.
هندسة الميزات هي العملية التحويلية التي يستخلص من خلالها عالم البيانات معلومات جديدة من البيانات المدخلة وإعدادها للتعلم الآلي.يمكن للهندسة المناسبة واختيار الميزات أن تحدد الفرق بين أداء النموذج المقبول والعالي الجودة.
تعمل هندسة الميزات المؤتمتة على أتمتة عملية استكشاف مساحة الميزات وملء القيم المفقودة واختيار الميزات المراد استخدامها. يمكن أن يستغرق بناء ميزة واحدة يدويًا ساعات، ويمكن أن يصل عدد الميزات المطلوبة لتحقيق الحد الأدنى من الدقة إلى المئات - ناهيك عن خط أساس الدقة على مستوى الإنتاج. تقلص هندسة الميزات المؤتمتة هذه المرحلة من أيام إلى دقائق.
بالإضافة إلى مزايا الكفاءة، تزيد كفاءة الميزات المؤتمتة أيضًا من قابلية شرح الذكاء الاصطناعي - وهو أمر مهم للصناعات الخاضعة لتنظيم صارم مثل قطاع الرعاية الصحية أو الشؤون المالية. إن زيادة وضوح الميزات تجعل النماذج أكثر إقناعًا وقابلية للتنفيذ من خلال اكتشاف مؤشرات أداء رئيسية تنظيمية جديدة.