أفضل مكتبات التعلم الآلي

مؤلف

David Zax

Staff Writer

IBM Think

ما المقصود بمكتبات التعلم الآلي؟

مكتبات التعلم الآلي هي أجزاء جاهزة من التعليمات البرمجية ("المكتبات") مفيدة لمشروعات التعلم الآلي. نظرًا لأن جهود التعلم الآلي (ML) غالبًا ما تتضمن أنواعًا معينة من المهام الشائعة في الذكاء الاصطناعي، فمن الموفِّر للوقت العمل باستخدام خوارزميات وأدوات جاهزة ومُعتمدة مسبقًا. 

تتكون معظم مكتبات التعلم الآلي (ML) من وحدات، ما يسمح للمطورين بالمزج والمطابقة أثناء بناء مسارات التعلم الآلي التي تتعامل مع المعالجة المسبقة والتدريب ومقاييس التحقق والمهام الأخرى. غالبًا ما تكون المكتبات مفتوحة المصدر ومجانية للاستخدام، وهناك العديد للاختيار من بينها: صفحة Github واحدة تجمع ما يقرب من 1,000 مكتبة تعلُّم آلي بلغة البرمجة Python وحدها. أصبحت لغة Python اللغة السائدة في التعلم الآلي، رغم أن مشاريع التعلم الآلي تظهر أيضًا بلغة JavaScript وR ولغات أخرى. 

هناك مكتبات لجميع أنواع التطبيقات. توفِّر محولات Hugging Face وصولًا سهلًا إلى نماذج المحولات المدرَّبة مسبقًا. تدعم المكتبات مثل Stable-Baselines3 التعلم المعزز. يمكن تجميع مكتبات التعلم الآلي بشكل مفيد في فئتين رئيسيتين. المكتبات العامة التي تعمل كأطر عمل أو منصات لمشروعات التعلم الآلي. يمكن استخدام المكتبات المتخصصة لمرحلة معينة أو عنصر معين من مشروع التعلم الآلي.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

مكتبات التعلم الآلي العامة

مكتبات التعلم الآلي العامة -التي تُعرَف أحيانًا باسم "أطر العمل متعددة الأغراض" أو "المنصات الأساسية"- يتجاوز عددها عشرات المكتبات. لكن أربعة منها تحظى بشعبية خاصة، وتتصدّر بانتظام قوائم "الأفضل": TensorFlow (والمرتبطة به بشكل وثيق Keras) وPyTorch وscikit-learn. لكل منها نقاط قوة مختلفة قليلًا، حسب احتياجات المشروع أو الفريق. 

  • NumPy

  • Tensorflow

  • Keras

  • PyTorch

  • Scikit-learn

NumPy

لا تُعَد NumPy مكتبة للتعلم الآلي بحد ذاتها، بل هي المكتبة التي تُبنى عليها جميع مكتبات التعلم الآلي. في الأساس، يختص التعلم الآلي باكتشاف الأنماط في كميات كبيرة من البيانات. تساعد مكتبة NumPy، التي تُنشئ بنية تُعرَف بالمصفوفة متعددة الأبعاد، على تنظيم نقاط البيانات وتطبيق الدوال الرياضية عليها (وهي فرع من فروع الرياضيات يُعرَف باسم الجبر الخطي). تُعرَف هذه المصفوفات متعددة الأبعاد أو ذات الأبعاد n -وهي حاويات كبيرة يمكن التلاعب بأرقامها- أحيانًا أيضًا باسم "التنسورات"، وهو مصطلح شائع في نقاشات مكتبات التعلم الآلي. (تُعرَف المصفوفة ثنائية الأبعاد باسم المصفوفة).

بينما تتعامل NumPy مع التنسورات -الهيكل الأساسي للبيانات في التعلم الآلي- إلا إن NumPy عمليًا محدودة جدًا لتلبية متطلبات المعالجة المكثفة في التعلم الآلي الحديث. من بين قيود أخرى، تُعَد NumPy (التي تعود جذورها إلى التسعينيات) قديمة جدًا بحيث لا يمكنها "التواصل" مع معالجات وحدات معالجة الرسومات (GPU) المتقدمة التي تتطلبها مشروعات التعلم الآلي التجارية عادةً (ما يُعرَف باسم "تسريع وحدة معالجة الرسومات")، فهي تعمل فقط مع وحدات المعالجة المركزية (CPU) الأقل قوة.

TensorFlow

تُعَد TensorFlow مكتبة تعلم آلي عامة طوَّرها فريق Google Brain في عام 2015، وبعد أن حولتها Google إلى مكتبة مفتوحة المصدر، ازدادت شعبيتها. يمكن لمكتبة TensorFlow العمل ليس فقط مع وحدات المعالجة المركزية (CPU)، بل أيضًا مع وحدات معالجة الرسومات (GPU) عالية الأداء ومعالجات متخصصة من صنع Google تُعرَف باسم وحدة معالجة التنسورات (TPU).

تُعَد TensorFlow مناسبة بشكل خاص للتعلم العميق، وهو شكل من أشكال التعلم الآلي يعتمد على الشبكات العصبية التي تُحاكي بنية الدماغ. يُسمَّى التعلم "العميق" لأنه يشمل عدة طبقات بين المدخلات والمخرجات. أصبح التعلم العميق مفيدًا في التطبيقات التجارية مثل معالجة اللغة الطبيعية (NLP) ورؤية الكمبيوتر والتعرُّف على الصور. نشأت TensorFlow في Google وتشغِّل العديد من تطبيقاتها ومنتجاتها التجارية، وتتميز بالقدرة على النشر على نطاق واسع. 

Keras

ترتبط Keras ارتباطًا وثيقًا بمكتبة TensorFlow، وقد أنشأها أيضًا مهندس من Google. هي مكتبة يستخدمها عادةً المطورون الراغبون في الحصول على واجهة برمجة تطبيقات (API) أكثر سهولة لمشروعات التعلم الآلي المبنية على TensorFlow. تم إصدار نسخة من Keras في عام 2025 أضافت دعمًا لأطر عمل أخرى بجانب TensorFlow، بما في ذلك PyTorch. تشتهر Keras أيضًا بالوثائق الشاملة والبرامج التعليمية المفيدة.

PyTorch

تم تطوير PyTorch في الأصل بواسطة باحثين في Meta أواخر عام 2016. هي نسخة بلغة Python من مكتبة Torch القديمة، والتي كان أساسها عبارة عن تنسور. بحلول عام 2022، عندما انتقلت PyTorch إلى Linux Foundation، تمت الإفادة بأن أكثر من 2,400 مساهم قد أنشأوا أكثر من 150,000 مشروع باستخدام PyTorch. يُعَد التعلم الآلي مفتوح المصدر هو النموذج السائد، نظرًا لازدهار هذا المجال بفضل التعاون الواسع. مثل TensorFlow، تُتيح PyTorch للمطورين أداء عمليات مشابهة لتلك في NumPy، ولكن باستخدام وحدات معالجة الرسومات (GPU) بدلًا من وحدات المعالجة المركزية (CPU)، ما يجعل PyTorch إطار عمل آخر للتعلم العميق. 

كثيرًا ما يكون السؤال الأول لمن يبدؤون مشروع تعلُّم آلي: "PyTorch أم TensorFlow؟" (سابقًا، كانت مكتبة تُعرَف باسم Theano ضمن الخيارات أيضًا، وتم إيقاف دعمها في 2017). رغم عدم وجود إجابة خاطئة، فإن PyTorch بدأت تظهر كخيار مفضل للعديد من المطورين نظرًا لتصميمها المرن والمتساهل ("Pythonic") وسهولة استخدامها. لطالما كانت مفضلة بين الأكاديميين والباحثين، لكنها أصبحت تُستخدم بشكل متزايد في الصناعة أيضًا لتطبيقات طموحة وقابلة للتوسع. على سبيل المثال، تم بناء نظام القيادة الذاتية Autopilot الخاص بشركة Tesla باستخدام PyTorch، كما أن منصة الحوسبة السحابية Azure التابعة لشركة Microsoft تدعمه. لقد أصبحت PyTorch شائعة للغاية لدرجة أن منظومة من الأدوات المساندة (مثل Torchvision وTorchText) نشأت حولها. تستخدم كلٌّ من TensorFlow وPyTorch الرسم البياني الحاسوبي، وهو هيكل بيانات يمثِّل تدفق العمليات والمتغيرات أثناء تدريب النموذج. 

تُعَد IBM عضوًا في مؤسسة PyTorch؛ وتستخدم PyTorch مع مجموعة منتجاتها watsonx.

Scikit-learn

تُعَد Scikit-learn (المعروفة أيضًا باسم sklearn ويُكتب اسمها بالحروف الصغيرة "scikit-learn") مكتبة أساسية أخرى للتعلم الآلي، مصممة للتكامل مع NumPy والمكتبة ذات الصلة SciPy، الشهيرة بين علماء البيانات وتدعم الحوسبة العلمية. تتضمن Scikit-learn عددًا من خوارزميات التعلم الآلي التي تكمن فكرتها الأساسية في التعرُّف على الأنماط. على سبيل المثال، تتضمن خوارزميات التصنيف (مثل تلك التي تحدِّد إذا ما كانت رسالة البريد الإلكتروني مزعجة أم لا)، وخوارزميات الانحدار (التي تدعم التنبؤ والتوقع وأنظمة التوصية)، وخوارزميات التجميع (التي تجمع العناصر المتشابهة معًا). على الرغم من أن Scikit-learn تمثِّل مكانًا ممتازًا للمبتدئين لتعلُّم أساسيات التعلم الآلي -مثل مفاهيم المعالجة المسبقة للبيانات ومسارات البيانات وأشجار القرار والتحسين- فإنها محدودة كمحرك لإنشاء المنتجات التجارية. مثل NumPy، تفتقر Scikit-learn إلى تسريع GPU، ما يعني أنها غير مناسبة لنماذج التعلم العميق ولا تُعَد "مكتبة تعلُّم عميق". ومع ذلك، لا تزال مفيدة كمختبر لاختبار الأفكار وإنشاء النماذج الأوَّلية.

أكاديمية الذكاء الاصطناعي

كن خبيرًا في الذكاء الاصطناعي

اكتسب المعرفة لتحديد أولويات استثمارات الذكاء الاصطناعي التي تدفع نمو الأعمال. ابدأ مع أكاديمية الذكاء الاصطناعي المجانية اليوم وتولَّ زمام المبادرة لتعزيز مستقبل الذكاء الاصطناعي في مؤسستك.

مكتبات التعلم الآلي المتخصصة

أساس أي نموذج تعلُّم آلي -أي جزء التعلم- سيعمل على واحدة من المكتبات الأساسية المذكورة أعلاه. لكن التعلم الآلي هو مجال معقد متعدد المراحل، لذلك تطورت المكتبات لتساعد على سير العمل المتعلق بالمهام المحددة للتعلم الآلي. بالإضافة إلى ذلك، فإن الصناعات المختلفة (مثل المجالات المالية أو الطبية) وأنواع البيانات المختلفة (مثل الصور أو البيانات الصوتية) تختلف بدرجة كافية لتستفيد من مكتبات تعلُّم آلي مخصصة. على الرغم من أن هذا المقال لا يتناول استعراض ما يقرب من ألف مكتبة مفتوحة المصدر الناتجة عن هذا التعقيد، فإنه من المفيد إبراز بعض المكتبات الشهيرة بشكل خاص.

لتحليل البيانات: Pandas

تُعَد Pandas المكتبة الأساسية في Python لعلوم البيانات، وهي وظيفة أساسية في أي مشروع تعلُّم آلي؛ وكالكثير من مكتبات التعلم الآلي، تم بناؤها على أساس NumPy. تتجاوز Pandas مجرد مصفوفات NumPy من خلال إضافة هيكل يُعرَف باسم "إطار البيانات"، وهو مشابه لجداول بيانات Excel. يُتيح هذا الهيكل الإضافي إمكانية معالجة البيانات على مجموعات كبيرة من البيانات الواقعية.

لإعداد عروض مصوّرة للبيانات: Matplotlib وSeaborn

لاستخراج الأنماط والرؤى من البيانات البصرية، تُعَد مكتبتا Matplotlib وSeaborn من المكتبات الشائعة لتصوير البيانات. تُنتج الأولى الرسوم والمخططات، أما الثانية فتعمل فوقها لجعلها أكثر ملاءمة للتعلم الآلي (فعلى سبيل المثال، يمكن لمكتبة Seaborn العمل مباشرةً مع إطارات البيانات في Pandas).

لتتبُّع التجارب: MLFlow

إطلاق مشروع تعلُّم آلي ناجح يتطلب الكثير من التجربة والخطأ للوصول إلى النتائج الصحيحة. لتحقيق هذا الغرض، تساعد مكتبة MLFlow الفِرَق على تسجيل نماذج التعلم الآلي والمَعلمات والنتائج، بالإضافة إلى إدارة جهود تصحيح الأخطاء، ما يجعل من السهل نقل النماذج المدرَّبة إلى مرحلة جاهزة للإطلاق.

حلول ذات صلة
®IBM® watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي في وقت قصير وباستخدام جزء بسيط من البيانات.

استكشف watsonx.ai
حلول الذكاء الاصطناعي

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات في مجال الذكاء الاصطناعي

تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

باستخدام الذكاء الاصطناعي، يكشف IBM Concert عن رؤى مهمة حول عملياتك ويقدم توصيات خاصة بالتطبيق من أجل التحسين. اكتشف كيف يمكن لمنصة Concert تعزيز نمو أعمالك.

استكشف Concert® استكشف حلول أتمتة عمليات الأعمال