علم البيانات مقابل التعلّم الآلي: ما الفرق بينهما؟

منظر خلفي لامرأة آسيوية شابة، عالمة بيانات مستقلة تعمل عن بُعد من المنزل على برمجة وتعدين البيانات الكبيرة وهندسة بيانات الذكاء الاصطناعي، وفني تكنولوجيا معلومات يعمل على مشروع ذكاء اصطناعي.

على الرغم من أن علم البيانات والتعلم الآلي مرتبطان، إلا أنهما مجالان مختلفان للغاية. باختصار، يضفي علم البيانات هيكلة للبيانات الكبيرة بينما يركز التعلم الآلي على التعلم من البيانات نفسها. وسيتناول هذا المنشور التحليل العميق لكل مجال.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.

ما المقصود بعلم البيانات؟

علم البيانات هو مجال واسع ومتعدد التخصصات، يستخرج القيمة من مجموعات البيانات الضخمة الحالية. ويستخدم أدوات متقدمة للنظر في البيانات غير المنسقة، وجمع مجموعة من البيانات، ومعالجتها، وتطوير رؤى لابتكار معنى. والمجالات التي يتكون منها حقل علم البيانات تشمل التنقيب والإحصائيات وتحليلات البيانات ونمذجة البيانات ونمذجة التعلم الآلي والبرمجة.

في النهاية، يُستخدم علم البيانات في تحديد مشكلات الأعمال الجديدة التي يمكن أن تساعد تقنيات التعلم الآلي والتحليل الإحصائي على حلها. ويحل علم البيانات مشكلة الأعمال من خلال فهم المشكلة ومعرفة البيانات المطلوبة وتحليلها للمساعدة على حل المشكلة الواقعية.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

ما المقصود بالتعلم الآلي؟

التعلم الآلي (ML)) هو مجموعة فرعية من الذكاء الاصطناعي (AI) الذي يركز على التعلم من ما توصل إليه علم البيانات. ويتطلب أدوات علم البيانات لتنظيف البيانات الكبيرة غير المهيكلة وإعدادها وتحليلها أولاً. ويمكن للتعلم الآلي بعد ذلك "التعلم" من البيانات لإنشاء رؤى تحسّن الأداء أو تُوجّه التنبؤات.

تمامًا كما يمكن للبشر أن يتعلموا من خلال التجربة بدلاً من مجرد اتباع التعليمات، يمكن للآلات أن تتعلم من خلال تطبيق أدوات تحليل البيانات. ويعمل التعلم الآلي على حل مشكلة معروفة باستخدام أدوات وتقنيات، ما يؤدي إلى إنشاء خوارزميات تتيح للآلة التعلم من البيانات من خلال التجربة وبأقل قدر من التدخل البشري. فهو يعالج كميات هائلة من البيانات التي لن يتمكن الإنسان من العمل من خلالها في حياته ويتطور مع معالجة المزيد من البيانات.

تحديات علم البيانات

في معظم الشركات، يمكن أن يستغرق العثور على البيانات المناسبة لتحليلها وتنظيفها وإعدادها ما يصل إلى 80% من يوم عالم البيانات. وعلى الرغم أن الأمر قد يكون مرهقًا، إلا أنه من المهم القيام به بشكل صحيح.

تتطلب البيانات من مصادر مختلفة، التي يتم جمعها بأشكال مختلفة، إدخال البيانات وتجميعها. ويمكن أن يصبح ذلك أسهل اليوم مع مستودعات البيانات الافتراضية التي تحتوي على منصة مركزية حيث يمكن تخزين البيانات من مصادر مختلفة فيها.

يتمثل أحد التحديات في تطبيق علم البيانات في تحديد مشكلات الأعمال ذات الصلة. على سبيل المثال، هل تتعلق المشكلة بانخفاض الإيرادات أو اختناقات الإنتاج؟ هل تبحث عن نمط تشك في وجوده، ولكن من الصعب الكشف عنه؟ وتتضمن التحديات الأخرى توصيل النتائج إلى الأطراف المعنية غير التقنيين، وضمان أمن البيانات، وتمكين التعاون الفعال بين علماء البيانات ومهندسي البيانات، وتحديد مقاييس مؤشرات الأداء الرئيسية (KPI) المناسبة.

كيف تطور علم البيانات

مع زيادة البيانات من وسائل التواصل الاجتماعي ومواقع التجارة الإلكترونية وعمليات البحث على الإنترنت واستطلاعات رأي العملاء وغيرها، ظهر مجال جديد للدراسة يعتمد على البيانات الكبيرة. وتتيح مجموعة البيانات هذه، التي تستمر في الزيادة، للمجموعات بمراقبة أنماط الشراء وسلوكياته وإجراء التنبؤات.

نظرًا لأن مجموعات البيانات غير منظمة، فقد يكون تفسير مجموعة البيانات من أجل صناعة القرار أمرًا معقدًا ويستغرق وقتًا طويلاً. وهنا يأتي دور علم البيانات.

تم استخدام مصطلح علم البيانات لأول مرة في ستينيات القرن العشرين عندما كان قابلاً للتبادل مع عبارة "علم الكمبيوتر". وتم استخدام "علم البيانات" لأول مرة كتخصص مستقل في عام 2001. كما يتم استخدام كل من علم البيانات والتعلم الآلي من قِبل مهندسي البيانات وفي كل صناعة تقريبًا.

لقد تطورت المجالات بحيث أصبح العمل كمحلل بيانات يقوم بعرض البيانات وإدارتها والوصول إليها، يتطلب معرفة لغة الاستعلام الهيكلية (SQL) بالإضافة إلى الرياضيات والإحصائيات وعرض مصور للبيانات (لتقديم النتائج للأطراف المعنية) واستخراج البيانات. ومن الضروري أيضًا فهم تقنيات تنظيف البيانات ومعالجتها. نظرًا لأن محللي البيانات غالبًا ما يقومون ببناء نماذج التعلم الآلي، فإن البرمجة ومعرفة الذكاء الاصطناعي ذات قيمة أيضًا. بالإضافة إلى الرياضيات والإحصائيات وعرض مصور للبيانات (لعرض النتائج على الأطراف المعنية) واستخراج البيانات. ومن الضروري أيضًا فهم تقنيات تنظيف البيانات ومعالجتها. نظرًا لأن محللي البيانات غالبًا ما يقومون ببناء نماذج التعلم الآلي، فإن البرمجة ومعرفة الذكاء الاصطناعي ذات قيمة أيضًا.

حالات استخدام علم البيانات

يُستخدم علم البيانات على نطاق واسع في الصناعة والحكومة، حيث يساعد على زيادة الأرباح، وابتكار المنتجات والخدمات، وتحسين البنية التحتية والأنظمة العامة وغيرها.

تتضمن بعض أمثلة حالات استخدام علم البيانات ما يأتي:

  • يستخدم بنك دولي نماذج مخاطر ائتمانية مدعومة بالتعلم الآلي (ML) لتقديم قروض أسرع عبر تطبيق الأجهزة المحمولة.
  • قامت إحدى الشركات المصنعة بتطوير أجهزة استشعار قوية مطبوعة ثلاثية الأبعاد لتوجيه المركبات ذاتية القيادة.
  • تساعد أداة تحليل الحوادث الإحصائية الخاصة بقسم الشرطة في تحديد متى وأين يتم نشر الضباط من أجل منع الجريمة بأقصى قدر من الكفاءة.
  • تقوم منصة الذكاء الاصطناعي للتقييم الطبي بتحليل السجلات الطبية لتحديد مخاطر إصابة المريض بالسكتة الدماغية والتنبؤ بمعدلات نجاح خطة العلاج.
  • تستخدم شركات الرعاية الصحية علم البيانات للتنبؤ بسرطان الثدي واستخدامات أخرى.
  • تستخدم إحدى شركات النقل التشاركي تحليلات البيانات الكبيرة للتنبؤ بالعرض والطلب، حتى تتمكن من الحصول على برنامج التشغيل في المواقع الأكثر شعبية في الوقت الفعلي. كما تستخدم الشركة أيضًا علم البيانات في التوقعات، والذكاء العالمي، ورسم الخرائط، والتسعير، وقرارات الأعمال الأخرى.
  • تستخدم مجموعة التجارة الإلكترونية التحليلات التنبؤية في محرك التوصيات الخاص بها.
  • تستخدم إحدى شركات الضيافة عبر الإنترنت علم البيانات لضمان التنوع في ممارسات التوظيف لديها، وتحسين قدرات البحث وتحديد تفضيلات المضيفين، من بين رؤى أخرى مفيدة. وقد جعلت الشركة بياناتها مفتوحة المصدر، وعملت على تدريب الموظفين وتمكينهم للاستفادة من الرؤى القائمة على البيانات.
  • تستخدم إحدى الشركات الإعلامية الكبرى عبر الإنترنت علم البيانات لتطوير محتوى مخصص، وتعزيز التسويق من خلال الإعلانات المستهدفة وتحديث تدفقات الموسيقى باستمرار، من بين قرارات الأتمتة الأخرى.

تطور التعلم الآلي

بدأت تقنية التعلم الآلي، والاسم نفسه، في الخمسينيات من القرن العشرين. في عام 1950، اقترح عالم البيانات آAlan Turing ما نسميه الآن اختبار Turing Test، والذي طرح السؤال: "هل تستطيع الآلات أن تفكر؟" الاختبار هو ما إذا كان بإمكان الآلة الانخراط في محادثة دون أن يدرك الإنسان أنها آلة. وعلى مستوى أوسع، يتساءل التقرير عما إذا كانت الآلات قادرة على إظهار الذكاء البشري. وقد أدى ذلك إلى ظهور نظرية الذكاء الاصطناعي وتطويره.

صاغ عالم الكمبيوتر Arthur Samuel من شركة IBM عبارة "التعلم الآلي" في عام 1952. وكتب برنامجًا للعبة الداما في العام نفسه. وفي عام 1962، لعب أحد أساتذة لعبة الداما ضد برنامج التعلم الآلي على حاسوب IBM، وفاز الحاسوب.

لقد تطور التعلم الآلي اليوم إلى درجة أن المهندسين يحتاجون إلى معرفة الرياضيات التطبيقية والبرمجة الحاسوبية والأساليب الإحصائية ومفاهيم الاحتمالات وبنية البيانات وغيرها من أساسيات علوم الحاسوب وأدوات البيانات الكبيرة مثل Hadoop وHive. ليس من الضروري معرفة SQL، حيث تتم كتابة البرامج بلغات R وJava وSAS ولغات البرمجة الأخرى. Python هي لغة البرمجة الأكثر شيوعًا المستخدمة في التعلم الآلي.

يُعد التعلم الآلي والتعلم العميق كلاهما مجموعات فرعية من الذكاء الاصطناعي. يُعلِّم التعلم العميق أجهزة الكمبيوتر معالجة البيانات بالطريقة التي يعالج بها الدماغ البشري. ويمكنه التعرف على الأنماط المعقدة في النصوص والصور والأصوات والبيانات الأخرى وإنشاء رؤى وتنبؤات دقيقة. خوارزميات التعلم العميق هي شبكات عصبية مصممة على غرار الدماغ البشري.

الفئات الفرعية للتعلم الآلي

تتضمن بعض خوارزميات التعلم الآلي الأكثر استخدامًا الانحدار الخطي، والانحدار اللوجستي، وشجرة القرار، وخوارزمية آلة المتجهات الداعمة (SVM)، وخوارزمية Naïve Bayes وخوارزمية KNN. يمكن أن يكون ذلك من خلال التعلم تحت الإشراف أو التعلم غير الخاضع للإشراف أو التعلم المعزز.

يمكن لمهندسي التعلم الآلي أن يتخصصوا في معالجة اللغة الطبيعية ورؤية الكمبيوتر، وأن يصبحوا مهندسي برمجيات يركزون على التعلم الآلي والمزيد.

تحديات التعلم الآلي

هناك بعض المخاوف الأخلاقية في ما يتعلق بالتعلم الآلي، مثل الخصوصية وكيفية استخدام البيانات. وتم جمع البيانات غير المنظمة من مواقع التواصل الاجتماعي دون علم المستخدمين أو موافقتهم. على الرغم من أن اتفاقيات الترخيص قد تحدد كيفية استخدام هذه البيانات، إلا أن العديد من مستخدمي وسائل التواصل الاجتماعي لا يقرأون هذه التفاصيل الدقيقة.

مشكلة أخرى هي أننا لا نعرف دائمًا كيف تعمل خوارزميات التعلم الآلي و "اتخاذ القرارات". قد يكون أحد الحلول لذلك هو إصدار برامج التعلم الآلي كمصدر مفتوح، بحيث يمكن للناس التحقق من مصدر الرمز.

وقد استخدمت بعض نماذج التعلّم الآلي مجموعات بيانات ذات بيانات متحيزة، وهو ما ينتقل إلى نتائج التعلّم الآلي. تشير المساءلة في التعلّم الآلي إلى مدى قدرة الشخص على رؤية الخوارزمية وتصحيحها ومن المسؤول إذا كانت هناك مشكلات في النتيجة.

يشعر بعض الناس بالقلق من أن الذكاء الاصطناعي والتعلم الآلي سيؤديان إلى القضاء على الوظائف. في حين أنه قد يغير أنواع الوظائف المتاحة، فمن المتوقع أن يؤدي التعلم الآلي إلى إنشاء وظائف جديدة ومختلفة. في كثير من الحالات، يتعامل مع الأعمال الروتينية والمتكررة، ما يحرر البشر للحركة إلى وظائف تتطلب المزيد من الإبداع ويكون لها تأثير أكبر.

بعض حالات استخدام التعلم الآلي

ومن بين الشركات المعروفة التي تستخدم التعلم الآلي، منصات التواصل الاجتماعي، والتي تجمع كميات كبيرة من البيانات ثم تستخدم السلوك السابق للشخص للتنبؤ باهتماماته ورغباته. ثم تستخدم المنصات هذه المعلومات والنمذجة التنبؤية للتوصية بالمنتجات أو الخدمات أو المقالات ذات الصلة.

وتشكل شركات اشتراك الفيديو حسب الطلب ومحركات التوصية الخاصة بها مثالاً آخر على استخدام التعلم الآلي، كما هو الحال مع التطور السريع للسيارات ذاتية القيادة. ومن الشركات الأخرى التي تستخدم التعلم الآلي، شركات التكنولوجيا، ومنصات الحوسبة السحابية، وشركات الملابس والمعدات الرياضية، وشركات تصنيع السيارات الكهربائية، وشركات الطيران الفضائي، وغيرها الكثير.

علم البيانات والتعلم الآلي وIBM

تنطوي ممارسة علم البيانات على تحديات. حيث يمكن أن تكون هناك بيانات مجزأة، ونقص في مهارات علم البيانات، والأدوات والممارسات وإطار العمل للاختيار من بينها التي تحتوي على معايير صارمة لتكنولوجيا المعلومات للتدريب والنشر. وقد يكون من الصعب أيضًا تشغيل نماذج التعلم الآلي (ML) التي تتميز بدقة غير واضحة وتنبؤات يصعب تدقيقها.

تستند محفظة منتجات IBM الخاصة بعلم البيانات ودورة حياة الذكاء الاصطناعي إلى التزامنا طويل الأمد بالتقنيات مفتوحة المصدر. وهي تتضمن مجموعة من القدرات التي تمكن الشركات من إلغاء القفل لقيمة بياناتها بطرق جديدة.

تُعد watsonx محفظة من منتجات الذكاء الاصطناعي التي تعمل على تسريع تأثير الذكاء الاصطناعي التوليدي في سير العمل الأساسية لتعزيز الإنتاجية. وتتضمن المحفظة ثلاثة عناصر قوية: watsonx.ai استوديو لنماذج الأساس الجديدة والذكاء الاصطناعي التوليدي والتعلم الذكي؛ watsonx.data مناسب للغرض من أجل التخزين لمرونة بحيرة البيانات وأداء مستودع البيانات؛ بالإضافة إلى ذلك، مجموعة الأدوات watsonx.governance ، لتمكين سير عمل الذكاء الاصطناعي الذي تم تصميمه بمسؤولية وشفافية وقابلية للتفسير.

من خلال هذا التعاون، يوفر watsonx للمؤسسات القدرة على:

  1. تدريب الذكاء الاصطناعي وضبطه ونشره عبر جميع جوانب عملك باستخدام watsonx.ai
  2. توسيع أحمال تشغيل الذكاء الاصطناعي لجميع بياناتك، في أي مكان باستخدام watsonx.data
  3. تمكين سير عمل البيانات والذكاء الاصطناعي بشكل مسؤول وشفاف وقابل للتفسير باستخدام watsonx.governance
     
    حلول ذات صلة
    أدوات التحليلات والحلول ذات الصلة بها

    لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

    استكشف حلول التحليلات
    خدمات الاستشارات في مجال البيانات والتحليلات

    استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

    اكتشف خدمات التحليلات
    IBM Cognos Analytics

    تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

    استكشف Cognos Analytics
    اتخِذ الخطوة التالية

    لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

    استكشف حلول التحليلات اكتشف خدمات التحليلات