ما المقصود بعلم البيانات؟

شابة أفريقية أمريكية مركِّزة تعمل على تقرير اقتصادي.

ما المقصود بعلم البيانات؟

يجمع علم البيانات بين الرياضيات والإحصاء والبرمجة المتخصصة والتحليلات المتقدمة والذكاء الاصطناعي (AI) والتعلم الآلي، والخبرة المتخصصة المحددة للكشف عن رؤى قابلة للتنفيذ مخبأة في بيانات المؤسسة. يمكن استخدام هذه الرؤى لتوجيه عملية صنع القرار والتخطيط الاستراتيجي.

أدى تزايد حجم مصادر البيانات، وما يترتب عليه من بيانات، إلى جَعْل علم البيانات أحد أسرع المجالات نموًا في جميع الصناعات. ونتيجةً لذلك، ليس من المستغرب أن يُطلق على دور عالم البيانات لقب "الوظيفة الأكثر جاذبية في القرن الحادي والعشرين" وفقًا لمجلة Harvard Business Review. حيث تعتمد المؤسسات بشكل متزايد عليهم لتفسير البيانات وتقديم توصيات قابلة للتنفيذ لتحسين نتائج الأعمال.

تتضمن دورة حياة علم البيانات عدة أدوار وأدوات وعمليات، ما يمكِّن المحللين من استخلاص رؤى قابلة للتنفيذ. عادةً ما يمر مشروع علم البيانات بالمراحل التالية:

  • استيعاب البيانات: تبدأ دورة الحياة بجمع البيانات، سواء البيانات غير المنسقة أم المنظمة أم غير المنظمة، من جميع المصادر ذات الصلة باستخدام مجموعة متنوعة من الأساليب. يمكن أن تتضمن هذه الطرق الإدخال اليدوي والاستخراج من الويب وتدفق البيانات في الوقت الفعلي من الأنظمة والأجهزة. يمكن أن تتضمن مصادر البيانات بيانات منظمة مثل بيانات العملاء، بالإضافة إلى بيانات غير منظمة مثل ملفات السجل والفيديو والصوت والصور وإنترنت الأشياء ووسائل التواصل الاجتماعي والمزيد.
  • تخزين البيانات ومعالجتها: نظرًا لأن البيانات يمكن أن تكون لها تنسيقات وهياكل مختلفة، تحتاج الشركات إلى النظر في أنظمة تخزين مختلفة بناءً على نوع البيانات التي يجب جمعها. تساعد فرق إدارة البيانات على تحديد المعايير المتعلقة بتخزين البيانات وبنيتها، ما يسهِّل سير العمل حول التحليلات والتعلم الآلي ونماذج التعلم العميق. تتضمن هذه المرحلة تنظيف البيانات وإزالة التكرارات وتحويلها ودمج البيانات باستخدام وظائف الاستخراج والتحويل والتحميل (ETL) أو تقنيات تكامل البيانات الأخرى. يُعَد إعداد البيانات هذا ضروريًا لتعزيز جودة البيانات قبل تحميلها في مستودع بيانات أو بحيرة بيانات أو مستودع آخر.
  • تحليل البيانات: هنا، يُجري علماء البيانات تحليلًا استكشافيًا للبيانات لفحص التحيّزات والأنماط والنطاقات وتوزيعات القيم داخل البيانات. يؤدي استكشاف تحليلات البيانات هذا إلى توليد الفرضيات لاختبار a/b. كما أنه يسمح للمحللين بتحديد مدى ملاءمة البيانات للاستخدام في جهود النمذجة للتحليلات التنبؤية و/أو التعلم الآلي و/أو التعلم العميق. واعتمادًا على دقة النموذج، يمكن للمؤسسات أن تعتمد على هذه الرؤى في اتخاذ القرارات المتعلقة بالأعمال، ما يسمح لها بتحقيق المزيد من قابلية التوسع.
  • التواصل: أخيرًا، يتم تقديم الرؤى في شكل تقارير وعروض مصورة للبيانات تجعل الرؤى وتأثيرها في الأعمال أسهل على محللي الأعمال وغيرهم من صنّاع القرار لفهمها. تتضمن لغات برمجة علم البيانات مثل R أو Python عناصر لإنشاء العروض المصورة البيانية، وفي المقابل، يمكن لعلماء البيانات استخدام أدوات مخصصة للتصوُّر.

ما الذي يفعله علماء البيانات؟

علماء البيانات خبراء في استخلاص الرؤى والإجابات الخاصة بكل صناعة من البيانات. يمتلكون مهارات في علوم الكمبيوتر والعلوم الأساسية تتجاوز تلك الموجودة لدى محلل الأعمال أو محلل البيانات العادي، بالإضافة إلى فهم عميق لتفاصيل الصناعة أو مجال الأعمال الذي يعملون فيه، مثل صناعة السيارات أو التجارة الإلكترونية أو الرعاية الصحية. 

يجب أن يكون عالم البيانات قادرًا على:

  • معرفة ما يكفي عن الأعمال لطرح الأسئلة المناسبة وتحديد نقاط الضعف في العمل.

  • تطبيق الإحصاءات وعلوم الكمبيوتر، إلى جانب الفطنة التجارية، في تحليل البيانات.

  • استخدام مجموعة واسعة من الأدوات والتقنيات لإعداد البيانات واستخراجها، بدءًا من قواعد البيانات وSQL إلى استخراج البيانات إلى أساليب تكامل البيانات.

  • استخراج الأفكار من البيانات الكبيرة باستخدام التحليلات التنبؤية والذكاء الاصطناعي (AI)، بما في ذلك نماذج التعلم الآلي، ومعالجة اللغة الطبيعية، والتعلم العميق.

  • كتابة البرامج والخوارزميات التي تعمل على أتمتة معالجة البيانات والحسابات.

  • سرد وتوضيح القصص التي تنقِل بوضوح معنى النتائج إلى صنّاع القرار والأطراف المعنية على كل مستوى من مستويات الفهم التقني.

  • شرح كيفية استخدام النتائج لحل مشكلات الأعمال.

  • التعاون مع أعضاء فريق علم البيانات الآخرين، مثل محللي البيانات والأعمال ومهندسي تكنولوجيا المعلومات ومهندسي البيانات ومطوِّري التطبيقات.

هذه المهارات مطلوبة بشدة، ونتيجةً لذلك، يستكشف العديد من الأفراد الذين يدخلون مجال علم البيانات مجموعة متنوعة من برامج علم البيانات، مثل برامج الشهادات ودورات علم البيانات وبرامج الدرجات الأكاديمية التي تقدِّمها المؤسسات التعليمية.

علماء البيانات ليسوا بالضرورة مسؤولين مباشرةً عن جميع العمليات المشاركة في دورة حياة علم البيانات. على سبيل المثال، عادةً ما يتولى مهندسو البيانات إدارة مسارات البيانات، بينما قد يقدِّم عالم البيانات توصيات حول نوع البيانات المفيدة أو المطلوبة. بينما يمكن لعلماء البيانات بناء نماذج التعلم الآلي، فإن توسيع هذه الجهود على نطاق أوسع يتطلب مهارات هندسة برمجيات أكبر لتحسين البرنامج ليعمل بسرعة أكبر. ونتيجةً لذلك، من الشائع أن يتعاون عالم البيانات مع مهندسي التعلم الآلي لتوسيع نطاق نماذج التعلم الآلي.

يمكن أن تتداخل مسؤوليات عالم البيانات عادةً مع محلل البيانات، خاصةً مع تحليل البيانات الاستكشافي والعروض المصورة للبيانات. ومع ذلك، فإن مجموعة مهارات عالم البيانات عادةً ما تكون أوسع من محلل البيانات العادي. وبالمقارنة، يستفيد عالم البيانات من لغات البرمجة الشائعة، مثل R وPython، لإجراء المزيد من الاستدلال الإحصائي والعروض المصورة للبيانات.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

علم البيانات مقابل ذكاء الأعمال

قد يكون من السهل الخلط بين مصطلحَي "علم البيانات" و"ذكاء الأعمال" (BI) لأن كليهما يتعلق ببيانات المؤسسة وتحليل هذه البيانات، ولكنهما يختلفان في التركيز.

عادةً ما يكون ذكاء الأعمال (BI) مصطلحًا شاملًا للتكنولوجيا التي تُتيح إعداد البيانات واستخراجها وإدارتها وإنشاء العروض المصورة لها. تسمح أدوات وعمليات ذكاء الأعمال للمستخدمين النهائيين بتحديد المعلومات القابلة للتنفيذ من البيانات غير المنسقة، ما يسهِّل عملية اتخاذ القرارات القائمة على البيانات داخل المؤسسات في مختلَف الصناعات. رغم أن أدوات علم البيانات تتداخل في الكثير من هذا الصدد، فإن ذكاء الأعمال يركِّز أكثر على البيانات من الماضي، أما الرؤى من أدوات ذكاء الأعمال فهي أكثر وصفية بطبيعتها. ويستخدم البيانات لفهم ما حدث سابقًا من أجل توجيه مسار العمل. يتم توجيه ذكاء الأعمال نحو البيانات الثابتة (غير المتغيرة) التي عادةً ما تكون منظمة. بينما يستخدم علم البيانات البيانات الوصفية، فإنه عادةً ما يستعين بها لتحديد المتغيرات التنبؤية، والتي تُستخدم بعد ذلك لتصنيف البيانات أو إجراء التنبؤات.

علم البيانات وذكاء الأعمال لا يستبعد أحدهما الآخر، فالمؤسسة الذكية رقميًا تستخدم كليهما لفهم بياناتها واستخراج القيمة منها بشكل كامل.

أدوات علم البيانات

يعتمد علماء البيانات على لغات البرمجة الشائعة لإجراء التحليل الاستكشافي للبيانات والانحدار الإحصائي. تدعم هذه الأدوات مفتوحة المصدر قدرات النمذجة الإحصائية الجاهزة، والتعلم الآلي، والرسوم البيانية. تتضمن هذه اللغات ما يلي (اقرأ المزيد في "Python مقابل R: ما الفرق؟"):

  • R Studio: لغة وبيئة برمجة مصدر مفتوح لتطوير الحوسبة والرسومات الإحصائية.
  • Python: لغة برمجة ديناميكية ومرنة. تتضمن Python العديد من المكتبات، مثل NumPy وPandas وMatplotlib، لتحليل البيانات بسرعة.

لتسهيل مشاركة الكود والمعلومات الأخرى، قد يستخدم علماء البيانات GitHub وJupyter Notebook.

قد يفضِّل بعض علماء البيانات واجهة مستخدم، ومن بين الأدوات المؤسسية الشائعة للتحليل الإحصائي:

  • SAS: مجموعة أدوات شاملة، بما في ذلك العروض المصورة ولوحات المعلومات التفاعلية للتحليل وإعداد التقارير واستخراج البيانات والنمذجة التنبؤية.
  • IBM SPSS: يوفر تحليلًا إحصائيًا متقدمًا، ومكتبة كبيرة من خوارزميات التعلم الآلي، وتحليل النصوص، وقابلية التوسعة مفتوحة المصدر، والتكامل مع البيانات الكبيرة، والنشر السلس في التطبيقات.

يكتسب علماء البيانات أيضًا الكفاءة في استخدام منصات معالجة البيانات الكبيرة، مثل Apache Spark، وإطار العمل Apache Hadoop مفتوح المصدر، وقواعد بيانات NoSQL. كما أنهم ماهرون في استخدام مجموعة واسعة من أدوات إعداد العروض المصورة للبيانات، بما في ذلك أدوات الرسوم البيانية البسيطة المدمجة مع برامج العروض التقديمية وجداول البيانات (مثل Microsoft Excel)، وأدوات التصوُّر التجارية المصممة خصيصًا مثل Tableau وIBM Cognos، بالإضافة إلى الأدوات مفتوحة المصدر مثل D3.js (مكتبة JavaScript لإنشاء عروض مصورة تفاعلية للبيانات) وRAW Graphs. لبناء نماذج التعلم الآلي، كثيرًا ما يلجأ علماء البيانات إلى العديد من إطارات العمل مثل PyTorch وTensorFlow وMXNet وSpark MLib.

نظرًا للمنحنى التعليمي الحاد في علم البيانات، يسعى العديد من الشركات إلى تسريع العائد على الاستثمار في مشاريع الذكاء الاصطناعي؛ وغالبًا ما تواجه صعوبة في توظيف الكفاءات اللازمة لتحقيق الإمكانيات الكاملة لمشاريع علم البيانات. ولمعالجة هذه الفجوة، فإنهم يتجهون إلى منصات علم البيانات والتعلم الآلي (DSML) متعددة الشخصيات، ما أدى إلى ظهور دور "عالم البيانات".

تستخدم منصات DSML متعددة الشخصيات الأتمتة، وبوابات الخدمة الذاتية، وواجهات المستخدم منخفضة البرمجة أو دون برمجة، بحيث يمكن للأشخاص الذين لديهم خبرة قليلة أو لا خبرة لديهم في التكنولوجيا الرقمية أو علم البيانات المتخصص أن يحققوا قيمة أعمال باستخدام علم البيانات والتعلم الآلي. وتدعم هذه المنصات أيضًا علماء البيانات الخبراء من خلال تقديم واجهة أكثر تقنية أيضًا. يشجِّع استخدام منصة DSML متعددة الشخصيات على التعاون عبر المؤسسة.

علم البيانات والحوسبة السحابية

تعمل الحوسبة السحابية على توسيع نطاق علم البيانات من خلال توفير الوصول إلى قدرات معالجة إضافية ومساحة تخزين وأدوات أخرى مطلوبة لمشاريع علم البيانات.

نظرًا لأن علم البيانات كثيرًا ما يستفيد من مجموعات البيانات الكبيرة، فإن الأدوات التي يمكن أن تتوسع مع حجم البيانات مهمة للغاية، خاصةً للمشاريع الحساسة للوقت. توفر حلول التخزين السحابي، مثل بحيرات البيانات، إمكانية الوصول إلى بنية تحتية للتخزين قادرة على استيعاب ومعالجة كميات كبيرة من البيانات بسهولة. توفِّر أنظمة التخزين هذه المرونة للمستخدمين النهائيين، ما يُتيح لهم إنشاء مجموعات كبيرة حسب الحاجة. ويمكنهم أيضًا إضافة وحدات حوسبة إضافية لتسريع مهام معالجة البيانات، ما يمكِّن المؤسسة من إجراء مقايضات قصيرة المدى لتحقيق نتائج أكبر على المدى الطويل. عادةً ما تمتلك المنصات السحابية نماذج تسعير مختلفة، مثل الدفع حسب الاستخدام أو الاشتراكات، لتلبية احتياجات المستخدم النهائي، سواء أكان مؤسسة كبيرة أم شركة ناشئة صغيرة.

تُستخدم تقنيات المصدر المفتوح على نطاق واسع في مجموعات أدوات علم البيانات. فعندما تتم استضافتها في السحابة، لا تحتاج الفرق إلى تثبيتها أو تكوينها أو صيانتها أو تحديثها محليًا. توفِّر عدة منصات سحابية، بما في ذلك IBM Cloud، أيضًا مجموعات أدوات جاهزة تمكِّن علماء البيانات من بناء النماذج دون الحاجة إلى البرمجة، ما يعزز من إتاحة الابتكارات التكنولوجية والرؤى المستندة إلى البيانات للجميع.

حالات استخدام علم البيانات

تستطيع المؤسسات الاستفادة من علم البيانات لتحقيق العديد من الفوائد. تشمل حالات الاستخدام الشائعة تحسين العمليات من خلال الأتمتة الذكية وتحسين الاستهداف والتخصيص لتحسين تجربة العملاء (CX). ومع ذلك، تتضمن الأمثلة الأكثر تحديدًا ما يلي:

فيما يلي بعض الأمثلة التوضيحية لحالات استخدام علم البيانات والذكاء الاصطناعي:

  • بنك دولي يقدِّم خدمات القروض بشكل أسرع عبر تطبيق للأجهزة المحمولة باستخدام نماذج تقييم المخاطر الائتمانية المدعومة بالتعلم الآلي، وبنية حوسبة سحابية هجينة تجمع بين القوة والأمان.
  • شركة إلكترونيات تعمل على تطوير مستشعرات مطبوعة بتقنية ثلاثية الأبعاد فائقة القوة لتوجيه سيارات المستقبل ذاتية القيادة. يعتمد الحل على أدوات علم البيانات والتحليلات لتعزيز قدرات الكشف عن الأجسام في الوقت الفعلي.
  • مزوِّد حلول أتمتة العمليات الآلية (RPA) يطوِّر حلًا لاستخراج عمليات الأعمال المعرفية يقلل من أوقات معالجة الحوادث بنسبة تتراوح بين 15% و95% لشركات عملائه. يتم تدريب الحل على فهم محتوى العملاء ورسائلهم، لتوجيه فرق الخدمة نحو إعطاء الأولوية للرسائل الأكثر صلة والعاجلة.
  • أنشأت شركة تكنولوجيا الإعلام الرقمي منصة لتحليل الجمهور تمكِّن عملاءها من معرفة ما يجذب مشاهدي التليفزيون مع تزايد خيارات القنوات الرقمية. يستخدم الحل التحليلات المتعمقة والتعلم الآلي لجمع رؤى في الوقت الفعلي حول سلوك المشاهدين.
  • إدارة شرطة حضرية تُنشئ أدوات تحليل إحصائي للحوادث لمساعدة الضباط على معرفة متى وأين يتم نشر الموارد؛ بهدف منع الجريمة. يُنتج الحل القائم على البيانات تقارير ولوحات معلومات لتعزيز الوعي بالوضع لدى الضباط الميدانيين.
  • استخدمت شركة Shanghai Changjiang Science and Technology Development تقنية IBM® Watson لبناء منصة تقييم طبي قائمة على الذكاء الاصطناعي، تستطيع تحليل السجلات الطبية الحالية لتصنيف المرضى حسب خطر إصابتهم بالسكتة الدماغية، وتقدير معدل نجاح خطط العلاج المختلفة.
حلول ذات صلة
أدوات التحليلات والحلول ذات الصلة بها

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
اتخِذ الخطوة التالية

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات اكتشف خدمات التحليلات