يدرس عالم البيانات مجموعات كبيرة من البيانات باستخدام التحليل الإحصائي المتقدم وخوارزميات التعلم الآلي. من خلال ذلك، يقومون بتحديد الأنماط في البيانات لاستخلاص رؤى حاسمة للأعمال، ثم يستخدمون هذه الأنماط عادةً لتطوير حلول التعلم الآلي للحصول على رؤى أكثر كفاءة ودقة على نطاق واسع. والأهم من ذلك، أنهم يجمعون بين خبرتهم في الإحصاء وخبرتهم في هندسة البرمجيات.
تشمل بعض مسؤولياته الرئيسية ما يلي:
- تحويل مجموعات البيانات الكبيرة وتنظيفها إلى تنسيق قابل للاستخدام.
- تطبيق تقنيات مثل التجميع والشبكات العصبية وأشجار القرار لاكتساب رؤى من البيانات.
- تحليل البيانات لتحديد الأنماط واكتشاف التوجهات التي يمكن أن تؤثِّر في الأعمال.
- تطوير خوارزميات التعلم الآلي (الرابط موجود خارج موقع ibm.com) لتقييم البيانات.
- إنشاء نماذج البيانات للتنبؤ بالنتائج.
تشمل المهارات المهمة لعالم البيانات ما يلي:
- خبرة في SAS وR وPython.
- خبرة عميقة في التعلم الآلي وتكييف البيانات والرياضيات المتقدمة.
- تجربة في استخدام أدوات البيانات الكبيرة.
- فهم تطوير واجهة برمجة التطبيقات وعملياتها.
- خلفية في تحسين البيانات واستخراج البيانات.
- قدرة قوية على التفكير الإبداعي وصناعة القرار.
كيف يتناسب كل ذلك معًا؟
حتى عند عرض أوصاف مهندس البيانات، وعالم البيانات، ومهندس التحليلات جنبًا إلى جنب، قد يسبب ذلك بعض الالتباس، نظرًا لتداخل المهارات ومجالات التركيز بين هذه الأدوار. فكيف يتناسب كل ذلك معًا؟
مهندس البيانات يطوِّر برامج تولِّد البيانات، ورغم أنه يسعى إلى أن تكون تلك البيانات ذات معنى، فإنها تظل بحاجة إلى دمجها مع مصادر أخرى. يجمع مهندس التحليلات بين تلك المصادر البيانية لبناء أنظمة تُتيح للمستخدمين الوصول إلى رؤى موحَّدة بطريقة سهلة ومتكررة. وأخيرًا، يطوِّر عالم البيانات أدوات لتحليل كل هذه البيانات على نطاق واسع واكتشاف الأنماط والتوجهات بسرعة ودقة تفوق قدرة أي إنسان.
والأهم من ذلك، يجب أن تكون هناك علاقة قوية بين هذه الأدوار. لكن في كثير من الأحيان، ينتهي الأمر بالخلل الوظيفي. كتب Jeff Magnuson، نائب رئيس قسم منصة البيانات في شركة Stitch Fix، عن هذا الموضوع قبل عدة سنوات في مقال بعنوان Engineers Shouldn’t Write ETL (الرابط موجود خارج موقع ibm.com).كانت خلاصة مقاله أن الفرق لا ينبغي أن تضم فئة للمفكرين وأخرى للمنفذين. بل إن فرق البيانات عالية الكفاءة تحتاج إلى تحمُّل المسؤولية الكاملة عن العمل الذي تُنجزه من البداية إلى النهاية، أي أنه لا ينبغي أن تسود عقلية “تمرير المهام للجهة الأخرى” بين هذه الأدوار.
والنتيجة هي ارتفاع الطلب على علماء البيانات الذين لديهم خلفية هندسية ويفهمون أشياء مثل كيفية بناء عمليات قابلة للتكرار وأهمية وقت التشغيل واتفاقيات مستوى الخدمة. أما هذا النهج فله تأثير على دور مهندسي البيانات، حيث يمكنهم العمل جنبًا إلى جنب مع عالم البيانات بطريقة مختلفة تمامًا. وبطبيعة الحال، ينطبق هذا أيضًا على مهندسي التحليلات.
فهم الفرق بين مهندس البيانات، وعالم البيانات، ومهندس التحليلات بشكل نهائي - في الوقت الحالي
تظل الحقيقة أن العديد من المؤسسات تحدِّد كل دور من هذه الأدوار بشكل مختلف. من الصعب رسم خط فاصل واضح بين نهاية دور وبداية آخر، لأن جميعها تؤدي مهام متشابهة إلى حد ما. كما يختتم Josh Laurito قائلًا: “الجميع يكتب استعلامات SQL. الجميع يهتم بالجودة. الجميع يقيّم الجداول المختلفة ويكتب البيانات في مكانٍ ما، والجميع يشتكي من المناطق الزمنية. الجميع يفعل الكثير من الأمور نفسها. لذا فإن الطريقة الحقيقية التي نميّز بها الأدوار تعتمد على موقع كل شخص بالنسبة لمخازن بياناتنا التحليلية الأساسية”.
في شركة Squarespace، يعني ذلك أن مهندسي البيانات مسؤولون عن جميع الأعمال المتعلقة بإنشاء وصيانة مخازن البيانات، بينما يعمل مهندسو التحليلات ضمن الفرق الوظيفية لدعم عملية اتخاذ القرار، وبناء روايات قائمة على البيانات، واستخدامها لتعزيز القرارات والإجراءات. أما علماء البيانات فيتوسطون المشهد، حيث يضعون هياكل الحوافز والمعايير التي توجِّه عملية اتخاذ القرار وتُرشد الأفراد.
بطبيعة الحال، سيختلف ذلك قليلًا من مؤسسة إلى أخرى. ومع ضبابية الحدود بين هذه الأدوار في الوقت الحالي، فإن كلًّا منها سيواصل التطور، ما سيُحدث مزيدًا من التغيّر في ديناميكيات العلاقة بينها. لكن نأمل بأن تساعد هذه النظرة العامة في الإجابة عن سؤال الفرق بين مهندس البيانات وعالِم البيانات ومهندس التحليلات – على الأقل في الوقت الحالي.
تعرَّف أكثر على IBM® Databand، منصة قابلية الملاحظة المستمرة للبيانات، وكيف تساعد على اكتشاف حوادث البيانات مبكرًا، وحلها بسرعة أكبر، وتقديم بيانات أكثر موثوقية للأعمال. إذا كنت مستعدًا لإلقاء نظرة أعمق، فاحجز عرضًا توضيحيًا اليوم.