ما المقصود بالإشراف على البيانات؟

شخصان يجلسان على مكتب معًا ينظران إلى شاشة كمبيوتر كبيرة وجهاز لوحي.

المؤلفين

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

ما المقصود بالإشراف على البيانات؟

الإشراف على البيانات عبارة عن مجموعة من ممارسات إدارة البيانات المصممة للمساعدة في ضمان جودة البيانات وإمكانية الوصول إليها. تعمل برامج الإشراف على البيانات عادةً بما يتماشى مع سياسات إدارة البيانات الخاصة بالمؤسسة.
 

مشرفو البيانات مكلفون بإدارة برامج الإشراف على البيانات. تشمل مسؤوليات الإشراف على البيانات المحددة تحديد مقاييس جودة البيانات وإدارة البيانات الوصفية والبيانات المرجعية وتتبع دورة حياة البيانات وتصنيف البيانات الحساسة.

يمكن أن تدعم التقنيات والأدوات المختلفة مهام سير عمل الإشراف على البيانات، بما في ذلك الذكاء الاصطناعي (AI)، وفهرسات البيانات، وقواعد البيانات العلائقية، ومنصات جودة البيانات، وبرامج حوكمة البيانات.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

لماذا يُعتبر الإشراف على البيانات مهمًا؟

تقوم الشركات اليوم بجمع وتحليل المزيد من البيانات أكثر من أي وقت مضى على أمل الحصول على رؤى قيّمة. ومع ذلك، فإن جمع البيانات والتحليلات بمفردها لا يكفي لتأمين نتائج ناجحة. يمكن لعملية الإشراف على البيانات ومشرفي البيانات دعم وتوجيه الاستخدام الفعال للبيانات ضمن ثقافة قائمة على البيانات.

في السنوات الأخيرة، مع الاعتماد المتزايد على الذكاء الاصطناعي، اكتسب الإشراف على البيانات أهمية إضافية. تستهلك وتنتج أنظمة الذكاء الاصطناعي كميات هائلة من البيانات. يساعد الإشراف على البيانات على ضمان جودة وسلامة تلك البيانات بحيث تكون العمليات التجارية المدعومة بالذكاء الاصطناعي فعالة ومتوافقة مع لوائح الحكومة ومتماشية مع معايير الحوكمة وأخلاقيات الذكاء الاصطناعي.

تتيح برامج الإشراف الجيدة على البيانات تنظيم البيانات بنجاح من خلال تحسين جودة البيانات وإمكانية الوصول إليها وسهولة الاستخدام والأمان. يساعد مشرفو البيانات في ضمان قدرة الموظفين على الوصول إلى بيانات الأعمال المفيدة والدقيقة لتمكين اتخاذ قرارات قائمة على البيانات وتحقيق مكاسب في الإنتاجية مستندة إلى الذكاء الاصطناعي. تتضمن الميزات الإضافية للإشراف على البيانات تفسير البيانات بشكل أكثر اتساقًا وتحسين الجاهزية للتدقيق.

غالبًا ما يتعاون مشرفو البيانات مع مجموعة من الأطراف المعنية—بما في ذلك مالكي البيانات ومحللي البيانات وخبراء علوم البيانات ومستخدمي الأعمال بشكل عام—لتحقيق هذه الفوائد.

ومع ذلك، قد يتحمل الموظفون الذين لا يُعترف بهم رسميًا كـ "مشرفي بيانات" مسؤوليات الإشراف على البيانات ويكرسون وقتًا كبيرًا لتلبية احتياجات المؤسسات من البيانات مثل جرد البيانات وتقييم جودة البيانات. ومع ذلك، يقول بعض خبراء إدارة البيانات إن إضفاء الطابع الرسمي على أدوار الإشراف على البيانات أمر مهم لأنه يشير إلى جدية الشركة في إدارة جودة البيانات.1

أكاديمية الذكاء الاصطناعي

هل تعد إدارة البيانات هي سر الذكاء الاصطناعي التوليدي؟

استكشف سبب أهمية البيانات عالية الجودة للاستخدام الناجح للذكاء الاصطناعي التوليدي.

ما الفرق بين الإشراف على البيانات وإدارة البيانات؟

إدارة البيانات والإشراف على البيانات مفهومان منفصلان ولكنهما مرتبطان. تساعد برامج إدارة البيانات الخاصة بالشركات على ضمان سلامة البيانات و أمن البيانات من خلال السياسات والمعايير والإجراءات الخاصة بجمع البيانات وامتلاكها وتخزينها ومعالجتها واستخدامها. تستلزم العديد من مسؤوليات الإشراف على البيانات تنفيذ القواعد الموضحة في أطر عمل إدارة البيانات. وعلى هذا النحو، يمكن اعتبار الإشراف على البيانات "الجانب التشغيلي" لإدارة البيانات.2

ما هي الأنواع المختلفة للإشراف على البيانات؟

قد يكون للشركات التي لديها برامج أكثر نضجًا للإشراف على البيانات أنواع مختلفة من أدوار مشرفي البيانات، بما في ذلك:

  • مشرف بيانات الأعمال: يتخصص مشرفو بيانات الأعمال في إدارة البيانات ضمن وظائف عمل محددة، مثل التسويق أو خدمة العملاء.

  • مشرف البيانات الفنية: كما يوحي لقبهم، يمتلك مشرفو البيانات الفنية خبرة فنية في عمليات وأنظمة البيانات، بما في ذلك عمليات الاستخراج والتحويل والتحميل (ETL) ومستودعات البيانات.

  • مشرف البيانات المؤسسية: يقود مشرفو البيانات المؤسسية مجتمعات مشرفي البيانات داخل المؤسسة ويعملون كحلقات وصل مع قادة الأعمال.3

ما هي حالات الاستخدام للإشراف على البيانات؟

تتضمن حالات الاستخدام للإشراف على البيانات ما يلي:

  • إدارة البيانات الرئيسية
  • تحسين جودة البيانات
  • إدارة البيانات الوصفية
  • إدارة البيانات المرجعية
  • حل الهوية
  • أمن المعلومات وحماية خصوصية البيانات
  • تتبع دورة حياة البيانات
  • إدارة مخاطر عمليات الأعمال

إدارة البيانات الرئيسية

غالبًا ما يكون الإشراف على البيانات أمرًا أساسيًا لإدارة البيانات الرئيسية (MDM)، وهو نهج لإدارة البيانات المهمة للمؤسسة من خلال التكنولوجيا والأدوات والعمليات. تستخدم المؤسسات نهج إدارة البيانات الرئيسية لإنشاء مصدر واحد للحقيقة يدمج البيانات من مصادر مختلفة بحيث يعمل جميع مستخدمي البيانات بنفس المعلومات.

غالبًا ما تبدأ الشركات ومشرفو البيانات في تنفيذ مبادرة إدارة البيانات الرئيسية في مجال بيانات واحد (مجموعات منطقية من البيانات المتشابهة، مثل بيانات العملاء أو بيانات الموظفين) قبل توسيع نطاق هذا العمل عبر أصول البيانات الخاصة بالمؤسسة.4

تحسين جودة البيانات

يمكن لمشرفو البيانات تحسين جودة البيانات من خلال مراجعة محتويات قاعدة البيانات، وهو ما يُعرف باسم توصيف البيانات. كما يعملون أيضًا مع الأطراف المعنية في البيانات لإنشاء تعريفات البيانات، وتصميم مقاييس جودة البيانات، ووضع قواعد العمل للبيانات، مثل تحديد القيم الصالحة وغير الصالحة.

على سبيل المثال، كما هو موضح في كتاب "الإشراف على البيانات"، عندما تكون البيانات التي تم جمعها هي الحالة الاجتماعية للعميل، قد تنص القاعدة على أن "أعزب" أو "متزوج" أو "أرمل" أو "مطلق" ستكون قيمًا صحيحة، بينما تعتبر الإجابة الفارغة غير صالحة.5 يمكن لمشرفي البيانات أيضًا تقديم مدخلات حول معالجة مشكلات جودة البيانات عند ظهورها.

إدارة البيانات الوصفية

البيانات الوصفية هي المعلومات التي تصف نقطة بيانات أو مجموعة بيانات، مثل تاريخ إنشاء البيانات أو تفاصيل التأليف. يمكن أن يكون مشرفو البيانات مسؤولين عن إنشاء بيانات وصفية عالية الجودة وتقييم جودة البيانات الوصفية الحالية. كما هو الحال مع جودة البيانات العامة، يتم تكليف مشرفي البيانات بمعالجة مشكلات جودة البيانات الوصفية.

إدارة البيانات المرجعية

غالبا ما يحتفظ مشرفو البيانات بالبيانات المرجعية، وهي البيانات التي تصنف البيانات الأخرى داخل المؤسسة. تتضمن أمثلة البيانات المرجعية رموز الدولة ومعلومات العملة ورموز المنتجات. ومن خلال توثيق البيانات، يمكن لمشرفي البيانات تسجيل قيم صالحة للبيانات المرجعية، وتقييم ما إذا كانت القيم الصالحة الجديدة ضرورية ومطابقة قيم البيانات المرجعية عبر الأنظمة المختلفة.

في الحالة الأخيرة، وباستخدام مثال الحالة الاجتماعية، قد يُكلّف مشرف البيانات بتحديد الإجراءات التي يجب اتخاذها عندما يسمح أحد الأنظمة بـ "أرمل" و"مطلق" كبيانات للحالة الاجتماعية بينما يقبل نظام آخر "متزوج" و"أعزب" فقط."6

حل الهوية

في كثير من الأحيان، تمثل مثيلات متعددة من البيانات نفس الكيان. لنأخذ على سبيل المثال، عميل واحد يظهر عدة مرات في قاعدة بيانات سلسلة صيدليات لأنه كان لديه وصفات طبية مختلفة تم صرفها في مخازن مختلفة.

من خلال عملية تعرف باسم "حل الهوية"، يحدد مشرفو البيانات متى تشير مثيلات البيانات المختلفة إلى نفس الكيان. في حالة عميل الصيدلية، على سبيل المثال، يمكن أن يساعد حل الهوية في ضمان اكتشاف التفاعلات الدوائية التي يحتمل أن تكون خطرة عند ملء وصفات العميل الطبية.7

أمن المعلومات وحماية خصوصية البيانات

أمن المعلومات هو حماية المعلومات الهامة ضد الوصول غير المصرح به أو الكشف عنها أو استخدامها أو تغييرها أو تعطيلها. بموجب لوائح خصوصية البيانات، يتعين على الشركات تنفيذ إجراءات حماية معززة للمعلومات الحساسة مثل بيانات الرعاية الصحية. كما يطلب منهم الامتثال للقواعد التي تحكم مشاركة البيانات والحد من جمع البيانات وغير ذلك. يمكن أن يلعب مشرفو البيانات دورًا في حماية البيانات والامتثال التنظيمي من خلال إنشاء وتأسيس تصنيفات أمنية لأنواع مختلفة من البيانات.

تتبع دورة حياة البيانات

دورة حياة البيانات هو عملية تتبع دورات حياة البيانات، مما يوفر فهمًا واضحًا لمكان نشأة البيانات وكيف تغيرت ووجهتها النهائية. يمكن لمشرفي البيانات تتبع دورة الحياة، مما يساعد المؤسسة على تأكيد سلامة البيانات لأغراض إعداد التقارير التنظيمية.

إدارة مخاطر عمليات الأعمال

إن ضعف جودة البيانات قد يؤدي إلى تعريض العمليات التجارية للخطر. يمكن لمشرفي البيانات العمل مع قادة العمليات التجارية لتحديد استخدام البيانات في عملية ما ومدى تعرض العملية للفشل في حالة ضعف جودة البيانات.8

ما هي التقنيات والأدوات التي تدعم الإشراف على البيانات؟

يمكن للمؤسسات تنفيذ حلول وأدوات مختلفة لدعم أنشطة الإشراف على البيانات، بما في ذلك:

  • الذكاء الاصطناعي (AI)
  • كتالوجات البيانات
  • أدوات توصيف وتحليل البيانات
  • نظم إدارة قواعد البيانات العلائقية (RDBMS)
  • برنامج إدارة البيانات

الذكاء الاصطناعي

الذكاء الاصطناعي والإشراف على البيانات لهما علاقة يمكن اعتبارها تكافلية من وجهة نظر البعض. بينما يساعد الإشراف على البيانات على ضمان عمل أنظمة الذكاء الاصطناعي باستخدام بيانات عالية الجودة، يمكن للأدوات القائمة على الذكاء الاصطناعي تحسين مهام الإشراف على البيانات. على سبيل المثال، يمكن لأدوات إعداد البيانات المدعومة بالذكاء الاصطناعي إجراء عمليات التحقق من الصحة وتحديد الأخطاء مثل التنسيق غير السليم، في حين يمكن لأدوات منع فقدان البيانات المستندة إلى الذكاء الاصطناعي كشف المعلومات الحساسة وتطبيق الضوابط الأمنية حسب الضرورة.

كتالوجات البيانات

كتالوج البيانات هو عبارة عن جرد جميع الأصول الموجودة في المؤسسة. إنه مصمم لمساعدة مشرفي البيانات وغيرهم من محترفي البيانات في العثور على المعلومات بسهولة وسرعة. تتيح البيانات الوصفية المرتبطة بكل أصل بيانات إمكانية البحث في الكتالوج.

أدوات توصيف وتحليل البيانات

يمكن لأدوات توصيف البيانات وتحليلها تقييم البيانات من حيث الاتساق والجودة. وقد تتضمن ميزات هذه الأدوات قدرات لتحديد حالات الخلل، والتحقق من صحة مصادر البيانات، وتلخيص نتائج التحليل من خلال التقارير المخصصة.

أنظمة إدارة قواعد البيانات العلائقية

تتمثل إحدى الطرق التي ينظم بها مشرفو البيانات البيانات من خلال قواعد البيانات العلائقية. قاعدة البيانات العلائقية (RDB) هي نوع من قواعد البيانات يتم فيها تنظيم البيانات في صفوف وأعمدة. قد يتم ربط الجداول الناتجة معًا لتوضيح العلاقات بين نقاط البيانات. أنظمة إدارة قواعد البيانات العلائقية (RDBMS) هي حلول برمجية يمكن لمشرفي البيانات وغيرهم استخدامها للحفاظ على قواعد البيانات العلائقية وتحديثها.

برنامج إدارة البيانات

برامج إدارة البيانات غالبًا ما تتضمن أدوات توصيف وتحليل البيانات بالإضافة إلى القدرات المستندة إلى الذكاء الاصطناعي. قد تتضمن الميزات إثراء البيانات الوصفية المدعومة بالذكاء الاصطناعي وإنشاء كتالوج البيانات وتتبع دورة حياة البيانات وإنشاء التحكم في الوصول إلى البيانات المستند إلى الأدوار.

الحواشي

تؤدي كل الروابط إلى مواقع خارج ibm.com.

1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 10 April 2015.

2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition.” Academic Press. 20 November 2020.

حلول ذات صلة
برمجيات وحلول إدارة البيانات

صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.

استكشف حلول إدارة البيانات
IBM watsonx.data

يتيح لك watsonx.data توسيع نطاق التحليلات والذكاء الاصطناعي باستخدام جميع بياناتك، أينما كانت، من خلال مخزن بيانات مفتوح وهجين ومُدار.

اكتشف watsonx.data
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة باستخدام IBM Consulting، من خلال بناء مؤسسة تعتمد على الرؤى التي تقدِّم ميزة للأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.

استكشف حلول إدارة البيانات اكتشف watsonx.data