مشرفو البيانات مكلفون بإدارة برامج الإشراف على البيانات. تشمل مسؤوليات الإشراف على البيانات المحددة تحديد مقاييس جودة البيانات وإدارة البيانات الوصفية والبيانات المرجعية وتتبع دورة حياة البيانات وتصنيف البيانات الحساسة.
يمكن أن تدعم التقنيات والأدوات المختلفة مهام سير عمل الإشراف على البيانات، بما في ذلك الذكاء الاصطناعي (AI)، وفهرسات البيانات، وقواعد البيانات العلائقية، ومنصات جودة البيانات، وبرامج حوكمة البيانات.
تقوم الشركات اليوم بجمع وتحليل المزيد من البيانات أكثر من أي وقت مضى على أمل الحصول على رؤى قيّمة. ومع ذلك، فإن جمع البيانات والتحليلات بمفردها لا يكفي لتأمين نتائج ناجحة. يمكن لعملية الإشراف على البيانات ومشرفي البيانات دعم وتوجيه الاستخدام الفعال للبيانات ضمن ثقافة قائمة على البيانات.
في السنوات الأخيرة، مع الاعتماد المتزايد على الذكاء الاصطناعي، اكتسب الإشراف على البيانات أهمية إضافية. تستهلك وتنتج أنظمة الذكاء الاصطناعي كميات هائلة من البيانات. يساعد الإشراف على البيانات على ضمان جودة وسلامة تلك البيانات بحيث تكون العمليات التجارية المدعومة بالذكاء الاصطناعي فعالة ومتوافقة مع لوائح الحكومة ومتماشية مع معايير الحوكمة وأخلاقيات الذكاء الاصطناعي.
تتيح برامج الإشراف الجيدة على البيانات تنظيم البيانات بنجاح من خلال تحسين جودة البيانات وإمكانية الوصول إليها وسهولة الاستخدام والأمان. يساعد مشرفو البيانات في ضمان قدرة الموظفين على الوصول إلى بيانات الأعمال المفيدة والدقيقة لتمكين اتخاذ قرارات قائمة على البيانات وتحقيق مكاسب في الإنتاجية مستندة إلى الذكاء الاصطناعي. تتضمن الميزات الإضافية للإشراف على البيانات تفسير البيانات بشكل أكثر اتساقًا وتحسين الجاهزية للتدقيق.
غالبًا ما يتعاون مشرفو البيانات مع مجموعة من الأطراف المعنية—بما في ذلك مالكي البيانات ومحللي البيانات وخبراء علوم البيانات ومستخدمي الأعمال بشكل عام—لتحقيق هذه الفوائد.
ومع ذلك، قد يتحمل الموظفون الذين لا يُعترف بهم رسميًا كـ "مشرفي بيانات" مسؤوليات الإشراف على البيانات ويكرسون وقتًا كبيرًا لتلبية احتياجات المؤسسات من البيانات مثل جرد البيانات وتقييم جودة البيانات. ومع ذلك، يقول بعض خبراء إدارة البيانات إن إضفاء الطابع الرسمي على أدوار الإشراف على البيانات أمر مهم لأنه يشير إلى جدية الشركة في إدارة جودة البيانات.1
إدارة البيانات والإشراف على البيانات مفهومان منفصلان ولكنهما مرتبطان. تساعد برامج إدارة البيانات الخاصة بالشركات على ضمان سلامة البيانات و أمن البيانات من خلال السياسات والمعايير والإجراءات الخاصة بجمع البيانات وامتلاكها وتخزينها ومعالجتها واستخدامها. تستلزم العديد من مسؤوليات الإشراف على البيانات تنفيذ القواعد الموضحة في أطر عمل إدارة البيانات. وعلى هذا النحو، يمكن اعتبار الإشراف على البيانات "الجانب التشغيلي" لإدارة البيانات.2
قد يكون للشركات التي لديها برامج أكثر نضجًا للإشراف على البيانات أنواع مختلفة من أدوار مشرفي البيانات، بما في ذلك:
تتضمن حالات الاستخدام للإشراف على البيانات ما يلي:
غالبًا ما يكون الإشراف على البيانات أمرًا أساسيًا لإدارة البيانات الرئيسية (MDM)، وهو نهج لإدارة البيانات المهمة للمؤسسة من خلال التكنولوجيا والأدوات والعمليات. تستخدم المؤسسات نهج إدارة البيانات الرئيسية لإنشاء مصدر واحد للحقيقة يدمج البيانات من مصادر مختلفة بحيث يعمل جميع مستخدمي البيانات بنفس المعلومات.
غالبًا ما تبدأ الشركات ومشرفو البيانات في تنفيذ مبادرة إدارة البيانات الرئيسية في مجال بيانات واحد (مجموعات منطقية من البيانات المتشابهة، مثل بيانات العملاء أو بيانات الموظفين) قبل توسيع نطاق هذا العمل عبر أصول البيانات الخاصة بالمؤسسة.4
يمكن لمشرفو البيانات تحسين جودة البيانات من خلال مراجعة محتويات قاعدة البيانات، وهو ما يُعرف باسم توصيف البيانات. كما يعملون أيضًا مع الأطراف المعنية في البيانات لإنشاء تعريفات البيانات، وتصميم مقاييس جودة البيانات، ووضع قواعد العمل للبيانات، مثل تحديد القيم الصالحة وغير الصالحة.
على سبيل المثال، كما هو موضح في كتاب "الإشراف على البيانات"، عندما تكون البيانات التي تم جمعها هي الحالة الاجتماعية للعميل، قد تنص القاعدة على أن "أعزب" أو "متزوج" أو "أرمل" أو "مطلق" ستكون قيمًا صحيحة، بينما تعتبر الإجابة الفارغة غير صالحة.5 يمكن لمشرفي البيانات أيضًا تقديم مدخلات حول معالجة مشكلات جودة البيانات عند ظهورها.
البيانات الوصفية هي المعلومات التي تصف نقطة بيانات أو مجموعة بيانات، مثل تاريخ إنشاء البيانات أو تفاصيل التأليف. يمكن أن يكون مشرفو البيانات مسؤولين عن إنشاء بيانات وصفية عالية الجودة وتقييم جودة البيانات الوصفية الحالية. كما هو الحال مع جودة البيانات العامة، يتم تكليف مشرفي البيانات بمعالجة مشكلات جودة البيانات الوصفية.
غالبا ما يحتفظ مشرفو البيانات بالبيانات المرجعية، وهي البيانات التي تصنف البيانات الأخرى داخل المؤسسة. تتضمن أمثلة البيانات المرجعية رموز الدولة ومعلومات العملة ورموز المنتجات. ومن خلال توثيق البيانات، يمكن لمشرفي البيانات تسجيل قيم صالحة للبيانات المرجعية، وتقييم ما إذا كانت القيم الصالحة الجديدة ضرورية ومطابقة قيم البيانات المرجعية عبر الأنظمة المختلفة.
في الحالة الأخيرة، وباستخدام مثال الحالة الاجتماعية، قد يُكلّف مشرف البيانات بتحديد الإجراءات التي يجب اتخاذها عندما يسمح أحد الأنظمة بـ "أرمل" و"مطلق" كبيانات للحالة الاجتماعية بينما يقبل نظام آخر "متزوج" و"أعزب" فقط."6
في كثير من الأحيان، تمثل مثيلات متعددة من البيانات نفس الكيان. لنأخذ على سبيل المثال، عميل واحد يظهر عدة مرات في قاعدة بيانات سلسلة صيدليات لأنه كان لديه وصفات طبية مختلفة تم صرفها في مخازن مختلفة.
من خلال عملية تعرف باسم "حل الهوية"، يحدد مشرفو البيانات متى تشير مثيلات البيانات المختلفة إلى نفس الكيان. في حالة عميل الصيدلية، على سبيل المثال، يمكن أن يساعد حل الهوية في ضمان اكتشاف التفاعلات الدوائية التي يحتمل أن تكون خطرة عند ملء وصفات العميل الطبية.7
أمن المعلومات هو حماية المعلومات الهامة ضد الوصول غير المصرح به أو الكشف عنها أو استخدامها أو تغييرها أو تعطيلها. بموجب لوائح خصوصية البيانات، يتعين على الشركات تنفيذ إجراءات حماية معززة للمعلومات الحساسة مثل بيانات الرعاية الصحية. كما يطلب منهم الامتثال للقواعد التي تحكم مشاركة البيانات والحد من جمع البيانات وغير ذلك. يمكن أن يلعب مشرفو البيانات دورًا في حماية البيانات والامتثال التنظيمي من خلال إنشاء وتأسيس تصنيفات أمنية لأنواع مختلفة من البيانات.
دورة حياة البيانات هو عملية تتبع دورات حياة البيانات، مما يوفر فهمًا واضحًا لمكان نشأة البيانات وكيف تغيرت ووجهتها النهائية. يمكن لمشرفي البيانات تتبع دورة الحياة، مما يساعد المؤسسة على تأكيد سلامة البيانات لأغراض إعداد التقارير التنظيمية.
إن ضعف جودة البيانات قد يؤدي إلى تعريض العمليات التجارية للخطر. يمكن لمشرفي البيانات العمل مع قادة العمليات التجارية لتحديد استخدام البيانات في عملية ما ومدى تعرض العملية للفشل في حالة ضعف جودة البيانات.8
يمكن للمؤسسات تنفيذ حلول وأدوات مختلفة لدعم أنشطة الإشراف على البيانات، بما في ذلك:
الذكاء الاصطناعي والإشراف على البيانات لهما علاقة يمكن اعتبارها تكافلية من وجهة نظر البعض. بينما يساعد الإشراف على البيانات على ضمان عمل أنظمة الذكاء الاصطناعي باستخدام بيانات عالية الجودة، يمكن للأدوات القائمة على الذكاء الاصطناعي تحسين مهام الإشراف على البيانات. على سبيل المثال، يمكن لأدوات إعداد البيانات المدعومة بالذكاء الاصطناعي إجراء عمليات التحقق من الصحة وتحديد الأخطاء مثل التنسيق غير السليم، في حين يمكن لأدوات منع فقدان البيانات المستندة إلى الذكاء الاصطناعي كشف المعلومات الحساسة وتطبيق الضوابط الأمنية حسب الضرورة.
كتالوج البيانات هو عبارة عن جرد جميع الأصول الموجودة في المؤسسة. إنه مصمم لمساعدة مشرفي البيانات وغيرهم من محترفي البيانات في العثور على المعلومات بسهولة وسرعة. تتيح البيانات الوصفية المرتبطة بكل أصل بيانات إمكانية البحث في الكتالوج.
يمكن لأدوات توصيف البيانات وتحليلها تقييم البيانات من حيث الاتساق والجودة. وقد تتضمن ميزات هذه الأدوات قدرات لتحديد حالات الخلل، والتحقق من صحة مصادر البيانات، وتلخيص نتائج التحليل من خلال التقارير المخصصة.
تتمثل إحدى الطرق التي ينظم بها مشرفو البيانات البيانات من خلال قواعد البيانات العلائقية. قاعدة البيانات العلائقية (RDB) هي نوع من قواعد البيانات يتم فيها تنظيم البيانات في صفوف وأعمدة. قد يتم ربط الجداول الناتجة معًا لتوضيح العلاقات بين نقاط البيانات. أنظمة إدارة قواعد البيانات العلائقية (RDBMS) هي حلول برمجية يمكن لمشرفي البيانات وغيرهم استخدامها للحفاظ على قواعد البيانات العلائقية وتحديثها.
برامج إدارة البيانات غالبًا ما تتضمن أدوات توصيف وتحليل البيانات بالإضافة إلى القدرات المستندة إلى الذكاء الاصطناعي. قد تتضمن الميزات إثراء البيانات الوصفية المدعومة بالذكاء الاصطناعي وإنشاء كتالوج البيانات وتتبع دورة حياة البيانات وإنشاء التحكم في الوصول إلى البيانات المستند إلى الأدوار.
تؤدي كل الروابط إلى مواقع خارج ibm.com.
1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 10 April 2015.
2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition.” Academic Press. 20 November 2020.
صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.
يتيح لك watsonx.data توسيع نطاق التحليلات والذكاء الاصطناعي باستخدام جميع بياناتك، أينما كانت، من خلال مخزن بيانات مفتوح وهجين ومُدار.
استفِد من قيمة بيانات المؤسسة باستخدام IBM Consulting، من خلال بناء مؤسسة تعتمد على الرؤى التي تقدِّم ميزة للأعمال.