ما المقصود بدورة حياة البيانات؟

31 مايو 2022

ما المقصود بدورة حياة البيانات؟

دورة حياة البيانات هي عملية تتبُّع تدفق البيانات بمرور الوقت، ما يوفر فهمًا واضحًا لمصدر البيانات وكيفية تَغيُّرها ووجهتها النهائية داخل مسار البيانات.

توفِّر أدوات دورة حياة البيانات سجلًا للبيانات طوال دورة حياتها، بما في ذلك معلومات المصدر وأي تحويلات للبيانات تم تطبيقها أثناء أيٍّ من عمليات الاستخراج والتحويل والتحميل (ETL) أو الاستخراج والتحميل والتحويل (ELT).

يتيح هذا النوع من التوثيق للمستخدمين مراقبة وتتبع نقاط الاتصال المختلفة على طول رحلة البيانات، ما يسمح للمنظمات بالتحقق من دقة البيانات واتساقها. ويشكل ذلك قدرة بالغة الأهمية لضمان جودة البيانات داخل المنظمة، ويتم استخدامها عادةً لاكتساب سياق حول العمليات السابقة، بالإضافة إلى تتبع الأخطاء وصولاً إلى السبب الأساسي.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

الفرق بين دورة حياة البيانات ومصدر البيانات وإدارة البيانات

تعتبر دورة حياة البيانات ومصدر البيانات وحوكمة البيانات مصطلحات وثيقة الصلة بعضها ببعض، وتتداخل بعضها مع بعض أيضًا. وتضمن هذه المفاهيم معًا قدرة المنظمة على الحفاظ على جودة البيانات وأمن البيانات بمرور الوقت.

تنشئ إدارة البيانات هيكلاً داخل المنظمات لإدارة أصول البيانات من خلال تحديد مالكي البيانات ومصطلحات الأعمال والقواعد والسياسات والعمليات طوال دورة حياة البيانات. وتساعد حلول دورة حياة البيانات فرق إدارة البيانات في ضمان امتثال البيانات لهذه المعايير، من خلال توفير رؤية حول كيفية تغير البيانات داخل مسار البيانات. أما مصطلح مصدر البيانات، فيُستخدم عادةً في سياق دورة حياة البيانات، ولكنه يشير تحديدًا إلى المثيل الأول لتلك البيانات أو مصدرها.

توفر دورة حياة البيانات سجل تدقيق للبيانات على مستوى دقيق للغاية؛ حيث إن هذا النوع من التفاصيل مفيد للغاية لتصحيح أي أخطاء في البيانات، ما يسمح لمهندسي البيانات باستكشاف الأخطاء وتحديد الحلول بشكل أكثر فعالية وبسرعة أكبر. وعلى الرغم من أن نطاق إدارة البيانات أوسع من دورة حياة البيانات ومصدر البيانات، فإن هذا الجانب من إدارة البيانات يشكل أهمية خاصة في فرض المعايير التنظيمية.

Mixture of Experts | 25 أبريل، الحلقة 52

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم في أثناء سعيهم للتغلب على الفوضى والضوضاء المحيطة بالذكاء الاصطناعي لتزويدك بأحدث أخباره والرؤى المتعلقة به.

ما السبب وراء استخدام الشركات لدورة حياة البيانات؟

تُعَد البيانات الموثوق بها ضرورية لتحسين عملية صنع القرار وتعزيز العمليات بشكل أفضل في جميع جوانب الأعمال - بدايةً من المبيعات ووصولًا إلى الموارد البشرية. ومع ذلك، لا تكون هذه المعلومات ذات قيمة إلا إذا ظلت الأطراف المعنية واثقة من دقتها، حيث إن جودة الرؤى تعتمد على جودة البيانات.وتوفِّر دورة حياة البيانات إمكانية رؤية التغييرات التي قد تحدث نتيجة لعمليات ترحيل البيانات وتحديثات النظام والأخطاء وغيرها، ما يضمن سلامة البيانات طوال دورة حياتها.

توثق دورة حياة البيانات العلاقة بين بيانات المؤسسة في مختلف الأعمال وتطبيقات تقنية المعلومات. وهذه التفاصيل يمكن أن تشمل ما يلي:

  • مكان تخزين البيانات وكيفية تخزينها في بيئات مختلفة، مثل: البيانات المخزنة محليًا أو في مستودع بيانات أو في بحيرة بيانات.
  • كيفية استخدام البيانات، والشخص المسؤول عن تحديث البيانات واستخدامها وتعديلها. ويتضمن ذلك أيضًا الأدوار والتطبيقات المصرح لها بالوصول إلى أجزاء محددة من البيانات الحساسة، مثل معلومات التعريف الشخصية (PII).
  • تتبع البيانات التي تم إنشاؤها وتحميلها وتعديلها من قبل مستخدمي الأعمال والتطبيقات. على سبيل المثال، قد يتمثل ذلك في إضافة جهات اتصال جديدة إلى نظام إدارة علاقات العملاء (CRM)، أو في تحويل البيانات، مثل إزالة السجلات المكررة.
  • البيانات التي يتم إنشاؤها ودمجها من أجزاء مختلفة من المنظمة، مثل أجهزة الشبكات والخوادم.

كيفية عمل دورة حياة البيانات

تسمح البيانات الوصفية لمستخدمي أدوات دورة حياة البيانات بفهم كامل حول كيفية تدفق البيانات عبر مسارات البيانات. وتعبر البيانات الوصفية عن "البيانات حول البيانات"، والتي تتضمن معلومات متنوعة حول أصول البيانات، مثل نوع البيانات وتنسيقها وهيكلها ومؤلفها وتاريخ إنشائها وتاريخ تعديلها وحجم الملف. وتوفر أدوات دورة حياة البيانات صورة كاملة عن البيانات الوصفية مما يساعد المستخدمين في تحديد مدى فائدة البيانات لهم.

مع تطور البيانات الكبيرة في السنوات الأخيرة، تطورت طرق تخزين البيانات والاستفادة منها. يزداد استثمار الشركات في علم البيانات لتحسين عملية صنع القرار وتحقيق نتائج الأعمال. ومع ذلك، ولكي تتمكن الشركات من بناء تحليل جيد التكوين، تحتاج الشركات إلى الاستعانة بأدوات دورة حياة البيانات وفهارس البيانات لتمارين اكتشاف البيانات وتخطيطها. في حين تُظهر أدوات دورة حياة البيانات تطور البيانات بمرور الوقت عبر البيانات الوصفية، يستخدم كتالوج البيانات المعلومات نفسها لإنشاء مخزون قابل للبحث لجميع الأصول في المؤسسة. وتعمل هذه العناصر معًا على تمكين مواطني البيانات من فهم أهمية عناصر البيانات المختلفة لتحقيق نتيجة معينة، وهو أمر أساسي في تطوير أي خوارزميات تعلم آلي.

حالات استخدام دورة حياة البيانات

تسعى الشركات اليوم إلى الحصول على معارف في الوقت الحقيقي، ولكن هذه النتائج تتوقف على فهم البيانات ورحلتها عبر مسار البيانات. وثمة بعض الطرق التي يمكن للفرق من خلالها الاستفادة من أدوات دورة حياة البيانات المتكاملة لتحسين مهام سير العمل، وتشمل ما يلي:

نمذجة البيانات: لإنشاء تمثيلات مرئية لعناصر البيانات المختلفة والروابط المقابلة لها داخل المؤسسة، يجب على الشركات تحديد هياكل البيانات الأساسية التي تدعمها. وتساعد دورة حياة البيانات على نمذجة هذه العلاقات، وتوضيح التبعيات المختلفة عبر النظام البنائي للبيانات. ونظرًا لتطور البيانات بمرور الوقت، فهناك دائمًا مصادر بيانات جديدة تظهر، وعمليات تكامل بيانات جديدة يجب إجراؤها، وما إلى ذلك. ونتيجةً لذلك، يحتاج نموذج البيانات العام الذي تستخدمه الشركات لإدارة بياناتها أيضًا إلى التكيف مع البيئة المتغيرة. وتساعد دورة حياة البيانات على عكس هذه التغييرات بدقة مع مرور الوقت من خلال مخططات نموذج البيانات، مع تسليط الضوء على الاتصالات أو الجداول الجديدة أو القديمة. وهذا بدوره يساعد المحللين وعلماء البيانات على تسهيل إجراء تحليلات قيّمة وفي الوقت المناسب، حيث سيتوفر لديهم فهم أفضل لمجموعات البيانات.

ترحيل البيانات: عند نقل البيانات إلى نظام تخزين جديد أو اعتماد برامج جديدة، تستخدم المؤسسات ترحيل البيانات لفهم مواقع البيانات ودورة حياتها. ونظرًا لأن دورة حياة البيانات توفِّر رؤية لكيفية تطور هذه البيانات عبر المؤسسة، فإنها تساعد الفرق على التخطيط لعمليات ترحيل أو ترقية هذه الأنظمة، ما يسرِّع من الانتقال الكُلي إلى بيئة التخزين الجديدة. كما أنها توفِّر للفرق فرصة لتنظيف نظام البيانات، وأرشفة أو حذف البيانات القديمة غير ذات الصلة؛ وهذا بدوره يمكن أن يحسِّن من الأداء العام لنظام البيانات، ويقلِّل من كمية البيانات التي تحتاج إلى إدارتها.

الامتثال: توفِّر دورة حياة البيانات آلية امتثال تساعد على عملية التدقيق وتحسين إدارة المخاطر وضمان تخزين البيانات ومعالجتها بما يتماشى مع سياسات ولوائح إدارة البيانات. فعلى سبيل المثال، في عام 2016، تم اعتماد تشريع اللائحة العامة لحماية البيانات (GDPR) بهدف حماية البيانات الشخصية للأفراد في الاتحاد الأوروبي والمنطقة الاقتصادية الأوروبية، ما يمنح الأفراد مزيدًا من التحكم في بياناتهم. وفي الولايات المتحدة الأمريكية، وضعت بعض الولايات، مثل ولاية كاليفورنيا، سياسات مثل قانون California Consumer Privacy Act ‏(CCPA)، الذي يُلزم الشركات بإبلاغ المستهلكين عند جمع بياناتهم. هذا النوع من التشريعات يجعل تخزين هذه البيانات وأمنها أولوية قصوى، ودون أدوات دورة حياة البيانات، ستجد المؤسسات أن مشكلات عدم الامتثال مكلفة وتستغرق وقتًا طويلًا.

تحليل الأثر: يمكن لأدوات دورة حياة البيانات أن توفِّر رؤية واضحة حول تأثير تغييرات معينة في الأعمال، مثل تأثيرها في التقارير اللاحقة. على سبيل المثال، إذا تغيَّر اسم أحد عناصر البيانات، فيمكن أن تساعد دورة حياة البيانات القادة على استيعاب عدد لوحات المعلومات التي سيتأثر بها هذا التغيير، ومن ثمَّ عدد المستخدمين الذين يعتمدون على تلك التقارير. كما يمكن أن تساعد هذه الأدوات على تقييم تأثير أخطاء البيانات ومدى انتشارها عبر المؤسسة. يمكن أن تحدث أخطاء البيانات لأسباب مختلفة، ما قد يُضعف الثقة في بعض تقارير ذكاء الأعمال أو مصادر البيانات، ولكن يمكن لأدوات دورة حياة البيانات أن تساعد الفرق على تتبُّعها إلى مصدرها، ما يُتيح تحسين معالجة البيانات والتواصل مع الفرق المعنية.

حلول ذات صلة
IBM Manta Data Lineage

تصوُّر بياناتك وتحويلها وتحسين تدفقها من المصدر إلى الاستهلاك. طبِّق دورة حياة البيانات على أي سيناريو لتحقيق شفافية ودقة أكبر في عملياتك.

اكتشِف IBM Manta Data Lineage
حلول ذكاء البيانات

تمكَّن من تحويل البيانات غير المنسقة إلى رؤى قابلة للتنفيذ بسرعة، وتوحيد إدارة البيانات، والجودة، ودورة حياة البيانات، والمشاركة، وتمكين مستهلكي البيانات من الحصول على بيانات ملائمة للسياق وموثوق بها.

اكتشِف حلول ذكاء البيانات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

اكتشِف كيف تساعد IBM على بناء أساس بيانات محكم وجاهز للامتثال. مع نظام IBM Manta Data Lineage، يمكنك الحصول على شفافية البيانات من خلال تتبُّع تاريخ بياناتك وتدفقها والنتائج، ما يُتيح لك الحصول على رؤى شاملة من النهاية إلى النهاية. احجز عرضًا توضيحيًا اليوم لتتعرَّف على المزيد.

استكشف IBM Manta Data Lineage استكشف حلول ذكاء البيانات