استراتيجية بنية البيانات لجودة البيانات

مكتبة رائعة مبنية في فترة الستينيات

مؤلف

Grzegorz Przybycień

Senior Product Manager

Watson Knowledge Catalog

تُعد جودة البيانات الرديئة من أهم الحواجز التي تواجهها المجموعات التي تطمح لأن تكون قائمة على البيانات بشكل أكبر. ويمكن أن تنجم عن مشاكل جودة البيانات جميعًا: القرارات التجارية غير المناسبة توقيتًا، والعمليات التجارية المبنية على معلومات خاطئة، وفرص الإيرادات الضائعة، والمبادرات التجارية الفاشلة، وأنظمة البيانات المعقدة. ويمكن لمشكلة واحدة فقط من هذه المشكلات أن تكون مكلفة للمجموعة. ويمكن أن يكون الاضطرار إلى التعامل معها جميعًا أمرًا مدمرًا.

تحدد عدة عوامل جودة بيانات مؤسستك مثل الدقة والاكتمال والاتساق، على سبيل المثال لا الحصر. ولكن هناك عامل آخر من عوامل جودة البيانات لا يحظى بالتقدير الذي يستحقه: بنية البيانات الخاصة بك.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.

كيف يعمل تصميم البيانات الصحيح على تحسين جودة البيانات

يمكن أن تساعد البنية الصحيحة للبيانات مجموعتك على تحسين جودة البيانات لأنها توفر إطار العمل الذي يحدد كيفية جمع البيانات ونقلها وتخزينها وتأمينها واستخدامها ومشاركتها في حالات الاستخدام لذكاء الأعمال وعلم البيانات.

تميز الجيل الأول من بنى البيانات في مستودع بيانات المؤسسة ومنصات ذكاء الأعمال، والتي تميزت بآلاف وظائف ETL والجداول والتقارير التي كان يفهمها فقط مجموعة صغيرة من مهندسي البيانات المتخصصين، مما أدى إلى تأثير إيجابي محدود على الأعمال. أما الجيل التالي، فقد أدى الجيل التالي من منصات البيانات الضخمة ووظائف الدُفعات الطويلة التي يديرها فريق مركزي من مهندسي البيانات إلى تكون مستنقعات بحيرة البيانات.

كان كلا النهجين عادةً عبارة عن بنيتين متجانستين ومركزيتين منظمتين حول الوظائف الميكانيكية لاستيعاب البيانات ومعالجتها وتنقيتها وتجميعها وتقديمها. وقد خلق ذلك عددًا من الاختناقات التنظيمية والتكنولوجية التي تمنع التكامل وانتشار البيانات عبر عدة أبعاد: التغير المستمر لمشهد البيانات، وانتشار مصادر البيانات ومستهلكي البيانات، وتنوع التحول ومعالجة البيانات التي تتطلبها حالات الاستخدام، وسرعة الاستجابة للتغيير.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

ماذا تفعل بنية البيانات الحديثة لعملك؟

تهدف بنية بيانات حديثة مثل شبكة البيانات ونسيج البيانات إلى ربط مصادر البيانات الجديدة بسهولة وتسريع تطوير مسارات البيانات الخاصة بحالة الاستخدام عبر البيئات المحلية والهجينة والسحابة المتعددة. وإلى جانب إدارة دورة الحياة الفعّالة، والتي تتطور إلى إدارة البيانات كمنتج، يمكن لبنية البيانات الحديثة أن تمكّن مجموعتك من:

  • السماح لمسؤولي البيانات بضمان امتثال البيانات وحمايتها وأمنها
  • تعزيز الثقة في البيانات من خلال الحصول على رؤية شاملة لمصدر البيانات، وكيف تغيرت، ومن يستخدمها
  • مراقبة وتحديد مشكلات جودة البيانات بالقرب من المصدر لتقليل التأثير المحتمل على العمليات أو الأحمال التشغيل اللاحقة
  • اعتماد منصات البيانات والتقنيات الجديدة بكفاءة لإدارة البيانات بشكل فعال
  • تطبيق البيانات الوصفية لوضع البيانات الحالية والجديدة في سياقها لجعلها قابلة للبحث والاكتشاف
  • إجراء تحليل البيانات (عملية الفحص وتحليل وإنشاء ملخصات لمجموعات البيانات)
  • تقليل تكرار البيانات والتجزئة

ولأن بنية البيانات تحدد كيفية هيكلة أصول البيانات وموارد إدارة البيانات، فإنها تلعب دورًا حساسًا في مدى فعالية مجموعة في أداء هذه المهام. أي أن بنية البيانات هي عنصر أساسي في استراتيجيتك لتحقيق جودة بيانات أعلى. وتتطلب القدرات الحيوية لحلول إدارة جودة البيانات الحديثة عالية الجودة أن تقوم المجوعة بما يلي:

  • فرض إدارة البيانات عبر المجموعة من خلال تعزيز عمليات جودة البيانات اليدوية باستخدام البيانات الوصفية والتكنولوجيا المتعلقة بالذكاء الاصطناعي (يوجد الرابط خارج ibm.com)
  • تنفيذ مراقبة جودة البيانات استنادًا إلى القواعد المُعدة مسبقًا
  • بناء نسب نمذجة البيانات لإجراء تحليل السبب الأساسي لمشكلات جودة البيانات
  • جعل قيمة مجموعة البيانات مفهومة على الفور
  • ممارسة نظافة البيانات بشكل صحيح عبر الواجهات

كيفية بناء بنية بيانات تعمل على تحسين جودة البيانات

يمكن أن تساعد استراتيجية البيانات مهندسي البيانات في إنشاء وتنفيذ بنية بيانات تُحسن جودة البيانات. وتتضمن خطوات تطوير استراتيجية البيانات الفعالة ما يلي:

1. تحديد أهداف العمل التي تريد أن تساعدك بياناتك في تحقيقها

على سبيل المثال، قد تتطلع مؤسسة مالية إلى تحسين الامتثال التنظيمي، وخفض التكاليف، وزيادة الإيرادات. ويمكن للأطراف المعنية تحديد حالات الاستخدام لأنواع معينة من البيانات، مثل إجراء تحليلات البيانات على البيانات اللحظية أثناء استيعابها لأتمتة صناعة القرار بهدف خفض التكاليف.

2. إجراء جرد لأصول البيانات الحالية ورسم خريطة لتدفقات البيانات الحالية

وتشمل هذه الخطوة تحديد وفهرسة جميع البيانات في جميع أنحاء المجموعة ضمن قائمة المخزون المركزية أو الاتحادية، مما يزيل صوامع البيانات. ويجب أن تتضمن القائمة تفاصيل حول مكان وجود كل مجموعة بيانات والتطبيقات وحالات الاستخدام التي تعتمد عليها. بعد ذلك، حدد البيانات اللازمة لحالات الاستخدام الرئيسية الخاصة بك وحدد أولويات مجالات البيانات التي تتضمنها.

3. تطوير تسمية موحدة

يساعد اعتماد اتفاقية التسمية وتنسيق البيانات الموحد (فئات البيانات) للبيانات المستخدمة في جميع أنحاء المؤسسة على ضمان اتساق البيانات وقابلية التشغيل البيني عبر الأقسام (المجالات) وحالات الاستخدام.

4. تحديد التغييرات التي يجب إجراؤها على البنية الحالية

حدد التغييرات التي ستعمل على تحسين بياناتك لتحقيق أهداف عملك. يمكن أن يساعدك البحث في أنواع بنى البيانات الحديثة، مثل نسيج البيانات وشبكة البيانات في اختيار هيكل البيانات الأنسب لمتطلبات عملك.

5. تحديد مؤشرات الأداء الرئيسية لقياس فعالية بنية البيانات

أنشئ مؤشرات أداء رئيسية واستخدم تحليلات متقدمة تربط بين مقياس نجاح بنيتك بمدى دعمها لجودة البيانات.

6. إنشاء خارطة طريق لبنية البيانات

يمكن للشركات وضع خطة تمهيدية لتنفيذ بنية البيانات وإدارتها في ثلاثة إلى أربعة نطاقات بيانات لكل ثلاثة أشهر.

بنية البيانات وIBM

وتخلق بنية بيانات مصممة جيدًا أساسًا لجودة البيانات من خلال الشفافية والتوحيد القياسي الذي يحدد كيفية عرض مجموعتك للبيانات واستخدامها والتحدث عنها.

كما ذكرنا سابقًا، يُعد نسيج البيانات أحد هذه البنى. ويقوم نسيج البيانات بأتمتة اكتشاف البيانات وإدارتها وإدارة جودتها ويبسط الوصول إلى البيانات بالخدمة الذاتية للبيانات الموزعة عبر بيئة سحابة هجينة. ويمكن أن يشمل التطبيقات التي تنتج البيانات وتستخدمها، بالإضافة إلى أي عدد من مستودعات تخزين البيانات مثل مستودع البيانات، وبحيرات البيانات (التي تخزن كميات هائلة من البيانات الكبيرة)، وقواعد بيانات NoSQL (التي تخزن بيانات غير منظمة)، وقواعد البيانات العلائقية التي تستخدم SQL.

تعرف على المزيد عن فوائد نسيج البيانات وIBM Cloud Pak for Data.

 
حلول ذات صلة
أدوات التحليلات والحلول ذات الصلة بها

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
اتخِذ الخطوة التالية

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات اكتشف خدمات التحليلات