ما المقصود ببنية البيانات؟
اكتشف سبب أهمية بنية البيانات سجل للتعرف على تحديثات الذكاء الاصطناعي
رسم توضيحي يحتوي على مجموعة من الرموز التوضيحية على شكل سحب، ومخطط دائري، ورسم بياني من الرموز التوضيحية
ما المقصود ببنية البيانات؟

تشير بنية البيانات إلى كيفية إدارة البيانات، بدءًا من جمعها مرورًا بتحويلها وتوزيعها ووصولًا إلى استهلاكها. وهي تحدد مخطط البيانات وطريقة تدفقها عبر أنظمة تخزين البيانات. تعدّ بنية البيانات أساس عمليات معالجة البيانات وتطبيقات الذكاء الاصطناعي (AI).

يجب أن يكون تصميم بنية البيانات مدفوعًا بمتطلبات العمل، حيث يستخدم مهندسو البيانات ومصممو بنية البيانات هذه المتطلبات في تحديد نموذج البيانات المعني وهياكل البيانات الأساسية التي تدعمه. وعادةً ما تهدف هذه التصميمات إلى تلبية احتياجات العمل، مثل مبادرة إعداد التقارير أو علم البيانات.

مع ظهور مصادر جديدة للبيانات من خلال التقنيات الناشئة، مثل إنترنت الأشياء (IoT)، تساعد بنية البيانات الجيدة على ضمان إمكانية إدارة البيانات والاستفادة منها بفعالية، ما يدعم إدارة دورة حياة البيانات. وبشكل أكثر تحديدًا، يمكنها تجنب تخزين البيانات المكررة، وتحسين جودة البيانات من خلال التنقية وإلغاء التكرار، وتمكين التطبيقات الجديدة.

كما توفر بنيات البيانات الحديثة آليات لدمج البيانات عبر المجالات المختلفة، مثل الإدارات أو المناطق الجغرافية، ما يساعد على كسر صوامع البيانات دون الحاجة إلى التعقيدات المصاحبة لتخزين كل شيء في مكان واحد.

غالبًا ما تستخدم بنيات البيانات الحديثة المنصات السحابية لإدارة البيانات ومعالجتها. وعلى الرغم من أنها قد تنطوي على تكلفة أعلى، إلا أن قابليتها للتوسع في الحوسبة تتيح إنجاز مهام معالجة البيانات المهمة بسرعة. كما تساهم قابلية التوسع في التخزين في التعامل مع الزيادة المستمرة في حجم البيانات، والمساعدة على ضمان توفُّر جميع البيانات ذات الصلة لتحسين جودة تدريب تطبيقات الذكاء الاصطناعي.

بناء سير عمل الذكاء الاصطناعي المسؤول مع حوكمة الذكاء الاصطناعي (Build responsible AI workflows with AI governance)

تعرّف على العناصر الأساسية وأفضل الممارسات لمساعدة فِرق عملك على تسريع الذكاء الاصطناعي المسؤول.

محتوى ذو صلة التسجيل للحصول على الكتاب الإلكتروني عن الذكاء الاصطناعي التوليدي
نماذج البيانات المفاهيمية مقابل نماذج البيانات المنطقية مقابل نماذج البيانات المادية

تتضمن وثائق بنية البيانات ثلاثة أنواع من نماذج البيانات:

  • نماذج البيانات المفاهيمية: يشار إليها أيضًا باسم نماذج المجال، وتوفر منظوراً عاماً على ما سيحتويه النظام وكيفية تنظيمه وقواعد الأعمال التي تتعامل معها. يتم إنشاء النماذج المفاهيمية كجزء من عملية جمع المتطلبات الأولية للمشروع. وعادة ما تشمل فئات الكيانات (التي تحدد أنواع الأشياء المهمة بالنسبة للأعمال التجارية لتمثيلها في نموذج البيانات)، وخصائصها وقيودها، والعلاقات بينها والمتطلبات ذات الصلة بالأمن وسلامة البيانات ذات الصلة.
  •  نماذج البيانات المنطقية: تُعتبر هذه النماذج أقل تجريدًا، وتُقدِّم تفاصيل أكثر حول المفاهيم والعلاقات في المجال قيد الدراسة. يتم اتباع أحد أنظمة التدوين الرسمية المتعددة الخاصة بنمذجة البيانات. والتي تحدد سمات البيانات مثل أنواع البيانات وأطوالها المقابلة، وتوضح العلاقات بين الكيانات. ولا تحدد النماذج المنطقية للبيانات أي متطلبات تقنية للنظام.
  • نماذج البيانات المادية: يعد نموذج البيانات المادية النموذج الأكثر تفصيلاً وتحديدًا بين النماذج الثلاثة. إذ يحدد التنفيذ الفعلي لقاعدة البيانات، وما يشمله من هياكل الجداول، والفهارس، واعتبارات التخزين والأداء. ويركز هذا النموذج على الجوانب التقنية المتعلقة بكيفية تخزين البيانات والوصول إليها، ويُستخدم لإنشاء مخطط قاعدة البيانات وتحسين أدائها.
أطر عمل بنية البيانات الشائعة             

يمكن لبنية البيانات أن تستفيد من أطر العمل الشائعة لبنية المؤسسات، بما في ذلك TOGAF وDAMA-DMBOK 2 وإطار Zachman لبنية المؤسسات.

إطار عمل The Open Group Architecture Framework (TOGAF)

طُوِرت منهجية بنية المؤسسة هذه في عام 1995 من قِبل Open Group، والتي تعد شركة IBM عضوًا بلاتينيًا فيها.

هناك أربع ركائز للبنية، وهي:

  • بنية الأعمال، وتحدد الهيكل التنظيمي للمؤسسة، وإستراتيجيات أعمالها، وعملياتها.
  • بنية البيانات، وتصف أصول البيانات المفاهيمية والمنطقية والمادية وكيفية تخزينها وإدارتها طوال دورة حياتها.
  • بنية التطبيقات، وتمثل أنظمة التطبيق، وكيفية ارتباطها بعمليات الأعمال الرئيسية وببعضها البعض.
  • البنية التقنية، وتصف البنية التحتية التقنية (الأجهزة والبرمجيات والشبكات) اللازمة لدعم تطبيقات المهام الحساسة.

على هذا النحو، يوفر TOGAF إطار عمل كامل لتصميم وتنفيذ بنية تقنية المعلومات الخاصة بالمؤسسة، بما في ذلك بنية بياناتها.

إطار العمل DAMA-DMBOK 2

تأسست الجمعية العالمية لإدارة البيانات DAMA International في الأصل تحت مسمى "الجمعية العالمية لإدارة البيانات"، وهي منظمة غير ربحية تكرس جهودها للنهوض بإدارة البيانات والمعلومات. وتشمل مجموعة معارف إدارة البيانات التابعة لها، المسماة إطار العمل DAMA-DMBOK 2، بنية البيانات، بالإضافة إلى الحوكمة والأخلاقيات، ونمذجة البيانات وتصميمها، والتخزين، والأمن، والتكامل.

إطار العمل Zachman لبنية المؤسسات

تم تطوير هذا الإطار في الأصل من قِبل John Zachman في IBM عام 1987، ويستعين هذا الإطار بمصفوفة تتألف من ست طبقات تبدأ من الطبقة السياقية وصولًا إلى الطبقة التفصيلية، وهي محددة على أساس ستة أسئلة مثل "لماذا؟" و"كيف؟" و"ماذا؟". ويُعتبر هذا الإطار وسيلة رسمية لتنظيم وتحليل البيانات، ولكنه لا يتضمن طرقًا لتنفيذ ذلك.

 

أنواع بُنَى البيانات والعناصر الأساسية

تعرض بنية البيانات منظورًا عالي المستوى حول كيفية عمل أنظمة إدارة البيانات المختلفة معًا. وتشمل هذه الأنظمة العديد من مستودعات تخزين البيانات المختلفة، مثل بحيرات البيانات، ومستودعات البيانات، ومتاجر البيانات، وقواعد البيانات، وغيرها. يمكن أن تُشكّل هذه العناصر معًا بنى بيانات، مثل الأنسجة البيانية وشبكات البيانات، التي يزداد رواجها بشدة. وتركز هذه البُنى بشكل أكبر على البيانات كمنتجات، ما يساهم في تعزيز التوحيد القياسي حول البيانات الوصفية ويتيح وصولاً أكثر ديمقراطية للبيانات عبر المنظمات من خلال واجهات برمجة التطبيقات.

يتناول القسم التالي كل نوع من عناصر التخزين وأنواع بنية البيانات هذه بمزيد من التفصيل:

أنواع أنظمة إدارة البيانات

  • مستودعات البيانات: يعمل مستودع البيانات على تجميع البيانات من مصادر بيانات علائقية مختلفة داخل المؤسسة في مستودع مركزي واحد متسق. بعد عملية الاستخراج، تتدفق البيانات عبر مسار البيانات المعني بالاستخراج، والتحويل، والتحميل، حيث تخضع للعديد من عمليات تحويل البيانات لتتماشى مع نموذج البيانات المحدد مسبقًا. وبمجرد تحميلها في مستودع البيانات، تصبح البيانات جاهزة لدعم مختلف تطبيقات ذكاء الأعمال (BI) وتطبيقات علوم البيانات.
  • متاجر البيانات: يعتبر متجر البيانات نسخة مركّزة من مستودع البيانات، حيث يحتوي على مجموعة فرعية أصغر من البيانات المهمة والمطلوبة لفريق واحد أو مجموعة مختارة من المستخدمين داخل المنظمة، مثل إدارة الموارد البشرية. وبفضل احتواء متاجر البيانات على نطاق أصغر من البيانات، فإنها تتيح للإدارة أو المؤسسة اكتشاف معارف أكثر تركيزًا بشكل أسرع مما هو ممكن عند العمل مع مجموعة بيانات مستودع البيانات الأوسع نطاقًا. وقد ظهرت متاجر البيانات في الأصل استجابة للصعوبات التي واجهتها المنظمات عند إنشاء مستودعات البيانات في التسعينيات، حيث تطلَّب دمج البيانات من جميع أنحاء المنظمة في ذلك الوقت الكثير من جهود الترميز اليدوي، وكان يستغرق وقتًا طويلاً بشكل غير عملي. وقد ساهم النطاق الأكثر محدودية لمتاجر البيانات في تمييزها بالسهولة والسرعة في التنفيذ مقارنة بمستودعات البيانات المركزية.
  • بحيرة البيانات: بينما تقوم مستودعات البيانات بتخزين البيانات بعد معالجتها، فإن بحيرة البيانات تضم بيانات غير منسقة، وعادةً ما تكون بحجم بيتابايت من هذه البيانات. تتميز بحيرة البيانات بقدرتها على تخزين البيانات المنظمة وغير المنظمة على حد سواء، ما يجعلها فريدة من نوعها مقارنة بمستودعات البيانات الأخرى. توفر هذه المرونة في متطلبات التخزين فائدة كبيرة لعلماء البيانات ومهندسي البيانات والمطورين، ما يسمح لهم بالوصول إلى البيانات من أجل تمارين اكتشاف البيانات ومشاريع التعلم الآلي. تم إنشاء بحيرات البيانات في الأصل كرد فعل لعجز مستودعات البيانات عن التعامل مع تزايد الحجم والسرعة والتنوع للبيانات الكبيرة. وعلى الرغم من أن بحيرات البيانات أبطأ من مستودعات البيانات، إلا أنها أيضًا أقل تكلفة، حيث لا تتطلب إعدادًا للبيانات قبل استيعاب هذه البيانات. واليوم، تستمر هذه البحيرات في التطور باعتبارها جزءًا من جهود نقل البيانات إلى التقنية السحابية. تدعم بحيرات البيانات مجموعة واسعة من حالات الاستخدام، حيث لا تحتاج أهداف أعمال البيانات إلى تحديدها في وقت جمع البيانات. ومع ذلك، هناك حالتان أساسيتان تشملان جهود استكشاف علم البيانات وجهود النسخ الاحتياطي للبيانات واستردادها. يمكن لعلماء البيانات استخدام بحيرات البيانات لإثبات صحة المفاهيم. تستفيد تطبيقات التعلم الآلي من القدرة على تخزين البيانات المنظمة وغير المنظمة في نفس المكان، وهو أمر غير ممكن باستخدام نظام قاعدة البيانات العلائقية. كما يمكن استخدام بحيرات البيانات لاختبار وتطوير مشاريع تحليلات البيانات الكبيرة. وعندما يتم تطوير التطبيق وتحديد البيانات المفيدة، يمكن تصدير البيانات إلى مستودع بيانات للاستخدام التشغيلي، ويمكن استخدام الأتمتة لتوسيع نطاق التطبيق. كما يمكن استخدام بحيرات البيانات للنسخ الاحتياطي للبيانات واستردادها، بفضل قدرتها على التوسع بتكلفة منخفضة. وللأسباب نفسها، تُعد بحيرات البيانات خيارًا جيدًا لتخزين البيانات "الاحتياطية" التي لم تُحدَّد بعد احتياجات العمل لها. ويضمن تخزين البيانات الآن توفّرها في وقت لاحق عند ظهور مبادرات جديدة.

أنواع بُنَى البيانات

نسيج البيانات: نسيج البيانات عبارة عن بنية تركز على الأتمتة في تكامل البيانات وهندسة البيانات وحوكمتها عبر سلسلة قيمة البيانات بين مزودي البيانات ومستهلكيها. ويستند نسيج البيانات إلى مفهوم "البيانات الوصفية النشطة" الذي يستخدم الرسم البياني المعرفي والدلالات والتنقيب عن البيانات وتقنية التعلّم الآلي (ML) لاكتشاف الأنماط في أنواع مختلفة من البيانات الوصفية (مثل سجلات النظام والبيانات الاجتماعية وغيرها). بعد ذلك، يطبق هذا المفهوم هذه الرؤية لأتمتة سلسلة قيمة البيانات وتنظيمها. فعلى سبيل المثال، يتيح لنسيج البيانات الفرصة أمام مستهلك البيانات للعثور على منتج البيانات الذي يحتاجه ومن ثمّ تزويده به تلقائيًا. وتؤدي زيادة الوصول إلى البيانات بين منتجات البيانات ومستهلكيها إلى تقليل العزل بين البيانات، كما توفر صورة أكثر اكتمالاً لبيانات المنظمة. تُعد أنسجة البيانات تقنية ناشئة ذات إمكانات هائلة، ويمكن استخدامها لتعزيز ملفات تعريف العملاء، والكشف عن الغش، والصيانة الوقائية. ووفقًا لتقرير Gartner، تقلل أنسجة البيانات من وقت تصميم التكامل بنسبة 30%، ووقت النشر بنسبة 30%، والصيانة بنسبة 70%.

شبكات البيانات: شبكة البيانات هي بنية بيانات لا مركزية تنظم البيانات حسب مجال العمل. وباستخدام شبكة البيانات، تحتاج المنظمة إلى التوقف عن التعامل مع البيانات كمنتج ثانوي للعمليات، والبدء في التعامل معها باعتبارها منتجًا قائمًا بذاته. يضطلع منتجو البيانات بدور مالكي منتجات البيانات. وباعتبارهم خبراء في هذا المجال، يمكن لمنتجي البيانات الاعتماد على فهمهم للمستهلكين الأساسيين للبيانات لتصميم واجهات برمجة التطبيقات المناسبة لهم. كما يمكن الوصول إلى واجهات برمجة التطبيقات هذه من أقسام أخرى في المنظمة، ما يعزز الوصول إلى البيانات المدارة على نطاق أوسع.

يمكن استخدام المزيد من أنظمة التخزين التقليدية، مثل بحيرات البيانات ومستودعات البيانات كمخازن بيانات لا مركزية متعددة لدعم شبكة البيانات. كما يمكن أن تعمل شبكة البيانات جنبًا إلى جنب مع نسيج البيانات، حيث تساهم أتمتة نسيج البيانات في إنشاء منتجات بيانات جديدة بسرعة أكبر أو فرض الحوكمة الشاملة على مستوى المنظمة.

 

مزايا بنى البيانات

يمكن أن توفر بنية البيانات المصممة بعناية للشركات عددًا من المزايا الرئيسية، والتي تشمل ما يلي:

  • الحد من التكرار: قد تحتوي المصادر المختلفة على حقول بيانات متداخلة، ما يؤدي إلى خطر عدم الاتساق وعدم دقة البيانات وضياع فرص تكامل البيانات. تسهم بنية البيانات الجيدة في توحيد تخزين البيانات، واحتمالية تقليل التكرار، ما يؤدي إلى تحسين جودة التحليلات الشاملة.
  • تحسين جودة البيانات: يمكن لبنى البيانات المصممة بعناية أن تتغلب على بعض التحديات المرتبطة بإدارة بحيرة البيانات غير المنظمة، والمعروفة أيضًا باسم "مستنقعات البيانات". ويفتقر مستنقع البيانات إلى معايير جودة البيانات المناسبة وممارسات حوكمة البيانات لتوفير دروس مستنيرة. تسهم بنى البيانات في فرض معايير حوكمة البيانات وأمن البيانات، ما يتيح الإشراف المناسب على تدفق البيانات لضمان عملها على النحو المنشود. من خلال تحسين جودة البيانات وحوكمتها، يمكن أن تساعد بنى البيانات على ضمان تخزين البيانات بطريقة تجعلها قابلة للاستخدام بشمل فعال الآن وفي المستقبل.
  • تمكين التكامل: غالبًا ما تكون البيانات معزولة في صومعة نتيجة للقيود التقنية المفروضة على تخزين البيانات والحواجز التنظيمية داخل المنظمة. واليوم، يجب أن تهدف بنى البيانات إلى تسهيل تكامل البيانات عبر مختلف المجالات، بحيث تتمكن الفرق الجغرافية ووحدات الأعمال المختلفة من الوصول إلى بيانات بعضها بعضًا. ويؤدي ذلك إلى فهم أفضل وأكثر اتساقًا للمقاييس الشائعة (مثل النفقات والإيرادات والعوامل المرتبطة بها). كما يوفّر التكامل رؤية أكثر شمولية للعملاء والمنتجات والفرق الجغرافية، بهدف تحسين عملية صنع القرار.
  • إدارة دورة حياة البيانات: تتيح بنية البيانات الحديثة إمكانية إدارة البيانات على المدى الطويل. وعادةً ما تفقد البيانات قيمتها تدريجيًا مع مرور الوقت وتقل نسبة استخدامها. لذلك، يمكن نقل البيانات مع مرور الوقت إلى أنواع تخزين أرخص وأبطأ بحيث تظل متاحة للتقارير وعمليات التدقيق، دون الحاجة إلى تكلفة التخزين عالي الأداء.
بنية البيانات الحديثة

بينما تضع المنظمات خارطة طريق لتطبيقات المستقبل، بما في ذلك الذكاء الاصطناعي وسلسلة الكتل وأحمال تشغيل إنترنت الأشياء (IoT)، فإنها تحتاج إلى بنية بيانات حديثة قادرة على تلبية متطلبات البيانات.

فيما يلي أهم سبع خصائص لبنية البيانات الحديثة:

  • بنية السحابة الأصلية وبنية قائمة على السحابة، بحيث يمكن لبنية البيانات الاستفادة من مرونة التوسع والتوفّر العالي للتقنية السحابية.
  • مسارات بيانات قوية وقابلة للتوسع وقابلة للنقل، تجمع بين مهام سير العمل الذكي والتحليلات المعرفية والتكامل في الوقت الحقيقي في إطار عمل واحد.
  • التكامل السلس للبيانات، باستخدام واجهات برمجة تطبيقات قياسية للاتصال بالتطبيقات القديمة.
  • تمكين البيانات في الوقت الحقيقي، بما في ذلك التحقق من صحة البيانات وتصنيفها وإدارتها وحوكمتها.
  • هيكلية مفصولة وقابلة للتوسعة، حيث لا توجد تبعيات بين الخدمات، مما يسمح بالتوافق بين الأنظمة باستخدام المعايير المفتوحة.
  • قائمة على مجالات البيانات المشتركة، والأحداث، والخدمات المصغرة.
  • مُحسَّنة لتحقيق التوازن بين التكلفة والبساطة.
حلول IBM
IBM Cloud Pak for Data

IBM Cloud Pak for Data هي منصة بيانات مفتوحة وقابلة للتوسيع توفر نسيج بيانات لتوفير جميع البيانات للذكاء الاصطناعي والتحليلات في أي بيئة سحابية.

استكشف IBM Cloud Pak for Data
IBM Watson® Studio

يمكنه بناء نماذج الذكاء الاصطناعي وتشغيلها وإدارتها. يمكنك إعداد البيانات وبناء النماذج على أي سحابة باستخدام رمز مفتوح المصدر أو نمذجة مرئية. ويمكنك من خلاله توقّع نتائجك وتحسينها.

استكشف IBM Watson Studio
IBM® Db2® on Cloud

تعرّف على Db2 on Cloud، وهي قاعدة بيانات سحابية SQL مُدارة بالكامل ومُهيأة ومُحسّنة لتحقيق أداء قوي.

استكشف IBM Db2 on Cloud
الموارد إنشاء أساس قوي للبيانات من أجل الذكاء الاصطناعي

اقرأ الورقة البحثية الذكية حول كيفية إنشاء أساس قوي للبيانات من أجل الذكاء الاصطناعي من خلال التركيز على ثلاثة مجالات رئيسية لإدارة البيانات: الوصول، والحوكمة، والخصوصية والامتثال.

اقرأ تقرير IBV

يمكن أن يساعد نسيج البيانات الشركات التي تستثمر في الذكاء الاصطناعي والتعلم الآلي وإنترنت الأشياء وحوسبة الحافة في تحقيق قيمة أكبر من بياناتها.