تعزيز قدرات المؤسسة القائمة على الوكلاء شاهد الكلمة الرئيسية في مؤتمر Think

ما المقصود بنمذجة البيانات؟

ما المقصود بنمذجة البيانات؟

نمذجة البيانات هي عملية إنشاء تمثيل مرئي لنظام معلومات كامل أو أجزاء منه للتعبير عن الاتصالات بين نقاط البيانات والهياكل.

تهدف نمذجة البيانات إلى توضيح أنواع البيانات المستخدمة والمخزنة داخل النظام، والعلاقات بين هذه الأنواع. كما تصف طرق تجميع البيانات وتنظيمها، إلى جانب تنسيقاتها وسماتها.

تُبنى نماذج البيانات تبعًا لاحتياجات العمل. يتم تحديد القواعد والمتطلبات مسبقًا من خلال الملاحظات والتعليقات التي يتم الحصول عليها من الأطراف المعنية في العمل بحيث يمكن دمجها في تصميم نظام جديد أو تكييفها في تكرار نظام قائم.

يمكن نمذجة البيانات على مستويات مختلفة من التجريد. تبدأ العملية بجمع المعلومات حول متطلبات العمل من الأطراف المعنية والمستخدمين النهائيين. ثم يتم ترجمة قواعد الأعمال إلى هياكل بيانات لصياغة تصميم قاعدة بيانات ملموسة. يمكن تشبيه نموذج البيانات بخريطة طريق أو مخطط معماري أو أي مخطط رسمي يسهل فهماً أعمق لما يتم تصميمه.

تستخدم نمذجة البيانات مخططات قياسية وأساليب منهجية. ويوفر هذا النهج طريقة موحّدة ومتسقة وقابلة للتوقع لتعريف موارد البيانات وإدارتها على مستوى المؤسسة، بل وربما خارجها.

ومن الناحية المثالية، تكون نماذج البيانات وثائق قابلة للتحديث باستمرار، وتتطور مع تغيّر احتياجات الأعمال. وتؤدي هذه النماذج دورًا مهمًا في دعم عمليات الأعمال وتخطيط بنية تكنولوجيا المعلومات واستراتيجيتها. ويمكن مشاركة نماذج البيانات مع المورّدين أو الشركاء أو النظراء في القطاع.

أنواع نماذج البيانات

وكما هو الحال في أي عملية تصميم، يبدأ تصميم قواعد البيانات وأنظمة المعلومات من مستوى عالٍ من التجريد، ثم يصبح أكثر تحديدًا وارتباطًا بالتنفيذ. يمكن عمومًا تقسيم نماذج البيانات إلى ثلاث فئات تختلف بحسب درجة التجريد. تبدأ العملية بنموذج مفاهيمي، ثم تنتقل إلى نموذج منطقي، وتنتهي بنموذج مادي. وتتناول الأقسام التالية كل نوع من أنواع نماذج البيانات بمزيد من التفصيل:

نماذج البيانات المفاهيمية

ويُشار إليها أيضًا باسم نماذج المجال، وهي تقدم رؤية عالية المستوى لما سيحتويه النظام، وكيفية تنظيمه، وقواعد الأعمال التي يتضمنها. تُنشأ النماذج المفاهيمية ضمن عملية جمع المتطلبات الأولية للمشروع.

وتتضمن عادةً فئات الكيانات، أي أنواع العناصر التي يهم الأعمال تمثيلها في نموذج البيانات، إلى جانب خصائصها وقيودها والعلاقات بينها. كما تشمل متطلبات الأمان وسلامة البيانات ذات الصلة. وتحدد هذه العناصر مجتمعةً كيفية هيكلة البيانات وحوكمتها داخل النموذج. وعادةً ما تكون طريقة التدوين بسيطة.

مخطط نمذجة البيانات المفاهيمية

نماذج البيانات المنطقية

تكون هذه النماذج أقل تجريدًا، وتقدّم تفاصيل أوسع عن المفاهيم والعلاقات في المجال محل الدراسة. ويُتبع فيها أحد أنظمة التدوين الرسمية المتعددة الخاصة بنمذجة البيانات. وتوضح هذه التدوينات سمات البيانات، مثل أنواع البيانات والأطوال المقابلة لها، كما تبيّن العلاقات بين الكيانات.

لا تحدد نماذج البيانات المنطقية أي متطلبات تقنية للنظام. وغالبًا ما تُحذف هذه المرحلة في ممارسات Agile أو DevOps. يمكن أن تكون نماذج البيانات المنطقية مفيدة في بيئات التنفيذ ذات الطابع الإجرائي العالي، أو في المشاريع القائمة بطبيعتها على البيانات، مثل تصميم مستودعات البيانات أو تطوير أنظمة إعداد التقارير.

مخطط نمذجة البيانات المنطقية

نماذج البيانات المادية

وتوفر هذه النماذج مخططًا يوضح كيفية تخزين البيانات فعليًا داخل قاعدة البيانات. ولذلك، فهي أقل النماذج تجريدًا. وتقدّم تصميمًا نهائيًا يمكن تنفيذه في صورة قاعدة بيانات علائقية، بما في ذلك الجداول الرابطة التي توضّح العلاقات بين الكيانات. ويحدد التصميم أيضًا المفاتيح الأساسية والمفاتيح الخارجية التي ستُستخدم للحفاظ على هذه العلاقات. يمكن أن تتضمن نماذج البيانات المادية خصائص خاصة بنظام إدارة قواعد البيانات (DBMS)، بما في ذلك ضبط الأداء.

مخطط نمذجة البيانات المادية

عملية نمذجة البيانات

كتخصص، تدعو نمذجة البيانات الأطراف المعنية لتقييم معالجة البيانات والتخزين بتفصيل دقيق. تحتوي تقنيات نمذجة البيانات على اتفاقيات مختلفة تحدد الرموز المستخدمة لتمثيل البيانات، وكيفية وضع النماذج، وكيفية نقل متطلبات الأعمال. توفر جميع الأساليب مهام سير عمل ذات طابع رسمي تتضمن سلسلة من المهام التي سيتم تنفيذها بطريقة تكرارية. تبدو مهام سير العمل هذه عمومًا على النحو التالي:

  1. تحديد الكيانات. تبدأ عملية نمذجة البيانات بتحديد الأشياء أو الأحداث أو المفاهيم التي يتم تمثيلها في مجموعة البيانات التي سيتم نمذجتها. ينبغي أن يكون كل كيان متماسكًا ومنفصلًا منطقيًا عن جميع الكيانات الأخرى.
  2. تحديد الخصائص الرئيسية لكل كيان. يمكن تمييز كل نوع من الكيانات عن غيره لأنه يمتلك خاصية فريدة واحدة أو أكثر، تُسمى السمات. على سبيل المثال، قد يمتلك كيان يُسمى "العميل" سمات مثل الاسم الأول، واسم العائلة، ورقم الهاتف، واللقب المخاطب به. وقد يتضمن كيان يُسمى "العنوان" اسم الشارع ورقمه، والمدينة، والولاية، والبلد، والرمز البريدي.
  3. تحديد العلاقات بين الكيانات. تحدد المسودة الأولى لنموذج البيانات طبيعة العلاقات التي تربط كل كيان بالكيانات الأخرى. في المثال السابق، "يقيم" كل عميل في عنوان معيّن. وإذا وُسّع هذا النموذج ليشمل كيانًا يُسمى "الطلبات"، فسيُشحن كل طلب إلى عنوان معيّن، وتُرسل فاتورته إلى عنوان معيّن أيضًا. وتُوثَّق هذه العلاقات باستخدام لغة النمذجة الموحّدة (UML).
  4. ربط السمات بالكيانات على نحو كامل. يضمن هذا النهج أن يعكس النموذج الطريقة التي ستستخدم بها الأعمال البيانات. تُستخدم عدة أنماط رسمية لنمذجة البيانات على نطاق واسع. غالبًا ما يطبّق مطورو البرمجة الكائنية التوجه أنماط التحليل أو أنماط التصميم، بينما يمكن للأطراف المعنية من مجالات أعمال أخرى اللجوء إلى أنماط أخرى.
  5. تعيين المفاتيح حسب الحاجة، وتحديد درجة تنظيم البيانات التي تحقق توازنًا بين الحاجة إلى تقليل التكرار ومتطلبات الأداء. تنظيم البيانات هو أسلوب لتنظيم نماذج البيانات وقواعد البيانات التي تمثلها، تُسند فيه معرّفات رقمية تُسمى المفاتيح إلى مجموعات البيانات لتمثيل العلاقات بينها دون تكرار البيانات. على سبيل المثال، إذا أُسند مفتاح إلى كل عميل، فيمكن ربط هذا المفتاح بعنوانه وسجل طلباته دون الحاجة إلى تكرار هذه المعلومات في جدول أسماء العملاء. يساعد هذا التنظيم على تقليل مساحة التخزين التي تحتاجها قاعدة البيانات، لكنه قد يكون على حساب أداء الاستعلامات.
  6. الانتهاء من نموذج البيانات والتحقق من صحته. نمذجة البيانات هي عملية تكرارية يجب تكرارها وتحسينها مع تغير احتياجات الأعمال.
أكاديمية الذكاء الاصطناعي

هل تعد إدارة البيانات هي سر الذكاء الاصطناعي التوليدي؟

استكشف سبب أهمية البيانات عالية الجودة للاستخدام الناجح للذكاء الاصطناعي التوليدي.

أنواع نمذجة البيانات

تطورت نمذجة البيانات بالتوازي مع أنظمة إدارة قواعد البيانات، وازدادت أنواع النماذج تعقيدًا مع تنامي احتياجات الأعمال إلى تخزين البيانات. فيما يلي عدة أنواع من النماذج:

  • تمثل نماذج البيانات الهرمية علاقات واحد إلى متعدد في بنية شجرية. في هذا النوع من النماذج، يكون لكل سجل جذر أو أصل واحد يرتبط بجدول فرعي واحد أو أكثر. نُفّذ هذا النموذج في IBM Information Management System (IMS)، الذي طُرح في عام 1966 وسرعان ما انتشر استخدامه على نطاق واسع، ولا سيما في القطاع المصرفي. وعلى الرغم من أن هذا النهج أقل كفاءة من نماذج قواعد البيانات الأحدث، فإنه لا يزال مستخدمًا في أنظمة لغة الترميز الموسعة (XML) وأنظمة المعلومات الجغرافية (GIS).
  • اقترح باحث IBM E.F.Codd نماذج البيانات العلائقية لأول مرة في عام 1970. ولا تزال هذه النماذج تُطبق حتى اليوم في كثير من قواعد البيانات العلائقية المستخدمة على نطاق واسع في حوسبة المؤسسات. لا تتطلب نمذجة البيانات العلائقية فهمًا تفصيليًا للخصائص المادية لتخزين البيانات المستخدم. وفيها، تُربط أجزاء البيانات صراحةً من خلال الجداول، مما يقلل تعقيد قاعدة البيانات.

غالبًا ما تستخدم قواعد البيانات العلائقية لغة الاستعلام الهيكلية (SQL) لإدارة البيانات. وتُعد هذه القواعد فعّالة في الحفاظ على سلامة البيانات وتقليل التكرار. وغالبًا ما تُستخدم في أنظمة نقاط البيع، إلى جانب أنواع أخرى من معالجة المعاملات.

  • تستخدم نماذج بيانات علاقة الكيانات (ER) مخططات رسمية لتمثيل العلاقات بين الكيانات في قاعدة البيانات. يتم استخدام العديد من أدوات نمذجة بيانات علاقة الكيانات (ER) من قبل مهندسي البيانات لإنشاء خرائط مرئية تعبّر عن أهداف تصميم قاعدة البيانات.
  • اكتسبت نماذج البيانات المستندة إلى الكائنات زخمًا مثل البرمجة المستندة إلى الكائنات وأصبحت شائعة في منتصف التسعينيات. "الكائنات" المعنية هي تمثيلات تجريدية لكيانات في العالم الحقيقي. يتم تجميع الكائنات في تسلسلات هرمية للفئات، ولها ميزات مرتبطة. يمكن لقواعد البيانات المستندة إلى الكائنات أن تتضمن جداول، ولكنها يمكن أن تدعم أيضًا علاقات البيانات الأكثر تعقيدًا. يتم استخدام هذا النهج في قواعد بيانات الوسائط المتعددة والنصوص التشعبية بالإضافة إلى حالات استخدام أخرى.
  • طوّر Ralph Kimball نماذج البيانات البُعدية، وصُممت هذه النماذج لتحسين سرعة استرجاع البيانات لأغراض التحليل داخل مستودع البيانات. وبينما تركّز النماذج العلائقية ونماذج الكيانات والعلاقات (ER) على كفاءة التخزين، تزيد النماذج البُعدية من التكرار لتسهيل العثور على المعلومات اللازمة لإعداد التقارير واسترجاع البيانات. يُستخدم هذا النوع من النمذجة عادةً في أنظمة المعالجة التحليلية عبر الإنترنت (OLAP).

من نماذج البيانات البُعدية الشائعة مخطط النجمة، حيث تُنظَّم البيانات في حقائق، أي عناصر قابلة للقياس، وأبعاد، أي معلومات مرجعية. في هذا النموذج، تُحاط كل حقيقة بالأبعاد المرتبطة بها في نمط يشبه النجمة. أما النموذج الآخر فهو المخطط المتشعب، وهو يشبه مخطط النجمة، لكنه يتضمن طبقات أخرى من الأبعاد المرتبطة، مما يجعل نمط التفرّع أكثر تعقيدًا.

فوائد نمذجة البيانات

تسهّل نمذجة البيانات على المطورين ومهندسي البيانات ومحللي الأعمال وغيرهم من الأطراف المعنية تصور العلاقات بين البيانات وفهمها داخل قاعدة البيانات أو مستودع البيانات. ويمكنها أيضًا:

  • تقليل الأخطاء في تطوير البرامج وقواعد البيانات.
  • زيادة الاتساق في الوثائق وتصميم النظام عبر المؤسسة.
  • تحسين أداء التطبيق وقاعدة البيانات.
  • سهولة تخطيط البيانات في جميع أنحاء المؤسسة.
  • تحسين التواصل بين المطورين وفرق ذكاء الأعمال.
  • تسهيل وتسريع عملية تصميم قاعدة البيانات على المستويات المفاهيمية والمنطقية والمادية.

أدوات نمذجة البيانات

تستخدم العديد من حلول هندسة البرمجيات بمساعدة الحاسوب (CASE) التجارية ومفتوحة المصدر على نطاق واسع اليوم، بما في ذلك نمذجة البيانات المتعددة وأدوات الرسم التوضيحي والعروض المصورة للبيانات. وفيما يلي بعض الأمثلة:

  • erwin Data Modeler هو أداة نمذجة البيانات التي تعتمد على لغة نمذجة البيانات Integration DEFinition for information modeling (IDEF1X)، والتي تدعم الآن منهجيات ترميز أخرى، بما في ذلك النهج متعدد الأبعاد.
  • Enterprise Architect هو أداة نمذجة وتصميم بصرية تدعم نمذجة أنظمة وهياكل المعلومات المؤسسية بالإضافة إلى تطبيقات البرمجيات وقواعد البيانات. وتعتمد على اللغات والمعايير المستندة إلى الكائنات.
  • ER/Studio هو برنامج لتصميم قواعد البيانات متوافق مع العديد من أنظمة إدارة قواعد البيانات الأكثر شيوعًا في الوقت الحالي. يدعم كلاً من النمذجة العلائقية ومتعددة الأبعاد.
  • تتضمن أدوات نمذجة البيانات المجانية حلولاً مفتوحة المصدر مثل Open ModelSphere.
عرض ثلاثي الأبعاد لمجموعة من الرموز المصطفة مثل كاميرا ومقبض مستوى الصوت وحافظة
حلول ذات صلة
أدوات وحلول علم البيانات

استخدام أدوات علم البيانات وحلوله لاكتشاف الأنماط وبناء التنبؤات باستخدام البيانات والخوارزميات والتعلم الآلي وتقنيات الذكاء الاصطناعي

استكشف حلول علم البيانات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

استخدام أدوات علم البيانات وحلوله لاكتشاف الأنماط وبناء التنبؤات باستخدام البيانات والخوارزميات والتعلم الآلي وتقنيات الذكاء الاصطناعي.

  1. استكشف حلول علم البيانات
  2. استكشف خدمات التحليلات