ما المقصود بنمذجة البيانات؟

مكاتب خاصة صغيرة ملونة

ما المقصود بنمذجة البيانات؟

نمذجة البيانات هي عملية إنشاء تمثيل مرئي لنظام معلومات كامل أو أجزاء منه للتعبير عن الاتصالات بين نقاط البيانات والهياكل.

الهدف من نمذجة البيانات هو توضيح أنواع البيانات المستخدمة والمخزنة داخل النظام، والعلاقات بين أنواع البيانات هذه، والطرق التي يمكن من خلالها تجميع البيانات وتنظيمها وتنسيقاتها وسماتها.

تُبنى نماذج البيانات تبعًا لاحتياجات العمل. يتم تحديد القواعد والمتطلبات مسبقًا من خلال الملاحظات والتعليقات التي يتم الحصول عليها من الأطراف المعنية في العمل بحيث يمكن دمجها في تصميم نظام جديد أو تكييفها في تكرار نظام قائم.

يمكن نمذجة البيانات على مستويات مختلفة من التجريد. تبدأ العملية بجمع المعلومات حول متطلبات العمل من الأطراف المعنية والمستخدمين النهائيين. ثم يتم ترجمة قواعد الأعمال إلى هياكل بيانات لصياغة تصميم قاعدة بيانات ملموسة. يمكن تشبيه نموذج البيانات بخريطة طريق أو مخطط معماري أو أي مخطط رسمي يسهل فهماً أعمق لما يتم تصميمه.

تستخدم نمذجة البيانات مخططات موحدة وتقنيات رسمية. يوفر هذا طريقة مشتركة ومتسقة ومتوقعة لتعريف وإدارة الموارد عبر المؤسسة، أو حتى خارجها.

من الناحية المثالية، تكون نماذج البيانات عبارة عن مستندات حية تتطور مع تغير احتياجات العمل. حيث تلعب دوراً مهماً في دعم عمليات الأعمال وتخطيط بنية واستراتيجية تكنولوجيا المعلومات. يمكن مشاركة نماذج البيانات مع البائعين والشركاء و/أو النظراء في الصناعة.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

أنواع نماذج البيانات

مثل أي عملية تصميم ، يبدأ تصميم قاعدة البيانات ونظام المعلومات عند مستوى عالٍ من التجريد ويصبح أكثر واقعية وتحديدًا بشكل متزايد. يمكن تقسيم نماذج البيانات عمومًا إلى ثلاث فئات، والتي تختلف وفقًا لدرجة تجريدها. ستبدأ العملية بنموذج مفاهيمي، ثم تنتقل إلى نموذج منطقي وتنتهي بنموذج مادي. تتم مناقشة كل نوع من أنواع نماذج البيانات بمزيد من التفصيل في الأقسام التالية:

نماذج البيانات المفاهيمية

يشار إليها أيضًا باسم نماذج المجال، وتقدم رؤية شاملة لما سيحتويه النظام وكيفية تنظيمه وقواعد العمل التي يتضمنها. عادة ما يتم إنشاء النماذج المفاهيمية كجزء من عملية جمع المتطلبات الأولية للمشروع. وعادةً ما تشمل فئات الكيانات (التي تحدد أنواع الأشياء المهمة بالنسبة إلى الشركة لتمثيلها في نموذج البيانات)، وخصائصها وقيودها، والعلاقات بينها والمتطلبات ذات الصلة بالأمن وسلامة البيانات. عادةً ما يكون أي تدوين بسيطًا.

مخطط نمذجة البيانات المفاهيمية

نماذج البيانات المنطقية

تُعد أقل غموضًا وتقدم تفاصيل أكثر حول المفاهيم والعلاقات في المجال المعني. يُستخدم أحد أنظمة التدوين الرسمية المتعددة الخاصة بنمذجة البيانات. وهي تحدد خصائص البيانات مثل أنواع البيانات وأطوالها، وتوضح العلاقات بين الكيانات. ولا تحدد النماذج المنطقية للبيانات أي متطلبات تقنية للنظام. غالبا ما يتم تجاهل هذه المرحلة في ممارسات الأسلوب الرشيق أو عمليات التطوير. يمكن أن تكون نماذج البيانات المنطقية مفيدة في بيئات التنفيذ الإجرائية العالية، أو للمشاريع التي تعتمد بطبيعتها على البيانات، مثل تصميم مستودعات البيانات أو تطوير أنظمة التقارير.

مخطط نمذجة البيانات المنطقية

نماذج البيانات المادية

وهي توفر مخططًا لكيفية تخزين البيانات فعليًا داخل قاعدة بيانات. وعلى هذا النحو، فهي الأقل تجريداً على الإطلاق. وهي تقدم تصميماً نهائياً يمكن تنفيذه كقاعدة بيانات علائقية، بما في ذلك الجداول الترابطية التي توضح العلاقات بين الكيانات بالإضافة إلى المفاتيح الأساسية والمفاتيح الخارجية التي سيتم استخدامها للحفاظ على تلك العلاقات. يمكن أن تتضمن نماذج البيانات المادية خصائص خاصة بنظام إدارة قواعد البيانات (DBMS)، بما في ذلك ضبط الأداء.

مخطط نمذجة البيانات المادية

عملية نمذجة البيانات

كتخصص، تدعو نمذجة البيانات الأطراف المعنية لتقييم معالجة البيانات والتخزين بتفصيل دقيق. تحتوي تقنيات نمذجة البيانات على اتفاقيات مختلفة تحدد الرموز المستخدمة لتمثيل البيانات، وكيفية وضع النماذج، وكيفية نقل متطلبات الأعمال. توفر جميع الأساليب مهام سير عمل ذات طابع رسمي تتضمن سلسلة من المهام التي سيتم تنفيذها بطريقة تكرارية. تبدو مهام سير العمل هذه عمومًا على النحو التالي:

  1. تحديد الكيانات. تبدأ عملية نمذجة البيانات بتحديد الأشياء أو الأحداث أو المفاهيم التي يتم تمثيلها في مجموعة البيانات التي سيتم نمذجتها. ينبغي أن يكون كل كيان متماسكًا ومنفصلًا منطقيًا عن جميع الكيانات الأخرى.
  2. تحديد الخصائص الرئيسية لكل كيان. يمكن تمييز كل نوع من أنواع الكيانات عن جميع أنواع الكيانات الأخرى لأن له خاصية أو أكثر من الخصائص الفريدة، والتي تسمى السمات. على سبيل المثال، قد يمتلك كيان يسمى "عميل" سمات مثل الاسم الأول، الاسم الأخير، رقم الهاتف ولقب التحية، بينما الكيان المسمى "العنوان" قد يشمل اسم ورقم شارع، ومدينة، وولاية، ودولة، ورمز بريدي.
  3. تحديد العلاقات بين الكيانات. ستحدد المسودة الأولى لنموذج البيانات طبيعة العلاقات التي تربط كل كيان مع الكيانات الأخرى. في المثال أعلاه، كل عميل "يعيش في" عنوان. إذا تم توسيع نطاق هذا النموذج ليشمل كيانًا يسمى "الطلبات"، فسيتم شحن كل طلب إلى عنوان وإرسال الفواتير إليه أيضًا. عادة ما يتم توثيق هذه العلاقات من خلال لغة النمذجة الموحدة (UML).
  4. تعيين السمات للكيانات بالكامل. سيضمن ذلك أن يعكس النموذج كيفية استخدام الشركة للبيانات. تستخدم عدة أنماط رسمية لنمذجة البيانات. غالبًا ما يطبق المطورون الذين يعتمدون على الكائنات أنماط التحليل أو أنماط التصميم، بينما قد تلجأ الأطراف المعنية إلى أنماط أخرى.
  5. قم بتعيين المفاتيح حسب الحاجة، وحدد درجة التطبيع التي توازن بين الحاجة إلى تقليل التكرار ومتطلبات الأداء. التطبيع هو تقنية لتنظيم نماذج البيانات (وقواعد البيانات التي تمثلها) حيث تُسند المعرفات الرقمية، التي تسمى المفاتيح، إلى مجموعات من البيانات لتمثيل العلاقات بينها دون تكرار البيانات. على سبيل المثال، إذا تم تعيين مفتاح لكل عميل، فيمكن ربط هذا المفتاح بكل من عنوانه وسجل طلباته دون الحاجة إلى تكرار هذه المعلومات في جدول أسماء العملاء. عادة ما يقلل التطبيع من مساحة التخزين التي تحتاجها قاعدة البيانات، لكنه قد يؤثر على أداء الاستعلام.
  6. الانتهاء من نموذج البيانات والتحقق من صحته. نمذجة البيانات هي عملية تكرارية يجب تكرارها وتحسينها مع تغير احتياجات الأعمال.
Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

أنواع نمذجة البيانات

لقد تطورت نمذجة البيانات جنبًا إلى جنب مع أنظمة إدارة قواعد البيانات، حيث ازدادت أنواع النماذج تعقيدًا مع نمو احتياجات تخزين البيانات لدى الشركات. فيما يلي عدة أنواع من النماذج:

  • تمثل نماذج البيانات الهرمية علاقات من واحد إلى متعدد بتنسيق شجري. في هذا النوع من النماذج، يحتوي كل سجل على جذر واحد أو أصل واحد والذي يرتبط بجدول فرعي واحد أو أكثر. تم تطبيق هذا النموذج في نظام إدارة المعلومات IBM Information Management System (IMS)، الذي تم تقديمه في عام 1966 وحقق استخداماً واسعاً بسرعة، خاصة في القطاع المصرفي. على الرغم من أن هذا النهج أقل كفاءة من نماذج قواعد البيانات التي تم تطويرها مؤخرًا، إلا أنه لا يزال مستخدمًا في أنظمة لغة الترميز الموسعة (XML) ونظم المعلومات الجغرافية (GIS).
  • تم اقتراح نماذج البيانات العلائقية في البداية من قبل الباحث E.F. Codd في شركة IBM في عام 1970. لا تزال هذه النماذج مستخدمة حتى اليوم في العديد من قواعد البيانات العلائقية المختلفة المستخدمة بشكل شائع في الحوسبة المؤسسية. لا تتطلب نمذجة البيانات العلائقية فهماً تفصيلياً للخصائص الفيزيائية للبيانات المخزنة التي يتم استخدامها. وفيها يتم ربط أجزاء البيانات بشكل صريح من خلال استخدام الجداول، مما يقلل من تعقيد قاعدة البيانات.

كثيرًا ما تستخدم قواعد البيانات العلائقية لغة الاستعلام المهيكلة (SQL) لإدارة البيانات. تعمل قواعد البيانات هذه بشكل جيد للحفاظ على سلامة البيانات وتقليل التكرار. وغالباً ما يتم استخدامها في أنظمة نقاط البيع، وكذلك لأنواع أخرى من معالجة المعاملات.

  • تستخدم نماذج بيانات علاقة الكيانات (ER) مخططات رسمية لتمثيل العلاقات بين الكيانات في قاعدة البيانات. يتم استخدام العديد من أدوات نمذجة بيانات علاقة الكيانات (ER) من قبل مهندسي البيانات لإنشاء خرائط مرئية تعبّر عن أهداف تصميم قاعدة البيانات.
  • اكتسبت نماذج البيانات المستندة إلى الكائنات زخمًا مثل البرمجة المستندة إلى الكائنات وأصبحت شائعة في منتصف التسعينيات. "الكائنات" المعنية هي تمثيلات تجريدية لكيانات في العالم الحقيقي. يتم تجميع الكائنات في تسلسلات هرمية للفئات، ولها ميزات مرتبطة. يمكن لقواعد البيانات المستندة إلى الكائنات أن تتضمن جداول، ولكنها يمكن أن تدعم أيضًا علاقات البيانات الأكثر تعقيدًا. يتم استخدام هذا النهج في قواعد بيانات الوسائط المتعددة والنصوص التشعبية بالإضافة إلى حالات استخدام أخرى.
  • تم تطوير نماذج البيانات متعددة الأبعاد من قبل Ralph Kimball، وتم تصميمها لتحسين سرعة استرجاع البيانات لأغراض التحليل في مستودع البيانات. بينما تؤكد النماذج العلائقية ونماذج علاقة الكائنات على التخزين الفعال، تزيد النماذج متعددة الأبعاد من التكرار من أجل تسهيل تحديد موقع المعلومات لإعداد التقارير والاسترجاع. تُستخدم هذه النمذجة عادةً عبر أنظمة OLAP.

هناك نموذجان شائعان لنماذج البيانات متعددة الأبعاد وهما المخطط النجمي، حيث يتم تنظيم البيانات في حقائق (عناصر قابلة للقياس) وأبعاد (معلومات مرجعية)، حيث تحاط كل حقيقة بأبعادها المرتبطة بها في نمط يشبه النجوم. والآخر هو مخطط ندفة الثلج، الذي يشبه مخطط النجوم ولكنه يتضمن طبقات إضافية من الأبعاد المرتبطة، مما يجعل النمط المتفرّع أكثر تعقيدًا.

فوائد نمذجة البيانات

تجعل نمذجة البيانات من السهل على المطورين ومهندسي البيانات ومحللي الأعمال وغيرهم من الأطراف المعنية رؤية وفهم العلاقات بين البيانات في قاعدة البيانات أو مستودع البيانات. بالإضافة إلى ذلك، يمكنها:

  • تقليل الأخطاء في تطوير البرامج وقواعد البيانات.
  • زيادة الاتساق في الوثائق وتصميم النظام عبر المؤسسة.
  • تحسين أداء التطبيق وقاعدة البيانات.
  • سهولة تخطيط البيانات في جميع أنحاء المؤسسة.
  • تحسين التواصل بين المطورين وفرق ذكاء الأعمال.
  • تسهيل وتسريع عملية تصميم قاعدة البيانات على المستويات المفاهيمية والمنطقية والمادية.

أدوات نمذجة البيانات

تستخدم العديد من حلول هندسة البرمجيات بمساعدة الحاسوب (CASE) التجارية ومفتوحة المصدر على نطاق واسع اليوم، بما في ذلك نمذجة البيانات المتعددة وأدوات الرسم التوضيحي والعروض المصورة للبيانات. وفيما يلي بعض الأمثلة:

  • erwin Data Modeler هو أداة نمذجة البيانات التي تعتمد على لغة نمذجة البيانات Integration DEFinition for information modeling (IDEF1X)، والتي تدعم الآن منهجيات ترميز أخرى، بما في ذلك النهج متعدد الأبعاد.
  • Enterprise Architect هو أداة نمذجة وتصميم بصرية تدعم نمذجة أنظمة وهياكل المعلومات المؤسسية بالإضافة إلى تطبيقات البرمجيات وقواعد البيانات. وتعتمد على اللغات والمعايير المستندة إلى الكائنات.
  • ER/Studio هو برنامج لتصميم قواعد البيانات متوافق مع العديد من أنظمة إدارة قواعد البيانات الأكثر شيوعًا في الوقت الحالي. يدعم كلاً من النمذجة العلائقية ومتعددة الأبعاد.
  • تتضمن أدوات نمذجة البيانات المجانية حلولاً مفتوحة المصدر مثل Open ModelSphere.
حلول ذات صلة
أدوات وحلول علم البيانات

استخدام أدوات علم البيانات وحلوله لاكتشاف الأنماط وبناء التنبؤات باستخدام البيانات والخوارزميات والتعلم الآلي وتقنيات الذكاء الاصطناعي

استكشف حلول علم البيانات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

استخدام أدوات علم البيانات وحلوله لاكتشاف الأنماط وبناء التنبؤات باستخدام البيانات والخوارزميات والتعلم الآلي وتقنيات الذكاء الاصطناعي.

استكشف حلول علم البيانات استكشف خدمات التحليلات