ما المقصود بمستودع البيانات؟
استكشف حل مستودعات البيانات المقدم من شركة IBM اشترك في الرسالة الإخبارية من Think
رسم توضيحي مع مجموعة من الصور التوضيحية للسحب، ومخطط دائري ورسوم بيانية

تاريخ التحديث: 11 أكتوبر 2024 
المساهمان
: Jim Holdsworth وMatthew Kosinski

ما المقصود بمستودع البيانات؟

مستودع البيانات هو نظام يجمع البيانات من مصادر متعددة في مخزن بيانات واحد مركزي ومتسق. تساعد مستودعات البيانات على إعداد البيانات لتحليلات البيانات وذكاء الأعمال واستخراج البيانات ومبادرات التعلم الآلي والذكاء الاصطناعي.

 

يساعد نظام مستودع البيانات على مستوى المؤسسة مؤسستك على إجراء تحليلات فائقة لكميات هائلة من البيانات (بيتابايت وأكثر) بطرق يصعب على قاعدة البيانات القياسية فعلها. يمكن أن تكون البيانات منظمة، أو شبه منظمة، أو غير منظمة. يمكن تخزين البيانات في المستودع من قواعد بيانات متعددة، بما في ذلك أنظمة إدارة علاقات العملاء (CRM)، والمخزون، ونقاط البيع (POS)، وأنظمة إدارة سلسلة التوريد.

تدعم أنظمة مستودعات البيانات - التي يُطلق عليها أحيانًا أنظمة مستودعات بيانات المؤسسة (EDW) - جهود ذكاء الأعمال منذ أكثر من ثلاثة عقود. وتتركز وظائفها على استخراج البيانات من مصادر مختلفة، وتنظيم البيانات وإعدادها، وتحميل البيانات والحفاظ عليها، غالبًا في قاعدة بيانات علائقية.

في الماضي، كان مستودع البيانات يُستضاف في بيئة محلية، غالبًا على أجهزة النظام المركزي. أما في الوقت الحالي، أصبحت العديد من مستودعات البيانات تُستضاف على السحابة وتُقدم كخدمات سحابية. 

يتطلب الذكاء الاصطناعي طرقًا جديدة لإدارة البيانات

دليل مسؤولي البيانات لاستخدام قواعد البيانات المناسبة للتطبيقات والتحليلات والذكاء الاصطناعي التوليدي.

تطور مستودعات البيانات

نشأت مستودعات البيانات في الثمانينيات بهدف تحسين تحليلات البيانات من خلال إتاحة بيانات المعاملات المتكاملة بتنسيق متسق. ومع تطور إمكانات تطبيقات الأعمال وظهور مصادر بيانات جديدة - بما في ذلك شبكة الإنترنت العالمية ووسائل التواصل الاجتماعي وإنترنت الأشياء (IOT)- زادت الحاجة إلى مساحات تخزين أكبر وتحليلات أسرع.

وعندما تطورت مستودعات البيانات وأصبحت تدعم كميات أكبر وبيانات أكثر دقة، طلبت المزيد من الفرق داخل المؤسسات إتاحة إمكانية الوصول المباشر إلى البيانات من أجل تنفيذ وظائف تحليلات الخدمة الذاتية.

أدركت العديد من المؤسسات أن مستودعات بياناتها القديمة لا يمكنها إدارة أحمال التشغيل الضخمة الجديدة هذه. ونظرًا إلى أن العديد من مستودعات البيانات تُخزن البيانات المنظمة فقط، فقد يكون ثراء التحليلات أمرًا مقيدًا. ونتيجةً لذلك، تطورت بدائل أكثر مرونة، بما في ذلك مستودعات البيانات القائمة على السحابة ومستودعات بحيرات البيانات. (راجع "مقارنة بين مستودعات بحيرات البيانات ومستودعات البيانات" لمعرفة المزيد من المعلومات). 

بنية مستودعات البيانات

من أجل معالجة البيانات بسرعة وكفاءة، غالبًا ما تكون بنية مستودعات البيانات مكونة من ثلاث طبقات.

الطبقة السفلى


هذه الطبقة هي المكان الذي تتدفق فيه البيانات من مصادر البيانات المختلفة إلى خادم مستودع البيانات الذي تُخزن فيه. غالبًا ما تمر البيانات بعملية تُعرف باسم الاستخراج والتحويل والتحميل (ETL) أو في بعض الأحيان عملية تُعرف باسم الاستخراج والتحميل والتحويل (ELT). تُجرى هذه العمليات بطرق مختلفة، ولكن كلاهما يستخدم الأتمتة لنقل البيانات إلى المستودع وإعدادها للاستخدام في التحليلات.

الطبقة المتوسطة


تُنشأ هذه الطبقة عادةً حول محرك التحليلات، وغالبًا ما يكون نظام المعالجة التحليلية عبر الإنترنت (OLAP) المصمم لتسريع التحليلات والاستعلامات. يمكن استخدام ثلاثة أنواع من نماذج OLAP في هذه الطبقة وهي ما يلي:

  • المعالجة التحليلية العلائقية عبر الإنترنت (ROLAP)، والتي تتيح إمكانية تحليل البيانات متعددة الأبعاد في قواعد البيانات العلائقية.

  • المعالجة التحليلية متعددة الأبعاد عبر الإنترنت (MOLAP)، والتي تستخدم محركات تخزين متعددة الأبعاد قائمة على المصفوفات لإنشاء طرق عرض متعددة الأبعاد للبيانات.

  • المعالجة التحليلية الهجينة عبر الإنترنت (HOLAP)، والتي تدمج إمكانات كل من ROLAP وMOLAP.

يعتمد نوع نموذج OLAP المستخدم على نوع نظام قاعدة البيانات المستخدم.

الطبقة العليا


تتضمن هذه الطبقة واجهة مستخدم أمامية أو أداة إعداد التقارير، والتي تمكّن المستخدمين من إجراء تحليلات بيانات مخصصة لبيانات أعمالهم. لذكاء الأعمال القائم على الخدمة الذاتية استخدامات متعددة، مثل إنشاء التقارير بناءً على البيانات القديمة أو انتهاز الفرص الجديدة أو تحديد مشاكل العمليات.

التعرف على OLAP وOLTP

تستخدم معظم مستودعات البيانات أنظمة OLAP لدعم التحليلات. تُجري برمجيات OLAP تحليلات متعددة الأبعاد بسرعات فائقة على كميات هائلة من البيانات من مخزن بيانات مركزي موحد، مثل مستودع البيانات.

غالبًا ما يكون لجزء من بيانات الأعمال أبعاد متعددة. على سبيل المثال، قد تتضمن أرقام المبيعات عدة أبعاد تتعلق بالموقع (المنطقة والدولة والمخزن) أو الوقت (السنة والشهر والأسبوع واليوم) أو المنتج (العلامة التجارية والنوع).

في قاعدة البيانات العلائقية التقليدية، تُنظم البيانات في جداول مكونة من صفوف وأعمدة، ما يعني أنها تمثل بُعدين فقط من هذه الأبعاد في المرة الواحدة - بُعد في الصف وبُعد آخر في العمود. وهذا من شأنه أن يجعل التحليل أمرًا مرهقًا.

ومع ذلك، تُمكّن أنظمة OLAP المستخدمين من تحليل البيانات على أبعاد متعددة في وقت واحد، ما يتيح معالجة أسرع وتحليل أكثر عمقًا. تتضمن الاستخدامات الشائعة لأنظمة OLAP استخراج البيانات وتطبيقات ذكاء الأعمال، والحسابات التحليلية المعقدة، والسيناريوهات التنبئية، ووضع الميزانيات وإجراء التوقعات.

يختلف نظام OLAP عن نظام المعالجة المعاملاتية عبر الإنترنت أو OLTP. تتبع أنظمة OLTP أعدادًا كبيرة من معاملات أعداد كبيرة من المستخدمين في الوقت الفعلي. يكمن وجه الاختلاف الرئيسي بين نظام OLTP وOLAP في أن أنظمة OLTP مصممة بشكل أساسي لجمع البيانات، بينما تحلل أنظمة OLAP البيانات المجمعة بالفعل.

غالبًا ما تستخدم أنظمة OLTP قواعد البيانات العلائقية لتسجيل المعاملات مثل ما يلي:

  • معاملات البنوك وأجهزة الصراف الآلي
  • مشتريات المتاجر الإلكترونية والمتاجر التقليدية
  • حجوزات الفنادق وشركات الطيران

على الرغم من أن مستودعات البيانات لا تتضمن عادةً أنظمة OLTP، فإن البيانات التي تسجلها أنظمة OLTP في قواعد البيانات تُخزن عادة في المستودعات، حيث يتيح نظام OLAP إمكانية إجراء التحليلات.

مقارنة بين نظام OLAP وOLTP: ما أوجه الاختلاف؟
المخططات في مستودعات البيانات

تحدد مخططات قواعد البيانات كيفية تنظيم البيانات داخل قاعدة البيانات أو مستودع البيانات. ثمة نوعان رئيسيان من هياكل المخططات المستخدمة في مستودعات البيانات: مخطط النجوم ومخطط ندفة الثلج.

يُعد كل من مخطط النجوم ومخطط ندفة الثلج نماذج بيانات متعددة الأبعاد مصممة لتسريع عمليات استرجاع البيانات. تزيد النماذج متعددة الأبعاد من تكرار البيانات بهدف تسهيل عملية تحديد موقع المعلومات لإعداد التقارير واسترجاع البيانات. تُستخدم هذه النمذجة عادةً عبر أنظمة OLAP.

مخطط النجوم

 

يتكون هذا المخطط من جدول حقائق واحد (وهو يحتوي على عناصر قابلة للقياس مثل المنتجات المبيعة ومبالغ المبيعات النقدية) متصل بجداول الأبعاد (أي المعلومات المرجعية التي توضح كيفية تجميع الحقائق وتنظيمها، مثل تواريخ البيع والمجال المبيعة له).

في الرسم البياني، يمكن أن يظهر جدول الحقائق في منتصف مخطط النجوم. يُعد مخطط النجوم أبسط أنواع المخططات وأكثرها شيوعًا، ويستفيد مستخدموه من سرعاته الفائقة عند الاستعلام.

مخطط كتلة الثلج

 

على الرغم من عدم استخدامه على نطاق واسع، إلا أن مخطط كتلة الثلج هو هيكل تنظيمي آخر يُستخدم في مستودعات البيانات. في هذه الحالة، يتصل جدول الحقائق بالعديد من جداول الأبعاد المنظمة التي تحتوي على بيانات وصفية حول الحقائق الموجودة في جدول الحقائق المركزي. ولجداول الأبعاد هذه أيضًا جداول فرعية.

يمكن أن يشبه هذا النمط المتفرع والأكثر تعقيدًا كتلة الثلج. يستفيد مستخدمو مخطط كتلة الثلج من انخفاض معدل تكرار البيانات، ولكن هذا يأتي على حساب بطء الأداء عند الاستعلام.  

عناصر بنية مستودع البيانات

تُنشَأ معظم مستودعات البيانات حول نظام قاعدة بيانات علائقية، سواء في البيئات المحلية أم على السحابة، حيث تُخزن البيانات وتُعالج. يحتوي مستودع البيانات الطبيعي على عناصر مثل ما يلي:

  • طبقة البيانات (أو قاعدة البيانات المركزية)
  • أدوات الوصول
  • أدوات الاستخراج والتحويل والتحميل (ETL)
  • البيانات الوصفية
  • آلية تحديد الوصول
  • طبقة واجهة برمجة التطبيق (API)
طبقة البيانات (أو قاعدة البيانات المركزية)

طبقة البيانات أو قاعدة البيانات المركزية هي قلب مستودع البيانات وتدعمها جميع العناصر الأخرى. يمكن إدخال البيانات الواردة من تطبيقات الأعمال أو قوائم البريد الإلكتروني أو المواقع الإلكترونية أو أي قواعد بيانات علائقية أخرى. تُخزن البيانات فعليًا على خادم أو مجموعة من الخوادم.

يمكن أن تُقسم طبقة البيانات البيانات إلى أجزاء بحيث يتمكن المستخدمين من الوصول إلى البيانات التي يحتاجون إليها فقط. على سبيل المثال، لن يتمكن فريق المبيعات عادةً من الوصول إلى بيانات فريق الموارد البشرية والعكس صحيح.

عادةً ما تحتوي مستودعات البيانات على إمكانات مدمجة لحوكمة البيانات وتعزيز الأمان، ومن ثَم لن تضطر المؤسسات إلى بذل الكثير من الجهد في هندسة البيانات المخصصة من أجل تضمين تلك المزايا. قد تحتاج المؤسسات إلى تحديث مبادئ حوكمة البيانات والتدابير الأمنية بمرور الوقت عند إضافة بيانات جديدة من مصادر مختلفة إلى المستودع.

أدوات الوصول

تتصل أدوات الوصول بمستودع البيانات من أجل توفير واجهة أمامية سهلة الاستخدام لمستخدمي الأعمال. يمكن أن يشمل ذلك لوحات المعلومات وأدوات إعداد التقارير وتصور البيانات التي تُمكّن محللي البيانات ومستخدمي الأعمال من التفاعل مع البيانات واستخراج المعارف. ومن الأمثلة على هذه الأدوات Tableau وLooker وQlik.

أدوات الاستخراج والتحويل والتحميل (ETL)

تساعد أدوات ETL على نقل البيانات من مصدر البيانات إلى مستودع البيانات. "تُستخرج" البيانات أولاً من مصدرها، وتُنقل إلى منطقة التحضير حيث تُنظم وتُهيَّأ (أو "تُحوّل")، ثم "تُحمل" إلى المستودع.

تقوم أدوات ETL بتحويل البيانات إلى تنسيق متسق بحيث يمكن تحليلها والاستعلام عنها بكفاءة عندما تكون داخل المستودع. على سبيل المثال، قد تُستخرج البيانات من قواعد بيانات العملاء المتعددة ثم تُحوّل إلى تنسيق موحد بحيث تحتوي جميع سجلات العملاء على الحقول نفسها.

يمكن أن تساعد أداة إطار معالجة البيانات، مثل Apache Spark، على إدارة عملية تحويل البيانات.

نظرًا إلى أن مستودع البيانات يُخزن البيانات المنظمة بشكل أساسي، تُحوّل البيانات عادةً قبل نقلها إلى المستودع. في حين أن بعض المستودعات يمكن أن تستخدم عملية الاستخراج والتحميل والتحويل (ELT) بدلاً من هذه العملية - والتي تُحمل البيانات إلى المستودع قبل تحويلها - تُستخدم هذه العملية بشكل أكثر شيوعًا في بحيرات البيانات، والتي لا تتطلب تنسيقات موحدة للبيانات. (راجع "مقارنة بين بحيرات البيانات ومستودعات البيانات" لمعرفة المزيد من المعلومات.)

البيانات الوصفية

البيانات الوصفية هي بيانات عن البيانات. وهي تصف بشكل أساسي البيانات المخزنة في النظام حتى تُسهل عملية البحث عنها. تتضمن البيانات الوصفية الخصائص مثل أسماء المؤلفين وتواريخ المقالات أو مواقعها وتواريخ الإنشاء وأحجام الملفات. تساعد البيانات الوصفية ونظام إدارتها على تنظيم البيانات وجعلها قابلة للاستخدام من أجل إجراء التحليلات.

آلية تحديد الوصول

توفر بعض مستودعات البيانات منطقة اختبار معزولة عن البيانات الفعلية. قد تُستخدم كبيئة اختبار، تحتوي على نسخة من البيانات المنتجة وأدوات التحليل والتصور ذات الصلة. يمكن أن يُجرب محللو البيانات وعلماء البيانات تقنيات تحليلية جديدة في منطقة الاختبار المعزولة من دون المساس بعمليات مستودعات البيانات الخاصة بالمستخدمين الآخرين.

طبقة واجهة برمجة التطبيق (API)

يمكن أن تساعد طبقة اتصال واجهات برمجة التطبيقات (APIs) المستودعات على جمع البيانات من المصادر التنظيمية وتوفير إمكانية الوصول إلى أدوات التصور والتحليلات.

مقارنة بين مستودعات البيانات وأنواع وحدات تخزين البيانات الأخرى

تُستخدم مصطلحات مستودع البيانات وقاعدة البيانات وبحيرة البيانات ومتجر البيانات ومستودع بحيرة البيانات أحيانًا بشكل متبادل. وعلى الرغم من تشابه هذه الأنظمة، إلا أن هناك أوجه اختلاف مهمة.

مقارنة بين قاعدة البيانات ومستودع البيانات

قاعدة البيانات بمثابة خزانة الملفات المنشأة في المقام الأول من أجل الاستعلامات السريعة ومعالجة المعاملات، ولكن ليس من أجل التحليلات. تعمل قاعدة البيانات عادةً كمخزن بيانات مركزي لتطبيق معين، بينما يُخزن مستودع البيانات البيانات من أي عدد من التطبيقات داخل المؤسسة.

تركز قاعدة البيانات على جمع البيانات في الوقت الفعلي، في حين أن مستودع البيانات له نطاق أوسع، حيث يجمع البيانات القديمة - وأحيانًا البيانات الحالية – من أجل التحليلات التنبئية والتعلم الآلي والتحليلات المتقدمة الأخرى.

مقارنة بين بحيرة البيانات ومستودع البيانات

بحيرة البيانات هي حل من حلول تخزين كميات هائلة من البيانات المنسقة من دون وجود مخطط محدد مسبقًا. غالبًا ما تحتوي بحيرة البيانات على بيانات غير منظمة وبيانات شبه منظمة، مثل المستندات ومقاطع الفيديو وسجلات إنترنت الأشياء ومنشورات وسائل التواصل الاجتماعي. وعادةً ما تُنشئ على منصات البيانات الضخمة مثل Apache Hadoop.

تُصمم بحيرات البيانات بشكل أساسي لتوفير وحدات تخزين منخفضة التكلفة لكميات هائلة من البيانات. ومن أجل الحفاظ على انخفاض تكاليف التخزين، فإنها لا تُحوّل عادةً البيانات أو تُحسنها من أجل إجراء التحليلات، كما يفعل المستودع.

مقارنة بين متجر البيانات ومستودع البيانات

متجر البيانات هو نوع من أنواع مستودعات البيانات التي تحتوي على بيانات خاصة بوحدة أعمال أو قسم معين بدلاً من بيانات المؤسسة بأكملها.

نظرًا إلى أن متاجر البيانات تحتوي على مجموعة فرعية أصغر من البيانات، فإنها تُمكّن القسم أو وحدة الأعمال من اكتشاف معارف أكثر دقة بسرعة أكبر مما هو ممكن عند العمل مع مجموعة بيانات مستودع البيانات الأوسع.

على سبيل المثال، قد يستخدم فريق التسويق متجر البيانات لتحديد أفضل تركيبة سكانية مستهدفة، بينما قد يستخدم فريق الإنتاج متجر البيانات لتحليل أنماط المخزون.

مقارنة بين مستودعات بحيرات البيانات ومستودع البيانات

مستودع بحيرة البيانات هو منصة بيانات تجمع خصائص مستودعات البيانات وبحيرات البيانات — أي مرونة بحيرة البيانات والأداء الفائق لمستودع البيانات — في حل واحد لإدارة البيانات. قد تختص مستودعات بحيرات البيانات أيضًا بالمزيد من المزايا مثل البيانات الوصفية المشتركة ومحركات لغة الاستعلام المركبة (SQL) الموزعة وضوابط الحوكمة والأمان المدمجة.

أدى ظهور التقنيات مفتوحة المصدر والرغبة في تقليل معدل تكرار البيانات وعمليات ETL المعقدة إلى تطوير مستودعات بحيرات البيانات. بفضل الجمع بين المزايا الرئيسية للبحيرات والمستودعات في حل بيانات واحد، يمكن أن تساعد مستودعات البحيرات على تسريع معالجة البيانات ودعم التعلم الآلي وعلوم البيانات وأحمال تشغيل الذكاء الاصطناعي.

أنواع مستودعات البيانات
مستودعات البيانات القائمة على السحابة

يُصمم مستودع البيانات القائم على السحابة بحيث يعمل على السحابة. وغالبًا ما يُقدم للمؤسسات كخدمة تخزين بيانات مُدارة حيث تدير شركة السحابة البنية التحتية لمستودع البيانات. لا تحتاج المؤسسات إلى الاستثمار مقدمًا في الأجهزة أو البرمجيات، ولا تحتاج إلى إدارة نظامها الخاص. وغالبًا ما تُقدم خدمات السحابة خيارات تسعير مرنة كذلك.

ازدادت شعبية مستودعات البيانات القائمة على السحابة حيث تستخدم المزيد من المؤسسات خدمات الحوسبة السحابية وتسعى إلى تقليل حجم مراكز البيانات المحلية لديها.

مستودع بيانات محلي أم مرخص

يمكن أن تشتري الشركة رخصة مستودع بيانات، ثم تستخدم المستودع كبنية تحتية محلية خاصة بها. وعلى الرغم من أن هذا عادةً ما يكون أكثر تكلفة من خدمة مستودع البيانات القائم على السحابة، إلا أنها قد تكون خيارًا جيدًا للهيئات الحكومية أو المؤسسات المالية أو غيرها من المؤسسات التي تريد تعزيز سيطرتها على بياناتها أو تحتاج إلى الامتثال لمعايير أمنية صارمة أو معايير خصوصية البيانات.

جهاز مستودع البيانات 

جهاز مستودع البيانات هو حزمة متكاملة من الأجهزة والبرمجيات - والتي تتضمن عادةً وحدات المعالجة المركزية (CPUs) ووحدات التخزين ونظام التشغيل وبرمجيات مستودع البيانات - والتي يمكن للشركة توصيلها بشبكتها والبدء في استخدامها كما هي.

بالنظر إلى التكلفة المبدئية وسرعة النشر وسهولة التوسع والتحكم في إدارة البيانات، فعادةً ما يقع جهاز مستودع البيانات في مركز وسط بين تطبيقات السحابة والتطبيقات المحلية.

حالات استخدام مستودعات البيانات

يمكن أن يوفر مستودع البيانات المعارف والمعلومات للفرق عبر المؤسسة من خلال الخدمة الذاتية السريعة، ما يدعم حالات استخدام متعددة.

  • الذكاء الاصطناعي والتعلم الآلي
  • ذكاء الأعمال
  • تكامل البيانات
  • الاستخدامات الخاصة بالمجالات
الذكاء الاصطناعي والتعلم الآلي

يمكن أن تدعم مستودعات البيانات العديد من تطبيقات الذكاء الاصطناعي والتعلم الآلي. ويمكن أن يحلل علماء البيانات البيانات القديمة بهدف تطوير الخوارزميات التنبئية. ويمكنهم تعليم تطبيقات التعلُّم الآلي بحيث تتمكن من التقاط الأنماط، مثل أنشطة الحسابات غير الاعتيادية والتي قد تشير إلى حوادث احتيالية. ويمكنهم استخدام بيانات المستودعات المنظمة والموثوقة من أجل إنشاء نماذج الذكاء الاصطناعي التوليدي الخاصة بهم أو من أجل ضبط النماذج الحالية ضبطًا دقيقًا بهدف تحسين تلبية احتياجات أعمالهم الفريدة.

ذكاء الأعمال

يمكن أن يُتيح مستودع البيانات على مستوى المؤسسة لآلاف المستخدمين إمكانية الوصول إلى أدوات التحليلات وتشغيلها في وقت واحد. ونظرًا إلى أن البيانات تُخزن بشكل منفصل عن قواعد البيانات التشغيلية، وبتنسيق أكثر كفاءة، يمكن أن يُجري المستخدمون استعلاماتهم ذاتية الخدمة عن ذكاء الأعمال من دون إبطاء الأنظمة الرئيسية الأخرى.

تكامل البيانات

يمكن أن تساعد مستودعات البيانات على توحيد البيانات المعزولة من خلال عمليات ETL التي تعمل على أتمتة عمليات التنظيم والتكامل. ويساعد ذلك على تسريع عملية الاستعلامات والمعالجة ويُمكّن المزيد من المستخدمين من الوصول إلى البيانات.

كما قد يتضمن مستودع البيانات على مستوى المؤسسة دعمًا للتنسيقات مفتوحة المصدر، مثل Apache Iceberg وParquet وCSV، ما يعزز مشاركة البيانات عبر المؤسسة.

الاستخدامات الخاصة بالمجالات

يمكن أن تُستخدم مستودعات البيانات أيضًا في حالات الاستخدام الخاصة بالمجالات، مثل ما يلي:

  • القطاع الحكومي: يمكن أن تساعد الإمكانات التحليلية لمستودع البيانات الحكومات على فهم الظواهر المعقدة مثل الجريمة والاتجاهات الديموغرافية وأنماط حركة المرور بشكل أفضل.

  • الرعاية الصحية: يمكن أن تساعد إمكانات تجميع وتحليل البيانات المختلفة، مثل أكواد الفواتير والتشخيص، والمعلومات الديموغرافية حول المرضى، والأدوية ونتائج التحاليل، المستشفيات على اكتساب معارف بشأن نتائج المرضى، والكفاءة التشغيلية وغير ذلك الكثير.

  • الضيافة والنقل: يمكن أن تستخدم المؤسسات البيانات القديمة المتعلقة بخيارات السفر والإقامة لتوجيه الإعلانات والعروض الترويجية لعملائها بشكل أكثر دقة.

  • التصنيع: تُنتج كبرى شركات التصنيع كميات هائلة من البيانات. يمكن أن تستخدم المؤسسات مستودعات البيانات لإنشاء متاجر بيانات مصممة خصوصًا لتلبية احتياجات كل قسم، ما يسهل على المستخدمين الوصول إلى البيانات ذات الصلة بأدوارهم.
مزايا مستودع البيانات

يضم مستودع البيانات تدفقات البيانات من مخازن البيانات المختلفة، وهو ما يسهل على المؤسسات تحليل هذه البيانات. ونتيجة لذلك، يمكن أن تكتشف المؤسسات معارف قيّمة، وتُعزز الأداء، وتُحسن العمليات، وفي النهاية تكتسب ميزة تنافسية.

وبشكل أكثر تحديدًا، يمكن أن تتضمن مزايا مستودع البيانات ما يلي:

  • تحسين جودة البيانات
  • معارف أعمق
  • اتخاذ قرارات عمل أفضل
تحسين جودة البيانات

يمكن أن يجمع مستودع البيانات البيانات من مصادر البيانات المختلفة، مثل أنظمة المعاملات وقواعد البيانات التشغيلية والملفات المنفصلة. ثم يُنظم البيانات التشغيلية هذه، ويُزيل التكرارات ويُوحدها بهدف إنشاء مصدر واحد للحقيقة يمنح المؤسسة رؤية شاملة وموثوقة حول بيانات المؤسسة.

معارف أعمق

عندما تكون البيانات حبيسة في مصادر مختلفة، فقد يحد ذلك من قدرة صانعي القرار على استخلاص المعارف ووضع إستراتيجيات العمل بثقة. يُمكّن مستودع البيانات الذي يحتوي على مستودع مركزي واحد مستخدمي الأعمال من استحضار جميع بيانات المؤسسة ذات الصلة في عملية اتخاذ قرارات العمل.

من خلال إعداد تقارير حول البيانات القديمة، يمكن أن يساعد مستودع البيانات على تحديد الأنظمة والعمليات التي تعمل بشكل جيد وما يحتاج منها إلى تحسين.

اتخاذ قرارات عمل أفضل

تتيح مستودعات البيانات إمكانية اكتشاف الموضوعات والاتجاهات والتجميعات وإعداد تقارير عنها. يمكن أن يستعين العاملون في مجال البيانات وقادة الأعمال بهذه المعارف من أجل اتخاذ قرارات أكثر استنارة استنادًا إلى أدلة دامغة في كل مجال من مجالات المؤسسة تقريبًا، بدءًا من عمليات الأعمال وحتى الإدارة المالية وإدارة المخزون.

تحديات بنية مستودع البيانات

عند تنفيذ حلول مستودع البيانات، قد تحتاج المؤسسات إلى مواجهة تحديات معينة لتحقيق أداء أفضل. يمكن أن يشمل ذلك:

  • كميات البيانات الهائلة
  • جودة البيانات وإدارتها
  • البنية التحتية السحابية المعقدة
  • مواكبة تطورات الذكاء الاصطناعي
  • نقص مرونة التخزين
كميات البيانات الهائلة

مع شيوع مستودعات البيانات التي تسع بيانات بأحجام تصل إلى تيرابايت وبيتا بايت في الوقت الحالي، تتطلب العمليات فائقة الأداء تحميلاً ممتازًا وتخزينًا فعالاً ومحركات قواعد بيانات فائقة الإمكانات تلبي متطلبات الكفاءة الفائقة.

جودة البيانات وإدارتها

قد يُطلب من مستودع البيانات إدارة كميات هائلة من البيانات المنظمة وغير المنظمة الواردة من العديد من المصادر. وعندئذٍ، ينبغي تنظيم كل هذه البيانات والتحقق من صحتها قبل استخدامها. يمكن أن تساعد سياسات حوكمة البيانات الصارمة وممارساتها على ضمان توفير مصدر واحد ودقيق للحقيقة لجميع المستخدمين.

البنية التحتية السحابية المعقدة

في ظل تخزين بيانات المؤسسة في بيئات متباينة - سواء كان ذلك اتباعًا للوائح التنظيمية أو تلبيةً لاحتياجات العمل - غالبًا ما تتطلب مستودعات البيانات في الوقت الحالي وحدة تخزين هجينة ومتعددة السحابة، مع تدفق البيانات وجمعها وتحليلها عبر أنظمة مختلفة. قد تحتاج المؤسسات إلى فريق تقنية معلومات يتمتع بكفاءة فائقة للمساعدة على تنفيذ هذه الأنظمة المتطورة وصيانتها.

 

مواكبة تطورات الذكاء الاصطناعي

ونظرًا إلى أن الذكاء الاصطناعي والتعلم الآلي أصبحا عنصرين أكثر أهمية في إستراتيجية الأعمال، تحتاج المؤسسات إلى مستودعات بيانات يمكنها دعم أحمال التشغيل هذه.

ومن الأفضل أن يتوفر في مستودع البيانات إمكانات لجمع البيانات وتنسيقها وتنظيمها وتحليلها بحيث تكون جاهزة للذكاء الاصطناعي، بالإضافة إلى تسهيل عملية تدفق البيانات إلى تطبيقات الذكاء الاصطناعي والتعلم الآلي. ومع ذلك، ليست جميع مستودعات البيانات مصممة للذكاء الاصطناعي، ما قد يجعل من الصعب استخدام البيانات المؤسسية في أحمال تشغيل الذكاء الاصطناعي.

نقص مرونة التخزين

تُنشأ مستودعات البيانات وتُحسن من أجل تحليلات البيانات، ما يعني أنها ليست مثالية عادةً لتخزين كميات هائلة من البيانات. كلما ازدادت كمية البيانات في المستودع، تزداد تكلفة التخزين وصعوبته معها. ويمكن أن تنشأ مشكلات زمن الانتقال أيضًا.

يمكن أن يكون مستودع بحيرة البيانات خيارًا لبعض المؤسسات، اعتمادًا على بنية بياناتها الفريدة، لأنها يمكن أن توفر قدرات تخزين أرخص وأكثر مرونة والتحليلات.

حلول ذات صلة
حلول مستودعات البيانات

يمكن أن يكون مستودع بحيرة البيانات خيارًا مناسبًا لبعض المؤسسات، اعتمادًا على منظومة بياناتها الفريدة، لأنه يمكن أن يوفر إمكانات تخزين وتحليل أرخص وأكثر مرونة.

استكشف حلول مستودع البيانات
IBM® Db2® Warehouse

تُصمم مستودعات البيانات القائمة على السحابة من أجل إجراء التحليلات التشغيلية واكتساب المعارف المدعومة بذكاء الأعمال والذكاء الاصطناعي.

استكشف Db2 Warehouse
IBM watsonx.data

استفد من بياناتك أينما كانت مع مستودع بحيرة البيانات الهجين والمفتوح للذكاء الاصطناعي والتحليلات.

استكشف watsonx.data
الموارد كيفية اختيار مستودع البيانات المناسب للذكاء الاصطناعي

تعرّف على المعايير التي ينبغي أن تراعيها المؤسسات عند اختيار مستودع بيانات المؤسسة.

ما المقصود بمستودع البيانات؟

تسعى مستودعات البيانات إلى حل التحديات الأساسية في كل من مستودعات البيانات وبحيرات البيانات لإنتاج حل أكثر مثالية لإدارة بيانات المؤسسات.

مفاضلة البيانات

دليل قائد البيانات لإنشاء مؤسسة قائمة على البيانات وتعزيز ميزة الأعمال.

اتخِذ الخطوة التالية

يمكنك توسيع نطاق أحمال تشغيل الذكاء الاصطناعي ليشمل جميع بياناتك، في أي مكان، مع IBM watsonx.data، وهو مخزن بيانات مناسب حسب الغرض مبني على أساس مستودع بيانات مفتوح.

استكشف watsonx.data احجز عرضًا توضيحيًا مباشرًا