بحيرة البيانات ومستودع البيانات ومتجر البيانات على السحابة

تتناول هذه المقالة ثلاثة أنواع مميزة من مستودعات التخزين السحابي المتوفرة اليوم، مع استكشاف الفروق بينها وتحديد أي الحلول الأنسب لحالتك.

أصبح التخزين السحابي لبيانات الأعمال -وخاصةً البيانات الضخمة- على رأس الأولويات اليوم، سواء أكنت تعتمد عليه لإدارة الأعمال اليومية أم لإنجاز مهام محددة.

تُدير البيانات العديد من وظائف الأعمال، بدءًا من إنشاء برامج مستهدفة للعملاء والمحتملين، ووصولًا إلى تحسين عمليات التصنيع والتشغيل، وتطوير فحوصات الفيروسات والتطعيمات واختبارها وتوزيعها وتتبُّعها. تعتمد الشركات الحديثة على توفُّر البيانات التي تحتاجها، عندما تحتاج إليها. ومع ذلك، فإن العثور على الخيار الأنسب لاحتياجاتك ليس مهمة سهلة، وقد يتطلب استخدام عدة أنواع مختلفة من المستودعات لفئات البيانات المختلفة.

لنبدأ بالأساسيات ونتعمق في بعض الأمثلة حول كيف يمكن أن يكون مستودع بيانات واحد أو عدة أنواع من مستودعات البيانات ضروريًا لتلبية احتياجات عملك.

 

ثلاثة أنواع من مستودعات التخزين السحابي

هناك اليوم ثلاثة أنواع مميزة من مستودعات التخزين السحابي، كلٌّ منها يخدم غرضًا مختلفًا لتلبية حاجة محددة.

بحيرة البيانات

بحيرة البيانات هي مستودع كبير للبيانات غير المُنسَّقة، سواء كانت بيانات غير منظمة أو شبه منظمة. وتُجمَّع هذه البيانات من مصادر متعددة ثم تُخزَّن كما هي. ولا تُعدَّل لتناسب غرضًا محددًا أو لتتوافق مع تنسيق بعينه. ويتطلب إعداد هذه البيانات للتحليل عمليات تستغرق وقتًا طويلًا، تشمل تحضير البيانات وتنقيتها وإعادة تنسيقها لتحقيق الاتساق. تُعد بحيرات البيانات موارد مهمة للبلديات أو المؤسسات الأخرى التي تخزّن معلومات تتعلق بانقطاع الخدمات أو حركة المرور أو الجرائم أو الخصائص السكانية. ويمكن استخدام هذه البيانات لاحقًا لتحديث ميزانيات وموارد إدارة الأشغال العامة (DPW) أو خدمات الطوارئ.

مستودع البيانات

مستودع البيانات هو تجميع للبيانات من مصادر متعددة داخل مستودع مركزي واحد يوحّد خصائص البيانات وتنسيقاتها، مما يجعلها مفيدة لعلماء البيانات في التنقيب عن البيانات، والذكاء الاصطناعي (AI)، والتعلم الآلي، وفي النهاية تحليلات الأعمال وذكاء الأعمال.يمكن أن تستخدم مدينة كبيرة مستودعات البيانات لتجميع المعاملات الإلكترونية من إدارات مختلفة، بما في ذلك مخالفات السرعة، وتراخيص الكلاب، ومدفوعات الضرائب غير المباشرة، وغيرها من المعاملات. وتحلل المدينة هذه البيانات المنظمة لإصدار فواتير المتابعة وتحديث بيانات التعداد وسجلات الشرطة. كما يمكن أن يستخدمها أحد المطورين لتجميع تيرابايتات من البيانات التي تولدها أجهزة الاستشعار في السيارات، للمساعدة في عملية صناعة القرار الخاصة بحل للقيادة الذاتية.


متجر البيانات

متجر البيانات هو جزء فرعي من مستودع البيانات يخدم مجموعة محددة من المستخدمين داخل الشركة أو وحدة الأعمال. يمكن لقسم التسويق في شركة تصنيع استخدام متجر البيانات لتحديد الفئة السكانية أو الشخصية المثالية، بما يدعم تطوير خطط التسويق. يمكن أيضًا لقسم التصنيع استخدامه لتحليل الأداء ومعدلات الأخطاء، بما يُتيح تحقيق التحسين المستمر. غالبًا ما يتم استخدام مجموعات البيانات داخل متجر البيانات في الوقت الفعلي، لإجراء التحليلات الحالية والحصول على نتائج قابلة للتنفيذ.

بحيرة البيانات ومستودع البيانات ومتجر البيانات: الاختلافات الرئيسية

على الرغم من أن الأنواع الثلاثة من مستودعات البيانات السحابية تحتفظ بالبيانات، فإن هناك اختلافات واضحة جدًا بينها. على سبيل المثال، كلٌّ من مستودع البيانات وبحيرة البيانات عبارة عن تجميعات كبيرة من البيانات، إلا إن بحيرة البيانات عادةً ما تكون أكثر فاعلية من حيث التكلفة في التنفيذ والصيانة لأنها في الغالب غير منظمة.

تطوَّرت بنية بحيرة البيانات على مدار السنوات القليلة الماضية لدعم أحجام أكبر من البيانات والحوسبة السحابية. يتم تلقي كميات كبيرة من البيانات من عدد من مصادر البيانات إلى موقع مركزي. 

يمكن تنظيم مستودع البيانات بإحدى الطرق الثلاث التالية:

  1. كخدمة مُدارة يقدِّمها مزوِّد السحابة.
  2. كحل برمجي يوفر التحكم الداخلي وبروتوكولات أمان صارمة، وهو ما يمكن أن يكون مفيدًا عند التعامل مع متطلبات الامتثال التنظيمي.
  3. كجهاز، وعادةً ما يكون حلًا مدمجًا يجمع بين البرمجيات والأجهزة.

يمكن استخدام البيانات المخزنة في مستودع البيانات لأغراض متعددة بسهولة أكبر مقارنةً بالبيانات الموجودة في بحيرة البيانات. السبب في ذلك هو أن مستودع البيانات منظَّم ويمكن التنقيب فيه أو تحليله بسهولة أكبر.

من ناحية أخرى، يحتوي متجر البيانات على كمية أقل من البيانات مقارنةً بكلٍّ من بحيرة البيانات ومستودع البيانات، كما يتم تصنيف البيانات لاستخدام محدد أو حسب فئة ديموغرافية أو وحدة أعمال معينة. يمكن أن يوجد متجر البيانات بعدة صيغ مختلفة (نجمة أو ندفة ثلج أو قبو) تُحددها البنية المنطقية للبيانات، حيث يُعَد هيكل القبو أكثر مرونة وقابلية للتوسع مقارنةً بالتنسيقات الأخرى.

هناك ثلاثة أنواع من متاجر البيانات:

  1. متجر بيانات تابع، يتكوَّن من أقسام من مستودع البيانات المؤسسي. وهي مجموعة فرعية من البيانات الأساسية في المستودع.
  2. متجر بيانات مستقل، وهو نظام قائم بذاته ومعزول لقسم محدد من الأعمال.
  3. متجر بيانات هجين، يتكوَّن من بيانات مأخوذة من مستودع البيانات ومن مصادر مستقلة. يوفر هذا النوع عادةً وصولًا أسرع إلى البيانات وواجهة سهلة الاستخدام.

يعتمد نوع مستودع البيانات الذي تختاره وهيكله بشكل كبير على احتياجات ومتطلبات عملك. إذا كان ذلك مناسبًا لعملك، استفد من ميزة التخزين المستند إلى السحابة الهجينة لتحقيق المرونة، وقابلية التوسع، ونهج أوسع وأكثر اطلاعًا لحل المشكلات واتخاذ القرارات.

أكاديمية الذكاء الاصطناعي

هل تعد إدارة البيانات هي سر الذكاء الاصطناعي التوليدي؟

استكشف سبب أهمية البيانات عالية الجودة للاستخدام الناجح للذكاء الاصطناعي التوليدي.

حالات استخدام الصناعة لحلول مستودعات البيانات السحابية

التصنيع

تنتج شركة تصنيع متعددة الجنسيات كميات كبيرة من البيانات لاستخدامات متعددة. بعض البيانات مهمة، بينما قد تكون البيانات الأخرى ذات غرض محتمل أو عديمة الفائدة في المستقبل. تستخدم الشركة مستودع بيانات سحابي لتخزين البيانات الكبيرة، وهو أقل تكلفة مقارنةً بخيارات التخزين الأخرى. ومع ذلك، تمتلك الشركة أيضًا متاجر بيانات تابعة لمجالات محددة من الأعمال، تقدِّم قيمة لمستخدمي الأعمال في أقسام مثل المالية والتصنيع والتسويق. يحتوي كلٌّ من هذه المتاجر على بيانات مخصصة لاستخدام معين، ومنسّقة لتسهيل تحليلها. على سبيل المثال:

  • يستخدم قسم المالية متجر البيانات الخاص به لإعداد كشوف حسابات العملاء والحفاظ على الميزانيات العمومية.
  • يستخدم قسم التصنيع متجر البيانات الخاص به لتحليل كفاءة خطوط الإنتاج، ومعالجة البيانات لإدخالها في حلول الذكاء الاصطناعي، وصيانة قواعد بيانات المشتريات.
  • يستخدم قسم التسويق متجر البيانات الخاص به لتقييم فاعلية الحملات والتواصل، مع تحليل وتجميع نتائج الاستطلاعات.

بلدية كبيرة

تحتاج البلدية الكبيرة إلى حل ميسور التكلفة يوفر البيانات بطريقة اقتصادية وقابلة للاستخدام إلى حد ما. تستخدم البلدية بحيرة بيانات سحابية للحفاظ على بيانات حركة المرور. لا تستطيع حاليًا تحليل هذه البيانات واتخاذ إجراءات بناءً عليها، لكنها ستكون جاهزة للقيام بذلك عند توافر التمويل. كما تستخدم البلدية مستودع بيانات برمجي محلي لتتبُّع حالة فواتير الضرائب. بالإضافة إلى ذلك، تستخدم البلدية متجر بيانات هجين لتتبُّع انتشار الفيروس بين السكان، حيث يتم تجميع البيانات من مختلف المستشفيات والخدمات الصحية البلدية في مستودع واحد لتحليلها واستخدامها من قِبَل وزارة الصحة.

المفاهيم الخاطئة الشائعة حول تخزين البيانات السحابي

هناك العديد من المفاهيم الخاطئة المتعلقة بمستودعات البيانات السحابية. وتتضمن بعض المفاهيم الخاطئة الأكثر شيوعًا ما يلي:

  • مقاس واحد يناسب الجميع: هذا لا ينطبق مطلقًا عند النظر في حلول تخزين البيانات السحابية. فكل عمل لديه قيود ميزانية مختلفة، وأهداف متباينة، وتوزيع موارد متنوع، وتفضيلات خاصة. من المهم تقييم احتياجات عملك وميزانيتك والاستعانة بهذه العوامل لتحديد الحل الذي سيساعدك على تحقيق أهدافك.
  • جُزر البيانات تترك بياناتك معزولة في المستودع: هذا غير صحيح. الطبيعة الأساسية للتخزين السحابي هي أنه يُتيح الوصول إلى البيانات من أي مكان، مع وجود الأذونات المناسبة.
  • الحلول السحابية أقل أمانًا: في الواقع، يمكن لمزوِّدي الخدمات السحابية تقديم أمان أقوى، مع توفير التحديثات الدورية وأحدث البروتوكولات المتاحة. غالبًا ما يكون لديهم فِرق من خبراء الأمن الحاصلين على أحدث الشهادات، مخصصة لضمان حماية بياناتك بأقصى مستوى من الأمان. لدى العديد من مزوِّدي الخدمات ِفرق تعمل مع الجهات التنظيمية لضمان تحسين حلولهم. ومع ذلك، في بعض الصناعات مثل الرعاية الصحية والمالية، قد يتطلب الامتثال للّوائح القدرة على الوصول إلى البيانات دون اتصال بالإنترنت، ما يستلزم وجود معدات محلية.
  • مستودعات البيانات السحابية مكلفة: في الواقع، يمكن أن يكون التخزين السحابي أقل تكلفة من الحلول المحلية، لأنه لا يتطلب استثمارات كبيرة في البنية التحتية مقدمًا، ولا تكاليف التبريد أو مساحة الأرض، ولا تكاليف الصيانة المستمرة أو فِرقًا من الخبراء الداخليين. تختلف التكاليف الشهرية حسب المورِّد أو مزوِّد الخدمة السحابية.

 

كيفية تحديد أفضل حل تخزين سحابي يناسب عملك

عملك فريد من نوعه، وله موارد وأهداف وتحديات خاصة به. قيّم خياراتك بعناية لتحديد الحل الذي يخدم احتياجاتك بشكل أفضل. ضَع في اعتبارك ما يلي:

  • أهدافك التجارية والتقنية.
  • ميزانيتك
  • حجم البيانات التي تحتاج إلى تخزين.
  • عدد المرات التي ستحتاج فيها إلى الوصول إلى البيانات.
  • سواء أكانت لديك احتياجات محددة اليوم أم على المدى القصير.

ستساعدك هذه الاعتبارات على تحديد الحل أو مجموعة الحلول التي ستساعدك على الوصول إلى أهدافك.

مستودعات بيانات IBM في السحابة: الحلول والإدارة

تقدِّم IBM العديد من الحلول للمساعدة على تلبية احتياجات التخزين السحاب وعلم البيانات.

  • IBM Db2 Warehouse on Cloud هو مستودع البيانات السحابي المرن الذي يوفر التوسع المستقل للتخزين والحوسبة. يمكن لأسواق البيانات الصغيرة استخدام ميزة Flex One، وهي مستودع بيانات مرن مصمم للتحليلات عالية الأداء. يمكن نشر هذا النظام على العديد من مزوِّدي السحابة، بدءًا من 40 جيجابايت من التخزين.
  • من الخيارات الأخرى التي تستحق النظر: IBM® InfoSphere Master Data Management، برنامج إدارة البيانات الرئيسية. يدير هذا النظام القابل للتخصيص جميع جوانب بيانات مؤسستك الحيوية، ويوفر للمستخدمين إمكانية الوصول إليها من خلال عرض موثوق به واحد. من خلال لوحة المعلومات المبسطة هذه، يمكن للمستخدمين إجراء تحليلات مفصلة، واستخلاص رؤى قابلة للتنفيذ، وضمان الامتثال الكامل لحوكمة البيانات والسياسات عبر المؤسسة بأكملها.
  • Netezza Performance Server، التطور التالي لجهاز IBM® Netezza، يعتمد على البنية فائقة الدمج لنظام IBM® Cloud Pak for Data لتوفير نظام دعم قرارات سحابي أصلي لأعقد التحليلات في مؤسستك. كما أنه متاح الآن على AWS وAzure.
  • IBM® Watson Studio، حل للتعلم الآلي وعلوم البيانات، يمكِّن المؤسسات من الاستفادة من أصول البيانات ودمج التنبؤات في عمليات الأعمال والتطبيقات الحديثة.
    حلول ذات صلة
    IBM watsonx.data

    استفِد من بياناتك أينما كانت باستخدام مستودع بحيرة البيانات الهجين المفتوح للذكاء الاصطناعي والتحليلات.

    اكتشف watsonx.data
    حلول بحيرة البيانات

    تغلب على تحديات البيانات الحالية باستخدام بنية مستودع بحيرة بيانات؛ لتتمكن من الاتصال بالبيانات في دقائق، والحصول بسرعة على رؤى موثوقة وتقليل تكاليف مستودع البيانات لديك.

    استكشف حلول بحيرة البيانات من IBM
    خدمات الاستشارات في مجال البيانات والتحليلات

    استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

    اكتشف خدمات التحليلات
    اتخذ الخطوة التالية

    وحّد كل بياناتك للذكاء الاصطناعي والتحليلات باستخدام IBM watsonx.data. استفِد من بياناتك أينما كانت باستخدام بحيرة البيانات الهجينة المفتوحة للذكاء الاصطناعي والتحليلات.

    1. اكتشف watsonx.data
    2. استكشف البيانات لحلول الذكاء الاصطناعي