بحيرة البيانات ومستودع البيانات ومتجر البيانات على السحابة

مسارات ضوئية متدفقة مجردة

تتناول هذه المقالة ثلاثة أنواع مميزة من مستودعات التخزين السحابي المتوفرة اليوم، مع استكشاف الفروق بينها وتحديد أي الحلول الأنسب لحالتك.

أصبح التخزين السحابي لبيانات الأعمال -وخاصةً البيانات الكبيرة- على رأس الأولويات اليوم، سواء أكنت تعتمد عليه لإدارة الأعمال اليومية أم لإنجاز مهام محددة.

تُدير البيانات العديد من وظائف الأعمال، بدءًا من إنشاء برامج مستهدفة للعملاء والمحتملين، ووصولًا إلى تحسين عمليات التصنيع والتشغيل، وتطوير فحوصات الفيروسات والتطعيمات واختبارها وتوزيعها وتتبُّعها. تعتمد الشركات الحديثة على توفُّر البيانات التي تحتاجها، عندما تحتاج إليها. ومع ذلك، فإن العثور على الخيار الأنسب لاحتياجاتك ليس مهمة سهلة، وقد يتطلب استخدام عدة أنواع مختلفة من المستودعات لفئات البيانات المختلفة.

لنبدأ بالأساسيات ونتعمق في بعض الأمثلة حول كيف يمكن أن يكون مستودع بيانات واحد أو عدة أنواع من مستودعات البيانات ضروريًا لتلبية احتياجات عملك.

 

ثلاثة أنواع من مستودعات التخزين السحابي

هناك اليوم ثلاثة أنواع مميزة من مستودعات التخزين السحابي، كلٌّ منها يخدم غرضًا مختلفًا لتلبية حاجة محددة.

بحيرة البيانات

بحيرة البيانات هي مستودع كبير للبيانات غير المنسقة، سواء أكانت غير منظمة أم شبه منظمة. يتم جمع هذه البيانات من مصادر مختلفة وتخزينها بشكل مباشر. لا يتم تعديلها لتلبية غرض معين أو لتتناسب مع صيغة محددة. يتطلب تحضير هذه البيانات للتحليل عمليات طويلة ومستهلكة للوقت من حيث تجهيزها وتنقيتها وإعادة تنسيقها لتصبح متجانسة.تُعَد بحيرات البيانات مصدرًا ممتازًا للبلديات أو المؤسسات الأخرى التي تخزِّن معلومات متعلقة بالانقطاعات، أو حركة المرور، أو الجريمة، أو البيانات الديموغرافية. يمكن استخدام هذه البيانات لاحقًا لتحديث ميزانيات وموارد إدارة الأشغال العامة أو خدمات الطوارئ.

مستودع البيانات

مستودع البيانات هو تجميع للبيانات من مصادر متعددة في مستودع مركزي واحد يوحِّد خصائص البيانات وتنسيقها، ما يجعله مفيدًا لعلماء البيانات في استخدامه في استخراج البيانات، والذكاء الاصطناعي، والتعلم الآلي، وفي النهاية تحليلات الأعمال وذكاء الأعمال. يمكن لمدينة كبيرة استخدام مستودعات البيانات لتجميع المعاملات الإلكترونية من مختلف الأقسام، بما في ذلك مخالفات السرعة، ورخص الكلاب، ومدفوعات ضرائب الاستهلاك، والمعاملات الأخرى. يمكن أن تحلل المدينة هذه البيانات المنظمة لإصدار فواتير متابعة وتحديث بيانات التعداد وسجلات الشرطة. يمكن أيضًا للمطورين استخدامها لتجميع تيرابايتات من البيانات الناتجة عن مستشعرات السيارات للمساعدة على عملية اتخاذ القرار لحل قيادة ذاتية.

متجر البيانات

متجر البيانات هو جزء فرعي من مستودع البيانات يخدم مجموعة محددة من المستخدمين داخل الشركة أو وحدة الأعمال. يمكن لقسم التسويق في شركة تصنيع استخدام متجر البيانات لتحديد الفئة السكانية أو الشخصية المثالية، بما يدعم تطوير خطط التسويق. يمكن أيضًا لقسم التصنيع استخدامه لتحليل الأداء ومعدلات الأخطاء، بما يُتيح تحقيق التحسين المستمر. غالبًا ما يتم استخدام مجموعات البيانات داخل متجر البيانات في الوقت الفعلي، لإجراء التحليلات الحالية والحصول على نتائج قابلة للتنفيذ.

بحيرة البيانات ومستودع البيانات ومتجر البيانات: الاختلافات الرئيسية

على الرغم من أن الأنواع الثلاثة من مستودعات البيانات السحابية تحتفظ بالبيانات، فإن هناك اختلافات واضحة جدًا بينها. على سبيل المثال، كلٌّ من مستودع البيانات وبحيرة البيانات عبارة عن تجميعات كبيرة من البيانات، إلا إن بحيرة البيانات عادةً ما تكون أكثر فاعلية من حيث التكلفة في التنفيذ والصيانة لأنها في الغالب غير منظمة.

تطوَّرت بنية بحيرة البيانات على مدار السنوات القليلة الماضية لدعم أحجام أكبر من البيانات والحوسبة السحابية. يتم تلقي كميات كبيرة من البيانات من عدد من مصادر البيانات إلى موقع مركزي. 

يمكن تنظيم مستودع البيانات بإحدى الطرق الثلاث التالية:

  1. كخدمة مُدارة يقدِّمها مزوِّد السحابة.
  2. كحل برمجي يوفر التحكم الداخلي وبروتوكولات أمان صارمة، وهو ما يمكن أن يكون مفيدًا عند التعامل مع متطلبات الامتثال التنظيمي.
  3. كجهاز، وعادةً ما يكون حلًا مدمجًا يجمع بين البرمجيات والأجهزة.

يمكن استخدام البيانات المخزنة في مستودع البيانات لأغراض متعددة بسهولة أكبر مقارنةً بالبيانات الموجودة في بحيرة البيانات. السبب في ذلك هو أن مستودع البيانات منظَّم ويمكن التنقيب فيه أو تحليله بسهولة أكبر.

من ناحية أخرى، يحتوي متجر البيانات على كمية أقل من البيانات مقارنةً بكلٍّ من بحيرة البيانات ومستودع البيانات، كما يتم تصنيف البيانات لاستخدام محدد أو حسب فئة ديموغرافية أو وحدة أعمال معينة. يمكن أن يوجد متجر البيانات بعدة صيغ مختلفة (نجمة أو ندفة ثلج أو قبو) تُحددها البنية المنطقية للبيانات، حيث يُعَد هيكل القبو أكثر مرونة وقابلية للتوسع مقارنةً بالتنسيقات الأخرى.

هناك ثلاثة أنواع من متاجر البيانات:

  1. متجر بيانات تابع، يتكوَّن من أقسام من مستودع البيانات المؤسسي. وهي مجموعة فرعية من البيانات الأساسية في المستودع.
  2. متجر بيانات مستقل، وهو نظام قائم بذاته ومعزول لقسم محدد من الأعمال.
  3. متجر بيانات هجين، يتكوَّن من بيانات مأخوذة من مستودع البيانات ومن مصادر مستقلة. يوفر هذا النوع عادةً وصولًا أسرع إلى البيانات وواجهة سهلة الاستخدام.

يعتمد نوع مستودع البيانات الذي تختاره وهيكله بشكل كبير على احتياجات ومتطلبات عملك. إذا كان ذلك مناسبًا لعملك، استفد من ميزة التخزين المستند إلى السحابة الهجينة لتحقيق المرونة، وقابلية التوسع، ونهج أوسع وأكثر اطلاعًا لحل المشكلات واتخاذ القرارات.

حالات استخدام الصناعة لحلول مستودعات البيانات السحابية

التصنيع

تنتج شركة تصنيع متعددة الجنسيات كميات كبيرة من البيانات لاستخدامات متعددة. بعض البيانات مهمة، بينما قد تكون البيانات الأخرى ذات غرض محتمل أو عديمة الفائدة في المستقبل. تستخدم الشركة مستودع بيانات سحابي لتخزين البيانات الكبيرة، وهو أقل تكلفة مقارنةً بخيارات التخزين الأخرى. ومع ذلك، تمتلك الشركة أيضًا متاجر بيانات تابعة لمجالات محددة من الأعمال، تقدِّم قيمة لمستخدمي الأعمال في أقسام مثل المالية والتصنيع والتسويق. يحتوي كلٌّ من هذه المتاجر على بيانات مخصصة لاستخدام معين، ومنسّقة لتسهيل تحليلها. على سبيل المثال:

  • يستخدم قسم المالية متجر البيانات الخاص به لإعداد كشوف حسابات العملاء والحفاظ على الميزانيات العمومية.
  • يستخدم قسم التصنيع متجر البيانات الخاص به لتحليل كفاءة خطوط الإنتاج، ومعالجة البيانات لإدخالها في حلول الذكاء الاصطناعي، وصيانة قواعد بيانات المشتريات.
  • يستخدم قسم التسويق متجر البيانات الخاص به لتقييم فاعلية الحملات والتواصل، مع تحليل وتجميع نتائج الاستطلاعات.

بلدية كبيرة

تحتاج البلدية الكبيرة إلى حل ميسور التكلفة يوفر البيانات بطريقة اقتصادية وقابلة للاستخدام إلى حد ما. تستخدم البلدية بحيرة بيانات سحابية للحفاظ على بيانات حركة المرور. لا تستطيع حاليًا تحليل هذه البيانات واتخاذ إجراءات بناءً عليها، لكنها ستكون جاهزة للقيام بذلك عند توافر التمويل. كما تستخدم البلدية مستودع بيانات برمجي محلي لتتبُّع حالة فواتير الضرائب. بالإضافة إلى ذلك، تستخدم البلدية متجر بيانات هجين لتتبُّع انتشار الفيروس بين السكان، حيث يتم تجميع البيانات من مختلف المستشفيات والخدمات الصحية البلدية في مستودع واحد لتحليلها واستخدامها من قِبَل وزارة الصحة.

المفاهيم الخاطئة الشائعة حول تخزين البيانات السحابي

هناك العديد من المفاهيم الخاطئة المتعلقة بمستودعات البيانات السحابية. وتتضمن بعض المفاهيم الخاطئة الأكثر شيوعًا ما يلي:

  • مقاس واحد يناسب الجميع: هذا لا ينطبق مطلقًا عند النظر في حلول تخزين البيانات السحابية. فكل عمل لديه قيود ميزانية مختلفة، وأهداف متباينة، وتوزيع موارد متنوع، وتفضيلات خاصة. من المهم تقييم احتياجات عملك وميزانيتك والاستعانة بهذه العوامل لتحديد الحل الذي سيساعدك على تحقيق أهدافك.
  • جُزر البيانات تترك بياناتك معزولة في المستودع: هذا غير صحيح. الطبيعة الأساسية للتخزين السحابي هي أنه يُتيح الوصول إلى البيانات من أي مكان، مع وجود الأذونات المناسبة.
  • الحلول السحابية أقل أمانًا: في الواقع، يمكن لمزوِّدي الخدمات السحابية تقديم أمان أقوى، مع توفير التحديثات الدورية وأحدث البروتوكولات المتاحة. غالبًا ما يكون لديهم فِرق من خبراء الأمن الحاصلين على أحدث الشهادات، مخصصة لضمان حماية بياناتك بأقصى مستوى من الأمان. لدى العديد من مزوِّدي الخدمات ِفرق تعمل مع الجهات التنظيمية لضمان تحسين حلولهم. ومع ذلك، في بعض الصناعات مثل الرعاية الصحية والمالية، قد يتطلب الامتثال للّوائح القدرة على الوصول إلى البيانات دون اتصال بالإنترنت، ما يستلزم وجود معدات محلية.
  • مستودعات البيانات السحابية مكلفة: في الواقع، يمكن أن يكون التخزين السحابي أقل تكلفة من الحلول المحلية، لأنه لا يتطلب استثمارات كبيرة في البنية التحتية مقدمًا، ولا تكاليف التبريد أو مساحة الأرض، ولا تكاليف الصيانة المستمرة أو فِرقًا من الخبراء الداخليين. تختلف التكاليف الشهرية حسب المورِّد أو مزوِّد الخدمة السحابية.

 

كيفية تحديد أفضل حل تخزين سحابي يناسب عملك

عملك فريد من نوعه، وله موارد وأهداف وتحديات خاصة به. قيّم خياراتك بعناية لتحديد الحل الذي يخدم احتياجاتك بشكل أفضل. ضَع في اعتبارك ما يلي:

  • أهدافك التجارية والتقنية.
  • ميزانيتك
  • حجم البيانات التي تحتاج إلى تخزين.
  • عدد المرات التي ستحتاج فيها إلى الوصول إلى البيانات.
  • سواء أكانت لديك احتياجات محددة اليوم أم على المدى القصير.

ستساعدك هذه الاعتبارات على تحديد الحل أو مجموعة الحلول التي ستساعدك على الوصول إلى أهدافك.

مستودعات بيانات IBM في السحابة: الحلول والإدارة

تقدِّم IBM العديد من الحلول للمساعدة على تلبية احتياجات التخزين السحاب وعلم البيانات.

  • IBM Db2 Warehouse on Cloud هو مستودع البيانات السحابي المرن الذي يوفر التوسع المستقل للتخزين والحوسبة. يمكن لأسواق البيانات الصغيرة استخدام ميزة Flex One، وهي مستودع بيانات مرن مصمم للتحليلات عالية الأداء. يمكن نشر هذا النظام على العديد من مزوِّدي السحابة، بدءًا من 40 جيجابايت من التخزين.
  • من الخيارات الأخرى التي تستحق النظر: IBM® InfoSphere Master Data Management، برنامج إدارة البيانات الرئيسية. يدير هذا النظام القابل للتخصيص جميع جوانب بيانات مؤسستك الحيوية، ويوفر للمستخدمين إمكانية الوصول إليها من خلال عرض موثوق به واحد. من خلال لوحة المعلومات المبسطة هذه، يمكن للمستخدمين إجراء تحليلات مفصلة، واستخلاص رؤى قابلة للتنفيذ، وضمان الامتثال الكامل لحوكمة البيانات والسياسات عبر المؤسسة بأكملها.
  • Netezza Performance Server، التطور التالي لجهاز IBM® Netezza، يعتمد على البنية فائقة الدمج لنظام IBM® Cloud Pak for Data لتوفير نظام دعم قرارات سحابي أصلي لأعقد التحليلات في مؤسستك. كما أنه متاح الآن على AWS وAzure.
  • IBM® Watson Studio، حل للتعلم الآلي وعلوم البيانات، يمكِّن المؤسسات من الاستفادة من أصول البيانات ودمج التنبؤات في عمليات الأعمال والتطبيقات الحديثة.

    مؤلف

    Tanmay Sinha

    Program Director, Db2 Portfolio