أصبح التخزين السحابي لبيانات الأعمال -وخاصةً البيانات الكبيرة- على رأس الأولويات اليوم، سواء أكنت تعتمد عليه لإدارة الأعمال اليومية أم لإنجاز مهام محددة.
تُدير البيانات العديد من وظائف الأعمال، بدءًا من إنشاء برامج مستهدفة للعملاء والمحتملين، ووصولًا إلى تحسين عمليات التصنيع والتشغيل، وتطوير فحوصات الفيروسات والتطعيمات واختبارها وتوزيعها وتتبُّعها. تعتمد الشركات الحديثة على توفُّر البيانات التي تحتاجها، عندما تحتاج إليها. ومع ذلك، فإن العثور على الخيار الأنسب لاحتياجاتك ليس مهمة سهلة، وقد يتطلب استخدام عدة أنواع مختلفة من المستودعات لفئات البيانات المختلفة.
لنبدأ بالأساسيات ونتعمق في بعض الأمثلة حول كيف يمكن أن يكون مستودع بيانات واحد أو عدة أنواع من مستودعات البيانات ضروريًا لتلبية احتياجات عملك.
هناك اليوم ثلاثة أنواع مميزة من مستودعات التخزين السحابي، كلٌّ منها يخدم غرضًا مختلفًا لتلبية حاجة محددة.
بحيرة البيانات هي مستودع كبير للبيانات غير المنسقة، سواء أكانت غير منظمة أم شبه منظمة. يتم جمع هذه البيانات من مصادر مختلفة وتخزينها بشكل مباشر. لا يتم تعديلها لتلبية غرض معين أو لتتناسب مع صيغة محددة. يتطلب تحضير هذه البيانات للتحليل عمليات طويلة ومستهلكة للوقت من حيث تجهيزها وتنقيتها وإعادة تنسيقها لتصبح متجانسة.تُعَد بحيرات البيانات مصدرًا ممتازًا للبلديات أو المؤسسات الأخرى التي تخزِّن معلومات متعلقة بالانقطاعات، أو حركة المرور، أو الجريمة، أو البيانات الديموغرافية. يمكن استخدام هذه البيانات لاحقًا لتحديث ميزانيات وموارد إدارة الأشغال العامة أو خدمات الطوارئ.
مستودع البيانات هو تجميع للبيانات من مصادر متعددة في مستودع مركزي واحد يوحِّد خصائص البيانات وتنسيقها، ما يجعله مفيدًا لعلماء البيانات في استخدامه في استخراج البيانات، والذكاء الاصطناعي، والتعلم الآلي، وفي النهاية تحليلات الأعمال وذكاء الأعمال. يمكن لمدينة كبيرة استخدام مستودعات البيانات لتجميع المعاملات الإلكترونية من مختلف الأقسام، بما في ذلك مخالفات السرعة، ورخص الكلاب، ومدفوعات ضرائب الاستهلاك، والمعاملات الأخرى. يمكن أن تحلل المدينة هذه البيانات المنظمة لإصدار فواتير متابعة وتحديث بيانات التعداد وسجلات الشرطة. يمكن أيضًا للمطورين استخدامها لتجميع تيرابايتات من البيانات الناتجة عن مستشعرات السيارات للمساعدة على عملية اتخاذ القرار لحل قيادة ذاتية.
متجر البيانات هو جزء فرعي من مستودع البيانات يخدم مجموعة محددة من المستخدمين داخل الشركة أو وحدة الأعمال. يمكن لقسم التسويق في شركة تصنيع استخدام متجر البيانات لتحديد الفئة السكانية أو الشخصية المثالية، بما يدعم تطوير خطط التسويق. يمكن أيضًا لقسم التصنيع استخدامه لتحليل الأداء ومعدلات الأخطاء، بما يُتيح تحقيق التحسين المستمر. غالبًا ما يتم استخدام مجموعات البيانات داخل متجر البيانات في الوقت الفعلي، لإجراء التحليلات الحالية والحصول على نتائج قابلة للتنفيذ.
على الرغم من أن الأنواع الثلاثة من مستودعات البيانات السحابية تحتفظ بالبيانات، فإن هناك اختلافات واضحة جدًا بينها. على سبيل المثال، كلٌّ من مستودع البيانات وبحيرة البيانات عبارة عن تجميعات كبيرة من البيانات، إلا إن بحيرة البيانات عادةً ما تكون أكثر فاعلية من حيث التكلفة في التنفيذ والصيانة لأنها في الغالب غير منظمة.
تطوَّرت بنية بحيرة البيانات على مدار السنوات القليلة الماضية لدعم أحجام أكبر من البيانات والحوسبة السحابية. يتم تلقي كميات كبيرة من البيانات من عدد من مصادر البيانات إلى موقع مركزي.
يمكن تنظيم مستودع البيانات بإحدى الطرق الثلاث التالية:
يمكن استخدام البيانات المخزنة في مستودع البيانات لأغراض متعددة بسهولة أكبر مقارنةً بالبيانات الموجودة في بحيرة البيانات. السبب في ذلك هو أن مستودع البيانات منظَّم ويمكن التنقيب فيه أو تحليله بسهولة أكبر.
من ناحية أخرى، يحتوي متجر البيانات على كمية أقل من البيانات مقارنةً بكلٍّ من بحيرة البيانات ومستودع البيانات، كما يتم تصنيف البيانات لاستخدام محدد أو حسب فئة ديموغرافية أو وحدة أعمال معينة. يمكن أن يوجد متجر البيانات بعدة صيغ مختلفة (نجمة أو ندفة ثلج أو قبو) تُحددها البنية المنطقية للبيانات، حيث يُعَد هيكل القبو أكثر مرونة وقابلية للتوسع مقارنةً بالتنسيقات الأخرى.
هناك ثلاثة أنواع من متاجر البيانات:
يعتمد نوع مستودع البيانات الذي تختاره وهيكله بشكل كبير على احتياجات ومتطلبات عملك. إذا كان ذلك مناسبًا لعملك، استفد من ميزة التخزين المستند إلى السحابة الهجينة لتحقيق المرونة، وقابلية التوسع، ونهج أوسع وأكثر اطلاعًا لحل المشكلات واتخاذ القرارات.
تنتج شركة تصنيع متعددة الجنسيات كميات كبيرة من البيانات لاستخدامات متعددة. بعض البيانات مهمة، بينما قد تكون البيانات الأخرى ذات غرض محتمل أو عديمة الفائدة في المستقبل. تستخدم الشركة مستودع بيانات سحابي لتخزين البيانات الكبيرة، وهو أقل تكلفة مقارنةً بخيارات التخزين الأخرى. ومع ذلك، تمتلك الشركة أيضًا متاجر بيانات تابعة لمجالات محددة من الأعمال، تقدِّم قيمة لمستخدمي الأعمال في أقسام مثل المالية والتصنيع والتسويق. يحتوي كلٌّ من هذه المتاجر على بيانات مخصصة لاستخدام معين، ومنسّقة لتسهيل تحليلها. على سبيل المثال:
تحتاج البلدية الكبيرة إلى حل ميسور التكلفة يوفر البيانات بطريقة اقتصادية وقابلة للاستخدام إلى حد ما. تستخدم البلدية بحيرة بيانات سحابية للحفاظ على بيانات حركة المرور. لا تستطيع حاليًا تحليل هذه البيانات واتخاذ إجراءات بناءً عليها، لكنها ستكون جاهزة للقيام بذلك عند توافر التمويل. كما تستخدم البلدية مستودع بيانات برمجي محلي لتتبُّع حالة فواتير الضرائب. بالإضافة إلى ذلك، تستخدم البلدية متجر بيانات هجين لتتبُّع انتشار الفيروس بين السكان، حيث يتم تجميع البيانات من مختلف المستشفيات والخدمات الصحية البلدية في مستودع واحد لتحليلها واستخدامها من قِبَل وزارة الصحة.
هناك العديد من المفاهيم الخاطئة المتعلقة بمستودعات البيانات السحابية. وتتضمن بعض المفاهيم الخاطئة الأكثر شيوعًا ما يلي:
عملك فريد من نوعه، وله موارد وأهداف وتحديات خاصة به. قيّم خياراتك بعناية لتحديد الحل الذي يخدم احتياجاتك بشكل أفضل. ضَع في اعتبارك ما يلي:
ستساعدك هذه الاعتبارات على تحديد الحل أو مجموعة الحلول التي ستساعدك على الوصول إلى أهدافك.
تقدِّم IBM العديد من الحلول للمساعدة على تلبية احتياجات التخزين السحاب وعلم البيانات.