تخزين الكائنات، المعروف أيضًا باسم التخزين القائم على الكائنات، هو بنية تخزين بيانات مثالية لتخزين وأرشفة وإنشاء نسخ احتياطية وإدارة كميات كبيرة من البيانات غير المنظمة الثابتة - بشكل موثوق به وفعَّال وبأسعار معقولة.
إن بيانات الاتصالات الرقمية الحديثة غير منظمة إلى حد كبير، مما يعني أنها لا تتوافق مع (ولا يمكن تنظيمها بسهولة في) قاعدة البيانات العلائقية التقليدية التي تحتوي على صفوف وأعمدة. وهي تتضمن البريد الإلكتروني ومقاطع الفيديو والصور وصفحات الويب وملفات الصوت وبيانات المستشعر وأنواعًا أخرى من الوسائط ومحتوى الويب (نصيًا أو غير نصي).
يتم بث كل هذا المحتوى باستمرار من وسائل التواصل الاجتماعي ومحركات البحث والهواتف المحمولة والأجهزة الذكية. على سبيل المثال، تستخدم خدمات البث مثل Netflix تخزين الكائنات لتخزين مكتباتها الضخمة من الأفلام والعروض وتقديمها للمستخدمين في جميع أنحاء العالم، مما يتيح الوصول الفوري من أي جهاز ومن أي مكان.
مع تخزين الكائنات، يمكنك تخزين وإدارة أحجام بيانات تتراوح من التيرابايتات (TB) إلى البيتابايتات (PB) وما بعدها - بما في ذلك عمليات النشر على نطاق الإكسابايت التي تدعم أكبر المنصات السحابية والتطبيقات كثيفة البيانات اليوم.
تواجه الشركات اليوم تحديات مستمرة تتعلق بتخزين كميات هائلة من البيانات وإدارتها بكفاءة وفعالية من حيث التكلفة. يوفر تخزين الكائنات حلاً قويًا لاحتياجات تخزين البيانات الحديثة حيث يوفر قابلية التوسع مقارنةً بالتخزين التقليدي القائم على الملفات أو الكتل.
وتقدر دراسة أجرتها DataIntelo سوق تخزين الكائنات العالمي بحوالي 6.8 مليار دولار أمريكي في عام 2023. وتتوقع الدراسة أيضًا أن ينمو إلى ما يقرب من 25 مليار دولار أمريكي بحلول عام 2032، بمعدل نمو سنوي مركب يبلغ 15.7%.1 يعكس هذا النمو الحاجة المتزايدة للتعامل مع البيانات غير منظمة، وزيادة تبني استخدام السحابة، والاعتماد المتزايد على تحليلات البيانات الكبيرة.
النشرة الإخبارية الخاصة بالمجال
ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.
سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.
تطور تخزين الكائنات بشكل كبير منذ طرحه في أوائل العقد الأول من القرن الحادي والعشرين. وتتضمن المعالم الرئيسية إطلاق Amazon لحل S3 في عام 2006، والذي أسس المعيار الفعلي لواجهات برمجة التطبيقات (APIs) الخاصة بتخزين الكائنات على السحابة. ويتبع ذلك ظهور حلول مفتوحة المصدر مثل OpenStack Swift في عام 2010 وظهور عمليات نشر السحابة الهجينة في منتصف العقد الثاني من القرن الحادي والعشرين.
تم تطوير تخزين الكائنات الحديثة في البداية لتطبيقات الويب، ولكنها أصبحت الآن جزءًا لا يتجزأ من الحوسبة السحابية والبيئات التي يتم نقلها في حاويات . تدعم تطبيقات اليوم الميزات المتقدمة مثل التصنيف الذكي للبيانات، وقدرات تعيين الإصدارات، والتكامل مع Kubernetes والمنصات الأخرى التي تعمل على أتمتة تنسيق الحاويات. تشمل الابتكارات الحديثة إدارة البيانات المدعومة بالذكاء الاصطناعي، حيث تساعد خوارزميات التعلم الآلي (ML) على تحسين تكاليف التخزين والأداء، وقدرات تخزين الكائنات على الحافة التي تجعل البيانات أقرب إلى مكان استهلاكها.
في نفس الوقت تقريبًا الذي اكتسب فيه تخزين الكائنات زخمًا في بيئات السحابة الأصلية، بدأت العديد من المؤسسات في إعادة التفكير في اعتمادها على هياكل التخزين التقليدية.
في السابق، كانت المؤسسات تستخدم شبكات التخزين (SAN) باهظة الثمن لإدارة كميات هائلة من البيانات، وهو ما يتطلب غالبًا استثمارات رأسمالية كبيرة في الأجهزة والبنية التحتية لتكنولوجيا المعلومات. ومع تزايد الطلب على البيانات، أصبح من الصعب بشكل متزايد الحفاظ على هذا النهج وفّرت خدمات التخزين السحابي بديلاً أكثر مرونة، مما يسمح للمؤسسات بتوسيع السعة أو تقليصها حسب الحاجة.
بدلاً من الاحتفاظ بشبكات التخزين الكبيرة داخل الشركة، يمكن للشركات الآن الوصول إلى التخزين كخدمة (STaaS)- مما يقلل التكاليف إلى جانب اكتساب السرعة وقابلية التوسع. يوفر جميع مزودي الخدمة السحابية الكبار، بما في ذلك Amazon Web Services (AWS) وGoogle Cloud و®IBM Cloud وMicrosoft Azure، قدرات تخزين الكائنات. وقد تطور هذا التحول بشكل أكبر إلى نهج سحابة متعددة هجينة، حيث تجمع المؤسسات استراتيجياً بين التخزين المحلي ومزودي السحابة المتعددة لتحسين الأداء والتكلفة ومتطلبات الامتثال.
يشمل التخزين السحابي العديد من البنى، بما في ذلك تخزين الملفات والكتل والكائنات. يقدم كل منها أساليب مختلفة لإدارة البيانات وإمكانية الوصول إليها. تستخدم المؤسسات الحديثة بنى تخزين مختلفة وفقًا لاحتياجاتها وأنواع البيانات المحددة.
في حين تعتمد البيانات المنظمة وأعباء العمل المرتبطة بالمعاملات غالبًا على تخزين الملفات وتخزين الكتل، فإن انتشار المحتوى الرقمي غير المنظم جعل تخزين الكائنات أمرًا ضروريًا في بيئة البيانات الحالية. ويساعدك فهم طرق التخزين الثلاث هذه على اختيار النهج المناسب لمتطلباتك.
فيما يلي تفصيل لتخزين الكائنات مقابل تخزين الملفات مقابل تخزين الكتل.
يقوم أسلوب تخزين الملفات بتنظيم البيانات وتخزينها داخل مجلد. يتم تسمية الملفات وتمييزها ببيانات التعريف (والتي تكون عادةً اسم الملف ونوع الملف ووقت إنشائه وتاريخ آخر تحديث)، ويتم تنظيمها في مجلدات ضمن تسلسل هرمي للأدلة والأدلة الفرعية.
يمكنك تصوّر تخزين الملفات بنفس الطريقة التي تقوم بها بتخزين الملفات الورقية الفعلية في خزانة الملفات. هناك عدة أدراج (أدلة) ومجلدات ملفات مسماة داخل كل درج (أدلة فرعية).
لتحديد موقع مجلد ملف معين في خزانة الملفات الخاصة بك، يمكنك سحب الدرج المناسب وعرض ملصقات المجلدات. وبنفس الطريقة، للوصول إلى البيانات الموجودة في نظام تخزين الملفات، يتطلب نظام الكمبيوتر الخاص بك فقط المسار (الدلائل والدلائل الفرعية) الذي يمكن العثور عليها فيه.
يعمل نظام التخزين الهرمي مثل هذا بشكل جيد مع كميات صغيرة نسبياً من البيانات سهلة التنظيم. ومع ذلك، فمع نمو عدد الملفات، يمكن أن تصبح عملية البحث والاسترجاع مرهقة وتستغرق وقتاً طويلاً.
يقدم تخزين الكتل بديلاً للتخزين القائم على الملفات— وهو بديل يتميز بالكفاءة والأداء المحسّن. يقوم تخزين الكتل بتقسيم الملف إلى أجزاء متساوية الحجم من البيانات وتخزين كتل البيانات هذه بشكل منفصل، تحت عنوان فريد. لا تحتاج إلى البنية القائمة على المجلدات والملفات. بدلاً من ذلك، يمكنك تخزين مجموعة الكتل في أي مكان في النظام لتحقيق أقصى قدر من الكفاءة.
للوصول إلى ملف، يستخدم نظام تشغيل الخادم العنوان الفريد لاسترجاع الكتل وتجميعها مرة أخرى لتكوين الملف. تتحقق الكفاءة؛ لأن النظام لا يحتاج إلى التنقل عبر الدلائل وهياكل الملفات للوصول إلى كتل البيانات. يعمل تخزين الكتل بشكل جيد مع تطبيقات الأعمال الحيوية، وقواعد بيانات المعاملات، والأجهزة الافتراضية التي تتطلب زمن انتقال قصيرًا، ووصولًا تفصيليًا إلى البيانات، وأداءً مرتفعًا مستمرًا.
بدلاً من تقسيم الملفات إلى كتل أو تنظيمها في مجلدات هرمية، يتعامل تخزين الكائنات مع كل جزء من البيانات كوحدة منفصلة قابلة للعنونة. على عكس أنظمة الملفات التي تعتمد على هياكل الدليل أو تخزين الكتل الذي يقوم بتجزئة البيانات، يحافظ تخزين الكائنات على سلامة البيانات بالكامل داخل كل وحدة تخزين.
يوفر تخزين الكائنات قدرة تخزين منخفضة التكلفة وقابلة للتوسع على نطاق واسع للبيانات غير المنظمة التي تتجاوز الحدود العملية لحلول الكتل والملفات. وهو نهج مثالي لأرشفة البيانات الثابتة، مثل سجلات الامتثال ومكتبات الوسائط وبيانات النسخ الاحتياطي التي لا تتطلب تعديلاً متكرراً.
الكائنات عبارة عن وحدات منفصلة من البيانات المخزنة في بيئة بيانات مسطحة هيكلياً نموذجية لأنظمة تخزين الكائنات. على عكس أنظمة الملفات التقليدية، لا توجد مجلدات أو أدلة أو تسلسلات هرمية معقدة حقيقية - على الرغم من أنه يمكن محاكاة الهياكل الشبيهة بالمجلدات باستخدام اصطلاحات التسمية.
كل كائن عبارة عن وحدة قائمة بذاتها تتضمن البيانات نفسها وبيانات التعريف المرتبطة (معلومات وصفية حول الكائن) ومعرف فريد، غالباً ما يسمى مفتاح الكائن. يميز هذا المعرف الفريد الكائن داخل نظام التخزين وقد يشبه مسار الملف، ولكنه لا يمثل بنية دليل فعلية.
تتيح معلومات المستودع للتطبيق إمكانية تحديد موقع الكائن والوصول إليه. يمكنك تجميع أجهزة التخزين في مجموعات التخزين الأكبر وتوزيع مجموعات التخزين هذه عبر المواقع. تتيح هذه الميزة نطاقًا غير محدود ومرونة بيانات محسّنة والتعافي من الكوارث.
يُزيل تخزين الكائنات التعقيدات ومشكلات التوسع المرتبطة بنظام الملفات الهرمي. يمكن تخزين الكائنات محليًا في مراكز البيانات الداخلية، أو على خوادم السحابة، أو في بيئات هجينة ومتعددة السحابة، مع إمكانية الوصول إليها من أي مكان في العالم. غالبًا ما تستخدم عمليات النشر الحديثة تنسيق الحاويات والبنية التحتية الموزعة لإدارة الأنظمة الأساسية التي تشغِّل تخزين الكائنات.
يتم الوصول إلى الكائنات - التي يتكون كل منها من بيانات وبيانات تعريف ومعرف فريد - في نظام تخزين الكائنات من خلال واجهات برمجة التطبيقات. واجهة برمجة التطبيقات الأصلية لتخزين الكائنات هي عادةً واجهة برمجة تطبيقات RESTful تعتمد على HTTP (تُعرف أيضًا باسم خدمة الويب RESTful). توفر معظم الجهات المزودة أيضًا مجموعات تطوير البرامج (SDKs) التي تبسط التفاعل مع واجهات برمجة التطبيقات هذه عبر لغات البرمجة المختلفة.
تستخدم واجهات برمجة التطبيقات هذه المعرف الفريد (أو المفتاح) الخاص بالكائن لاسترداد الكائن ويمكن أن تسمح أيضاً بالاستعلام عن بيانات التعريف الخاصة به. نظرًا لأن واجهات برمجة التطبيقات تعتمد على الإنترنت، فمن الممكن الوصول إلى الكائنات من أي مكان، وعلى أي جهاز مزود باتصال بالشبكة .
تستخدم واجهات برمجة تطبيقات RESTful أوامر HTTP مثل "PUT" أو "POST" لتحميل كائن ، و"GET" لاسترداد كائن، و "DELETE" لإزالته. (HTTP تعني "بروتوكول نقل النص التشعبي" وهي مجموعة من القواعد لنقل النصوص والصور الرسومية والصوت والفيديو وملفات الوسائط المتعددة الأخرى على الإنترنت.)
يمكنك تخزين أي عدد من الملفات الثابتة على مثيل تخزين كائنات ليتم استدعاؤها من خلال واجهة برمجة التطبيقات. تظهر المزيد من معايير واجهة برمجة التطبيقات RESTful التي تتجاوز إنشاء الكائنات واسترجاعها وتحديثها وحذفها. تسمح هذه المعايير للتطبيقات بإدارة تخزين الكائنات، وحاوياتها، وحساباتها، وتعدُّد المستأجرين، والأمان، والفواتير، والمزيد.
على سبيل المثال، افترض أنك تريد تخزين جميع الكتب في نظام مكتبة كبير على نظام أساسي واحد. تحتاج إلى تخزين محتويات الكتب (البيانات)، ولكن أيضًا المعلومات المرتبطة بها مثل المؤلف وتاريخ النشر والناشر والموضوع وحقوق التأليف والنشر وغيرها من التفاصيل. يمكنك تخزين كل هذه البيانات وبيانات التعريف في قاعدة بيانات علائقية، منظمة في مجلدات ضمن تسلسل هرمي من الدلائل والدلائل الفرعية.
ولكن مع وجود ملايين الكتب، تصبح عملية البحث والاسترجاع مرهقة وتستغرق وقتاً طويلاً. يعمل نظام تخزين الكائنات بشكل جيد لأن البيانات مستقرة أو ثابتة. في هذا المثال، لن تتغير محتويات الكتاب.
يتم تخزين الكائنات على شكل "حزم" في هيكل مسطح، ويمكن تحديد موقعها واسترجاعها بسهولة من خلال استدعاء API واحد. علاوةً على ذلك، مع استمرار نمو عدد الكتب، يمكنك تجميع أجهزة التخزين في مجموعات تخزين أكبر وتوزيع هذه المجموعات على نطاق غير محدود.
يمكنك استخدام استدعاءات واجهة برمجة التطبيقات البسيطة لتحميل واسترداد الملفات في نظام تخزين الكائنات، ولكن التطبيق يحتاج أيضًا إلى بيانات تعريف الكائن لتحديد موقع الكائن الصحيح في مكان التخزين. هنا يأتي دور قاعدة بيانات تخزين الكائنات. توفر قاعدة البيانات هذه دليلاً من نوع ما يستخدم بيانات تعريف الكائن لتحديد موقع ملفات البيانات المناسبة في نظام تخزين موزع.
تحتوي كل مجموعة تخزين كائنات على قاعدة بيانات لتخزين الكائنات تحتوي على جدولين:
يحتوي جدول دليل الكائنات على معلومات وصفية حول كل كائن (بيانات التعريف). يتتبع هذا الدليل جميع الكائنات في التسلسل الهرمي للتخزين من خلال تسجيل معرف اسم المجموعة واسم الكائن والمعلومات الأخرى ذات الصلة. على سبيل المثال، في منهجيات تخزين الكائنات الشائعة، يتضمن جدول دليل الكائنات ثلاثة فهارس رئيسية:
يحتوي جدول تخزين الكائنات على محتوى البيانات أو الملف نفسه (الكائنات). توجد البيانات (المحتوى الرقمي الثابت مثل ملفات الفيديو والصور أو مكتبات المستندات الكبيرة) في مكان تخزين الكائنات. وفي الوقت نفسه، توجد بيانات التعريف (المعلومات السياقية حول البيانات، بما في ذلك معرف الاسم) في قاعدة بيانات أو جدول دليل الكائنات.
عندما يقوم التطبيق "بنشر" ملف، فإنه يقوم بإنشاء بيانات التعريف وتخزينها في جدول دليل الكائنات داخل قاعدة بيانات تخزين الكائنات، إلى جانب "وضع" الملف في جدول تخزين الكائنات. لاسترداد الملف لاحقاً، يستعلم التطبيق عن دليل الكائنات أو قاعدة البيانات عن بيانات التعريف ويستخدم تلك المعلومات الوصفية التعريفية لتحديد موقع البيانات أو "الحصول على" البيانات.
توفر التقنيات مفتوحة المصدر المرونة والتحكم في خيارات إدارة البيانات وتخزينها، إما كبدائل أو متكاملة مع الحلول المملوكة للمؤسسة من مقدمي الخدمات السحابية والبائعين الآخرين.
من خلال الأدوات مفتوحة المصدر والوصول إلى واجهات برمجة التطبيقات المفتوحة، يمكنك تخصيص الكود ليناسب المتطلبات الخاصة بمؤسستك مع الحفاظ على التوافق مع الأنظمة الحالية المملوكة. يوفر هذا النهج حرية استخدام الأجهزة الموجودة التي قد تملكها أو مزج الأجهزة من بائعين مختلفين، مع الاستفادة من مساهمات المجتمع الأوسع للمطورين.
جميع حلول تخزين الكائنات مفتوحة المصدر الكبرى تلتزم ببروتوكول تخزين الكائنات الخاص بخدمة Simple Storage Service من Amazon (Amazon S3). تم تقديمه لأول مرة في عام 2006، ومنذ ذلك الحين أصبح المعيار الفعلي لواجهات برمجة تطبيقات التخزين السحابي.
تتضمن الحلول مفتوحة المصدر الشائعة Ceph وMinIO وOpenStack Swift. وعلى الرغم من أن هذه الحلول تقدم ميزات وخيارات سياسة ومنهجيات مختلفة، إلا أن كل منها يخدم نفس الهدف، وهو تمكين التخزين واسع النطاق للبيانات الرقمية غير المنسقة باستخدام واجهات برمجة تطبيقات RESTful المتوافقة مع S3.
يقدِّم العديد منها أيضًا واجهات برمجة تطبيقات خاصة بها كبدائل لبروتوكول S3. على سبيل المثال، يدعم OpenStack Swift واجهة Amazon S3، كما يقدِّم واجهة Swift الخاصة به مع قدرات فريدة. يتوافق Ceph Object Storage مع بروتوكول S3، كما يدعم أيضًا مجموعة كبيرة من واجهات برمجة التطبيقات OpenStack Swift، ما يوفر مرونة في كيفية تفاعُل التطبيقات مع نظام التخزين.
يعد تخزين الكائنات مفيدًا للنسخ الاحتياطي واسترداد البيانات بعد الكوارث لأنه يعد بديلاً أكثر كفاءة لحلول النسخ الاحتياطي المادية. على سبيل المثال، تتطلب حلول النسخ الاحتياطي المادية مثل الأشرطة ومحركات الأقراص الصلبة تحميل البيانات وإزالتها ونقلها خارج الموقع للتكرار الجغرافي.
يمكنك استخدام تخزين الكائنات لإجراء نسخ احتياطية تلقائية لقواعد البيانات المحلية على السحابة وتكرار البيانات بطريقة فعَّالة من حيث التكلفة بين مراكز البيانات الموزعة. أضِف نسخة احتياطية إضافية خارج الموقع وحتى عبر المناطق الجغرافية لضمان التعافي من الكوارث.
يعد تخزين الكائنات على السحابة مثاليًا للاحتفاظ بالبيانات على المدى الطويل. يمكن أن يحل محل الأرشيفات التقليدية مثل التخزين المتصل بالشبكة (NAS) والمساعدة في تقليل تكاليف البنية التحتية لتكنولوجيا المعلومات. كما أنه يحافظ بشكل منخفض التكلفة على كميات كبيرة من محتوى الوسائط الغنية - مثل الصور ومقاطع الفيديو - التي لا يتم الوصول إليها بشكل متكرر.
يوفر تخزين الكائنات حلاً قابلاً للتطوير ومنخفض التكلفة لبناء بحيرات بيانات مركزية. يمكن لبحيرات البيانات هذه تخزين كميات غير محدودة من البيانات المنظمة والبيانات غير المنظمة من مصادر مختلفة. يمكن بعد ذلك الاستعلام عن البيانات المخزنة لدعم تحليلات البيانات الكبيرة وإنشاء رؤى تتعلق بالعملاء والعمليات واتجاهات السوق.
يعمل تخزين الكائنات القائم على السحابة كمخزن بيانات دائم لتطوير تطبيقات السحابة. ويدعم إنشاء التطبيقات السحابية الأصلية وتحديث التطبيقات القديمة. باستخدام تخزين الكائنات، يمكنك التعامل بكفاءة مع كميات كبيرة من بيانات إنترنت الأشياء (IOT) والأجهزة المحمولة غير المنظمة وتبسيط تحديث عناصر التطبيق.
يدعم تخزين الكائنات الذكاء الاصطناعي التوليدي من خلال تخزين مجموعات بيانات كبيرة للتدريب وتوليد المخرجات. كما أنه قادر على التعامل مع البيانات الضخمة ويستخدم بيانات التعريف للمساعدة في تنظيم البيانات وتتبعها، مما يتيح سرعة أكبر لمهام سير العمل والوصول السريع إلى البيانات أثناء الاستدلال.
تستخدم المؤسسات تخزين الكائنات لإدارة كميات كبيرة من المستندات وملفات الوسائط والأصول مع بيانات تعريف غنية لسهولة التنظيم والاسترجاع.
تولد أجهزة إنترنت الأشياء (IOT) كميات كبيرة من البيانات من أجهزة الاستشعار التي يمكن لتخزين الكائنات جمعها وتخزينها وإتاحتها للتحليل بكفاءة. كما تتضمن سيناريوهات حوسبة الحافة حيث تحدث معالجة البيانات بالقرب من المصدر.
يمكنك تخزين البيانات بأي تنسيق وفي أي مكان مع قابلية التوسع والمرونة والأمن.
الوصول إلى خدمات التخزين السحابي للحصول على حلول تخزين بيانات قابلة للتوسع وآمنة وفعَّالة من حيث التكلفة.
أطلق العنان للقدرات الجديدة وحفِّز مرونة الأعمال من خلال خدمات الاستشارات السحابية من IBM.
1. سوق تخزين الكائنات، التوقعات العالمية لعام 2025، DataIntelo، 2025