HBase هو نظام إدارة قواعد بيانات غير علائقية موجه نحو الأعمدة، يعمل فوق نظام ملفات Hadoop الموزع (HDFS)، وهو مكون رئيسي من Apache Hadoop.
يوفر HBase طريقة تتحمل للأخطاء لتخزين مجموعات البيانات المتفرقة، والتي تُعد شائعة في العديد من حالات استخدام البيانات الكبيرة. إنه مناسب تمامًا لمعالجة البيانات في الوقت الفعلي أو الوصول العشوائي للقراءة/الكتابة لكميات كبيرة من البيانات.
على عكس أنظمة قواعد البيانات العلائقية، لا يدعم HBase لغة استعلام منظمة مثل SQL؛ بل في الواقع، لا يُعد HBase قاعدة بيانات علائقية من الأساس. يتم تطوير تطبيقات HBase باستخدام لغة Java، على غرار تطبيقات Apache MapReduce النموذجية. ويدعم HBase أيضًا تطوير التطبيقات باستخدام Apache Avro وواجهة REST وThrift.
نظام HBase مصمم ليتوسع خطيًا. يتكون من مجموعة من الجداول القياسية ذات الصفوف والأعمدة، إلى حد كبير مثل قاعدة البيانات التقليدية. يجب أن يحتوي كل جدول على عنصر معرف كمفتاح أساسي، ويجب أن تستخدم جميع محاولات الوصول إلى جداول HBase هذا المفتاح الأساسي.
Avro، كأحد المكونات، يدعم مجموعة غنية من أنواع البيانات الأولية تتضمن: البيانات الرقمية، والبيانات الثنائية، والسلاسل النصية؛ وعددًا من الأنواع المعقدة تتضمن المصفوفات، والخرائط ، والتعدادات، والسجلات. يمكن أيضا تحديد ترتيب الفرز للبيانات.
يعتمد HBase على ZooKeeper لتحقيق التنسيق عالي الأداء. ورغم أن ZooKeeper مدمج ضمن HBase، إلا أنه يُوصى بوجود مجموعة ZooKeeper مخصصة عند تشغيل عنقود إنتاجي، وأن تكون مدمجة بالكامل مع عنقود HBase.
يعمل HBase بشكل جيد مع Hive، وهو محرك استعلام لمعالجة البيانات الكبيرة على دفعات، لتمكين تطبيقات البيانات الكبيرة التي تتحمل الأعطال.
يمثل عمود HBase سمة لكائن؛ إذا كان الجدول يخزن سجلات التشخيص من الخوادم في بيئتك، فقد يكون كل صف عبارة عن سجل، ويمكن أن يكون العمود النموذجي هو الطابع الزمني لوقت كتابة سجل السجل، أو اسم الخادم الذي نشأ منه السجل.
يُتيح HBase تجميع العديد من السمات ضمن عائلات أعمدة، بحيث يتم تخزين جميع عناصر العائلة الواحدة معًا. ويختلف هذا تمامًا عن قواعد البيانات العلائقية الموجهة على مستوى الصفوف، حيث يتم تخزين أعمدة الصف الواحد سويًا. في HBase، يجب تحديد مخطط الجدول مسبقًا وتحديد عائلات الأعمدة. ومع ذلك، مكن إضافة أعمدة جديدة إلى هذه العائلات في أي وقت، مما يجعل المخطط مرنًا وقادرًا على التكيف مع متطلبات التطبيقات المتغيرة.
كما أن HDFS لديه NameNode وعقد فرعية، ولدى MapReduce مدير مهام وعمال مهمين تابعين، فإن HBase مبني على مفاهيم مماثلة. في HBase، يدير العقدة الرئيسية نظام المجموعة، بينما تقوم خوادم المناطق بتخزين أجزاء من الجداول وتنفذ العمليات على البيانات. بنفس الطريقة التي يواجه بها HDFS بعض المخاوف المتعلقة بالمؤسسات بسبب توفر NameNode، فإن HBase أيضًا حساس لفقدان العقدة الرئيسية الخاصة به.
صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.
يتيح لك watsonx.data توسيع نطاق التحليلات والذكاء الاصطناعي باستخدام جميع بياناتك، أينما كانت، من خلال مخزن بيانات مفتوح وهجين ومُدار.
استفِد من قيمة بيانات المؤسسة باستخدام IBM Consulting، من خلال بناء مؤسسة تعتمد على الرؤى التي تقدِّم ميزة للأعمال.