HBase adalah sistem manajemen basis data non-relasional berorientasi kolom yang berjalan di atas Hadoop Distributed File System (HDFS), komponen utama dari Apache Hadoop.
HBase menyediakan cara yang tahan kesalahan untuk menyimpan kumpulan data yang jarang, yang umum pada banyak contoh penggunaan big data. Sistem ini sangat cocok untuk pemrosesan data real-time atau akses baca/tulis acak pada volume data besar.
Tidak seperti sistem basis data relasional, HBase tidak mendukung bahasa query terstruktur seperti SQL; pada kenyataannya, HBase bukanlah penyimpanan data relasional sama sekali. Aplikasi HBase ditulis dalam Java™ seperti aplikasi Apache MapReduce biasa. HBase memang mendukung penulisan aplikasi di Apache Avro, REST dan Thrift.
Sistem HBase dirancang untuk menskalakan secara linier. Ini terdiri atas satu set tabel standar dengan baris dan kolom, seperti basis data tradisional. Setiap tabel harus memiliki elemen yang didefinisikan sebagai kunci utama, dan semua upaya akses ke tabel HBase harus menggunakan kunci utama ini.
Avro sebagai komponen mendukung berbagai tipe data primitif seperti numerik, data biner, dan string; serta beberapa tipe kompleks seperti array, peta, enumerasi, dan rekaman. Urutan jenis juga dapat ditentukan untuk data.
HBase mengandalkan ZooKeeper untuk koordinasi kinerja tinggi. ZooKeeper sudah terintegrasi dalam HBase, tetapi jika Anda menjalankan klaster produksi, disarankan memiliki klaster ZooKeeper khusus yang terhubung dengan klaster HBase Anda.
HBase bekerja dengan baik dengan Hive, mesin kueri untuk pemrosesan batch data besar, untuk mengaktifkan aplikasi big data yang toleran terhadap kesalahan.
Kolom HBase mewakili atribut objek; jika tabel menyimpan log diagnostik dari server di lingkungan Anda, setiap baris mungkin berupa catatan log, dan kolom umumnya dapat berupa stempel waktu ketika catatan log ditulis, atau nama server tempat catatan berasal.
HBase memungkinkan banyak atribut dikelompokkan bersama ke dalam keluarga kolom, sehingga elemen keluarga kolom semuanya disimpan bersama. Ini berbeda dari basis data relasional berorientasi baris, di mana semua kolom dari baris tertentu disimpan bersama. Dengan HBase, Anda harus menentukan skema tabel dan menentukan keluarga kolom. Namun, kolom baru dapat ditambahkan ke keluarga kapan saja, membuat skema fleksibel dan mampu beradaptasi dengan perubahan persyaratan aplikasi.
HBase, seperti HDFS dengan NameNode dan node slave, serta MapReduce dengan JobTracker dan TaskTracker slave, menggunakan konsep serupa. Dalam HBase, node utama mengelola klaster, sedangkan server wilayah menyimpan bagian tabel dan memproses data. Namun, sama seperti HDFS yang bergantung pada NameNode, HBase juga rentan terhadap masalah jika node utama hilang.
Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.
watsonx.data memungkinkan Anda untuk menskalakan analitik dan AI dengan semua data Anda, di mana pun data berada, melalui penyimpanan data yang terbuka, hybrid, dan diatur.
Dapatkan nilai data perusahaan dengan IBM Consulting, untuk membangun organisasi berbasis insight yang memberikan keuntungan bisnis.