Eine HBase-Spalte stellt ein Attribut eines Objekts dar; wenn in der Tabelle Diagnoseprotokolle von Servern in Ihrer Umgebung gespeichert werden, könnte jede Zeile ein Protokolldatensatz sein, und eine typische Spalte könnte der Zeitstempel für den Zeitpunkt sein, an dem der Protokolldatensatz geschrieben wurde, oder der Name des Servers, von dem der Datensatz stammt.

HBase ermöglicht es, viele Attribute in Spaltenfamilien zu gruppieren, sodass die Elemente einer Spaltenfamilie alle zusammen gespeichert werden. Dies unterscheidet sich von einer zeilenorientierten relationalen Datenbank, in der alle Spalten einer bestimmten Zeile zusammen gespeichert werden. Bei HBase müssen Sie das Tabellenschema vordefinieren und die Spaltenfamilien angeben. Es können jedoch jederzeit neue Spalten zu den Familien hinzugefügt werden, wodurch das Schema flexibel wird und sich an sich ändernde Anwendungsanforderungen anpassen kann.

So wie HDFS über einen NameNode und Slave-Knoten verfügt und MapReduce über JobTracker- und TaskTracker-Slaves, ist HBase auf ähnlichen Konzepten aufgebaut. In HBase verwaltet ein Masterknoten den Cluster und Regionalserver speichern Teile der Tabellen und führen die Arbeit an den Daten aus. Genauso wie HDFS aufgrund der Verfügbarkeit des NameNode einige Probleme für Unternehmen mit sich bringt, reagiert auch HBase empfindlich auf den Ausfall seines Master-Knotens.