什么是 Apache HBase？

什么是 HBase？

HBase 是面向列的非关系数据库管理系统，在 Hadoop 分布式文件系统 (HDFS) 上运行，后者是 Apache Hadoop 的主要组件。

HBase 提供一种可容错地存储稀疏数据集的方式，此类数据集在许多大数据用例中都很常见。它非常适合实时数据处理或随机读/写访问大量数据。

与关系数据库系统不同，HBase 不支持 SQL 等结构化查询语言；实际上，HBase 根本不是关系数据存储。HBase 应用程序是用 Java™ 编写的，与典型的 Apache MapReduce 应用程序非常相似。HBase 支持使用 Apache Avro、REST 和 Thrift 编写应用程序。

HBase 系统设计为线性扩展。它由一组带有行和列的标准表组成，与传统数据库非常相似。每个表都必须有一个定义为主键的元素，并且对 HBase 表的所有访问尝试都必须使用此主键。

Avro 作为一个组件，可支持一组丰富的原始数据类型，包括：数值、二进制数据和字符串；以及大量复杂类型，包括数组、映射、枚举和记录；还可以为数据定义排序顺序。

HBase 依靠 ZooKeeper 进行高性能协调。ZooKeeper 内置于 HBase 中，但如果您正在运行一个生产集群，建议拥有一个与 HBase 集群集成的专用 ZooKeeper 集群。

HBase 与大数据批处理查询引擎 Hive 配合良好，可实现容错大数据应用。

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯，了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。

HBase 示例

HBase 列代表对象的属性；如果该表存储环境服务器的诊断日志，则每一行可能都是一个日志记录，而典型列可能是写入日志记录的时间戳，或记录来源的服务器名称。

HBase 允许将许多属性分组到列族中，这样列族的元素就全部存储在一起。这与面向行的关系数据库不同；在关系数据库中，给定行的所有列都存储在一起。使用 HBase，您必须预定义表架构并指定列族。但是，可以随时将新列添加到族中，从而使架构灵活并能够适应不断变化的应用程序要求。

正如 HDFS 具有 NameNode 和从节点，MapReduce 具有 JobTracker 和 TaskTracker 从节点一样，HBase 也是基于类似的概念构建。在 HBase 中，主节点管理集群，区域服务器存储表的各个部分并对数据执行处理。由于 NameNode 的可用性，HDFS 存在一些企业应用方面的担忧，与之相似，HBase 对其主节点的丢失也很敏感。

AI Academy

数据管理是生成式 AI 的秘诀吗？

深入了解为什么高质量数据对于成功使用生成式 AI 至关重要。

转到视频集

相机、音量旋钮和剪贴板等图标排成螺旋状的 3D 渲染图

阅读《数据领导者指南》，了解如何让您组织的数据实现 AI 就绪。

资源

几个图标的三维渲染图，如麦克风和相机

AI 智能体依赖数据运行——您的数据准备好了吗？

您的数据就是您的竞争优势。在这期简短的网络研讨会中，了解如何安全地解锁数据价值，并从 AI 中获得可衡量的投资回报率。

数据管理详解

IBM 出品的 Techsplainers 系列视频将 AI 所需的数据基础知识化繁为简，从核心概念到实际用例。每集清晰、简短，助您快速掌握基本要点。

几个图标的三维渲染图，如音量旋钮和记事本

统一并访问您的数据，助力扩展 AI

了解为何走向 AI 就绪数据之路往往始于有效访问结构化和非结构化数据，以及数据负责人可能面临的挑战。

将法务费用转化为战略性洞察分析

了解人工智能驱动的法律智能体如何加速决策、减少人工工作并提升合规性。

播客中两人交谈

AI 学院：构建企业 AI 数据战略

在本集中，Cathy Reese 阐述了当今组织需要为高级 AI 做好准备的数据战略，这就要求企业利用好自身最高质量的数据资产。

几个图标的三维渲染图，如相机和纸飞机

面向 AI 的混合、开放湖仓一体

简化数据访问并实现数据治理自动化。了解将湖仓一体战略集成到数据架构中的强大功能，包括优化工作负载的成本、扩展 AI 和分析，以及随时随地使用所有数据。

两个渲染的玻璃立方体

《2025 年数据泄露成本报告》

数据泄露成本再创新高。获取关于网络安全威胁及其对企业造成的经济损失的最新洞察。

两行多个图标（如相机、音量旋钮和剪贴板）的 3D 效果图

数据领导者的 AI 就绪数据指南

了解数据负责人可以采取哪些可行步骤来克服数据挑战，为可信赖的数据基础奠定根基，并帮助组织的数据为 AI 做好准备。

多个图标排成一排的 3D 效果图，例如相机、音量旋钮和剪贴板

高级管理层如何将信息转化为影响

在这份面向数据领导者的跨行业报告中，深入了解 1700 位 CDO 的洞察分析。

相关解决方案

IBM StreamSets

通过直观的图形界面创建和管理智能流数据管道，促进跨混合和多云环境的无缝数据集成。

深入了解流媒体集

IBM watsonx.data™

watsonx.data 支持您通过开放、混合和已治理数据，利用您的所有数据（无论位于何处）扩展分析和 AI。

了解 watsonx.data

数据和分析咨询服务

借助 IBM Consulting 释放企业数据的价值，构建一个可带来业务优势的洞察驱动型组织。

了解分析服务

采取下一步行动

设计数据战略，消除数据孤岛、降低复杂性并提高数据质量，以获得卓越的客户和员工体验。