Apache HBase란 무엇인가요?

2021년 8월 15일

HBase란 무엇인가요?

HBase는 Apache Hadoop의 주요 구성 요소인 Hadoop Distributed File System(HDFS) 위에서 실행되는 컬럼 지향 비관계형 데이터베이스 관리 시스템입니다.

HBase는 많은 빅 데이터 사용 사례에서 일반적인 희소 데이터 세트를 내결함성 방식으로 저장할 수 있도록 지원합니다. HBase는 대용량 데이터에 대한 실시간 데이터 처리 또는 임의 읽기/쓰기 액세스에 적합합니다.

관계형 데이터베이스 시스템과 달리 HBase는 SQL과 같은 구조화된 쿼리 언어를 지원하지 않으며, 실제로 관계형 데이터 저장소가 아닙니다. HBase 애플리케이션은 일반적인 Apache MapReduce 애플리케이션처럼 Java™로 작성됩니다 HBase는 Apache Avro, REST 및 Thrift로 애플리케이션을 작성하는 것도 지원합니다.

HBase 시스템은 선형 확장이 가능하도록 설계되었습니다. HBase는 전통적인 데이터베이스처럼 행과 열로 구성된 표준 테이블 집합으로 구성됩니다. 각 테이블에는 기본 키로 정의된 요소가 있어야 하며, HBase 테이블에 대한 모든 액세스는 이 기본 키를 사용해야 합니다.

구성 요소로서 Avro는 숫자형, 바이너리 데이터 및 문자열을 포함한 다양한 기본 데이터 유형과 배열, 맵, 열거형 및 레코드를 포함한 여러 복합 데이터 유형을 지원합니다. 데이터에 대한 정렬 순서를 정의할 수도 있습니다.

HBase는 고성능 조정을 위해 ZooKeeper에 의존합니다. ZooKeeper는 HBase에 내장되어 있지만, 프로덕션 클러스터를 운영하는 경우에는 HBase 클러스터와 통합된 전용 ZooKeeper 클러스터를 구성하는 것이 권장됩니다.

HBase는 빅 데이터의 일괄 처리를 위한 쿼리 엔진인 Hive와 잘 작동하여 내결함성 빅 데이터 애플리케이션을 지원합니다.

트랙에서 굴러가는 공의 3D 디자인

최신 AI 뉴스 + 인사이트

주간 Think 뉴스레터에서 전문가들이 선별한 AI, 클라우드 등에 관한 인사이트와 소식을 살펴보세요. 

HBase 예시

HBase의 열은 객체의 속성을 나타냅니다. 예를 들어 테이블에 환경 내 서버에서 발생한 진단 로그가 저장되는 경우, 각 행은 하나의 로그 레코드가 될 수 있으며, 일반적인 열로는 로그 레코드가 작성된 타임스탬프나 해당 레코드가 생성된 서버 이름 등이 있을 수 있습니다.

HBase를 사용하면 많은 속성을 컬럼 패밀리로 그룹화하여 컬럼 패밀리의 요소가 모두 함께 저장되도록 할 수 있습니다. 이는 지정된 행의 모든 열이 함께 저장되는 행 기반 관계형 데이터베이스와 다릅니다. HBase를 사용하면 테이블 스키마를 미리 정의하고 컬럼 패밀리를 지정해야 합니다. 그러나 언제든지 새 열을 패밀리에 추가할 수 있으므로 스키마를 유연하게 만들고 변화하는 애플리케이션 요구 사항에 적응할 수 있습니다.

HDFS에 NameNode와 슬레이브 노드가 있고 MapReduce에 JobTracker 및 TaskTracker 슬레이브가 있는 것처럼 HBase도 비슷한 개념을 기반으로 구축되었습니다. HBase에서 마스터 노드는 클러스터를 관리하고 지역 서버는 테이블의 일부를 저장하고 데이터에 대한 작업을 수행합니다. HDFS는 NameNode의 가용성으로 인해 몇 가지 엔터프라이즈 문제가 있는 것처럼, HBase도 마스터 노드의 손실에 민감합니다.

AI 아카데미

데이터 관리가 생성형 AI 구현의 비결일까요?

생성형 AI를 성공적으로 사용하기 위해 고품질 데이터가 필수적인 이유를 알아보세요.

관련 솔루션
데이터 관리 소프트웨어 및 솔루션

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기
IBM watsonx.data™

watsonx.data를 사용하면 오픈, 하이브리드 및 관리형 데이터 저장소를 통해 데이터의 위치와 관계없이 모든 데이터로 분석과 AI를 확장할 수 있습니다.

watsonx.data 알아보기
데이터 및 분석 컨설팅 서비스

IBM Consulting을 통해 엔터프라이즈 데이터의 가치를 실현하여 비즈니스 이점을 제공하는 인사이트 중심의 조직을 구축하세요.

분석 서비스 알아보기
다음 단계 안내

탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선하는 데이터 전략을 구축하세요.

데이터 관리 솔루션 살펴보기 watsonx.data 알아보기