Apache Hadoop은 컴퓨터 네트워크(또는 "노드")를 통해 방대하고 복잡한 데이터 문제를 해결함으로써 사용자가 대용량 데이터 세트(기가바이트에서 페타바이트까지)를 관리할 수 있도록 하는 오픈 소스 소프트웨어 유틸리티입니다. 확장성이 뛰어나고 비용 효율적인 솔루션으로, 정형, 반정형 및 비정형 데이터(예: 인터넷 클릭스트림 기록, 웹 서버 로그, IoT 센서 데이터 등)를 저장하고 처리합니다.

Hadoop 프레임워크의 이점은 다음과 같습니다.