Apache Hadoop이란 무엇일까요?

Apache Hadoop®은 간단한 프로그래밍 모델을 사용하여 대규모 데이터 세트의 매우 안정적이고 확장 가능한 분산 처리를 제공하는 오픈 소스 플랫폼입니다. Hadoop은 상용 컴퓨터의 클러스터에서 구축되며, 형식 요구사항 없이 방대한 양의 정형, 반정형 및 비정형 데이터를 저장하고 처리하기 위한 비용 효율적인 솔루션을 제공합니다. 따라서 Hadoop은 빅데이터 분석 이니셔티브를 지원하기 위한 데이터 레이크의 구축에 이상적입니다.

Hadoop의 유스 케이스

보다 우수한 실시간 데이터 기반 의사결정

데이터 웨어하우스에서 사용되지 않았던 반정형 및 비정형 데이터와 함께 최근에 나타난 데이터 형식(스트리밍 오디오, 비디오, 소셜 미디어 감성 및 클릭 스트림 데이터)을 통합합니다. 인공지능(AI)과 사물인터넷(IoT) 등과 같은 신규 기술의 지원으로 보다 종합적인 데이터에서 보다 정확한 분석적 의사결정을 얻을 수 있습니다.

개선된 데이터 액세스 및 분석

Hadoop은 데이터 사이언티스트, LOB(Line of Business) 소유자와 개발자를 위한 실시간의 셀프 서비스 액세스를 제공하도록 도와줍니다. Hadoop은 머신 러닝, 통계, 고급 분석 및 프로그래밍을 결합하는 여러 학문 분야가 관련된 분야인 데이터 사이언스의 미래에 자양분을 공급합니다.

데이터 오프로드 및 통합

현재 사용되지 않는 "콜드" 데이터를 Hadoop 기반 배포로 이동시켜서 엔터프라이즈 데이터 웨어하우스의 비용을 최적화하고 효율화합니다. 또는 조직 전체의 데이터를 통합하여 접근성을 높이고 비용을 낮추며 보다 정확한 데이터 기반 의사결정을 내릴 수 있도록 합니다.

Hadoop 에코시스템 살펴보기

IBM 및 Hadoop 기능

Hadoop으로 시작하기

데이터의 양과 속도 및 다양성이 기하급수적으로 증가하고 있으므로 Hadoop의 인기가 날로 상승하고 있습니다. IBM은 Hadoop 기반 데이터 레이크에 대한 액세스를 구축, 관리, 제어 및 최적화하는 데 도움이 되는 솔루션과 제품을 보유하고 있습니다.

IBM Hadoop 전문가와 상담하여 IBM의 고객이 AI 및 사물인터넷(IoT) 이니셔티브로 발생한 오늘날의 고급 분석 니즈에 대한 실시간 분석 요구사항을 성취하는 방법에 대해 배웁니다.

IBM Hadoop 전문가와의 만남을 보여주는 그림

Hadoop의 잠재력을 최적화하는 솔루션 구축

리소스