Распределенная обработка данных с помощью Hadoop, Часть 2. Двигаемся дальше

Установка и настройка многоузлового кластера

Из архивов сайта developerWorks

M. Тим Джонс

Дата архивации: 01.04.2019 | Впервые опубликовано: 22.03.2011

В первой части этой серии статей рассказывалось о работе Hadoop в конфигурации с одноузловым кластером. В этой статье мы будем настраивать Hadoop в более сложной конфигурации с несколькими узлами для параллельной обработки данных. В статье будут описаны различные типы узлов, необходимые для построения многоузловых кластеров, а также работа процедур MapReduce в параллельной среде. Также будут рассмотрены вопросы администрирования Hadoop – как с помощью интерфейса командной строки, так и с помощью Web-интерфейсов.

Этот контент больше не обновляется и не поддерживается. Полный текст статьи предоставляется "как есть" в формате PDF. Учитывая стремительное развитие технологий, некоторые шаги и иллюстрации могут быть изменены.



static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=Linux, Open source, Технология Java
ArticleID=642900
ArticleTitle=Распределенная обработка данных с помощью Hadoop: Часть 2. Двигаемся дальше
publish-date=03222011