1. Начало работы с NoSQL

    NoSQL-хранилища данных становятся все более популярными, поскольку они решают проблему масштабируемости в широком плане. Хранилища данных, не использующие схемы (schemaless datastores), фундаментально отличаются от традиционных реляционных баз данных, но использовать их легче, чем можно подумать.

  2. Практическое введение в популярные NoSQL-хранилища данных

    После изучения основ NoSQL можно исследовать более популярные хранилища данных. Познакомьтесь с практическим введением в MongoDB, CouchDB и Amazon SimpleDB, а также с различными вариантами хранилищ Google AppEngine.

  3. Анализ распределенных данных при помощи MapReduce

    Ключевой технологией революции в области обработки данных большого объема является MapReduce – модель программирования и реализация, разработанные компанией Google для обработки широкомасштабных распределенных наборов данных. Исследуйте Apache Hadoop, реализацию MapReduce с открытыми исходными кодами, играющую главную роль в подходе IBM к анализу данных большого объема.

Об этой knowledge path

Модель СУБД является надежной основой для хранения данных в традиционных клиент-серверных архитектурах, но с позиций простоты и дешевизны она плохо масштабируется на несколько узлов. В эпоху масштабируемых Web-приложений, таких как Facebook и Twitter, решение обеспечивают хранилища данных (например, NoSQL), не использующие схемы. Этот сборник из серии Knowledge Path знакомит Java-разработчиков с технологией NoSQL и ролью Apache Hadoop MapReduce в анализе данных большого объема.