• Dirk deRoos. Hadoop for Dummies. For Dummies, 2014.

На Амазоне эту книгу заклеймили, а напрасно. Читатели не поняли, нафига это покупать и читать.

Целевая аудитория — желающие быстро пройти по верху смысла и архитектуры мира Hadoop. Книга не техническая, скорее, техническо-популярная. Нужна для того, чтобы начать. Это не мануал. Не справочник. Не учебник по Hadoop. Более того, писалось в 2013 году, издано в 2014 году, потому в конце 2015 года многие примеры не работают (привет миру open source, в котором всё меняется).

Первые сто страниц внятно разжуют тему, размягчив порог входа. Дальше десятка полтора глав. Каждая глава — тема или продукт. Например, Hive: 1) что это и зачем, 2) как поставить, 3) как запустить, 4) простые операции, 5) болтовня. Т.к. я точно знал, что мне надо, книга свою задачу выполнила.

Правда, есть нюансы:

  1. Не надо качать и ставить то и так, как они предлагают (VMPlayer, image CentOS и т.д.). Лучше разберитесь с установкой нужных вам запчастей и поставьте сами.
  2. Напоминаю, два года прошло, местами всё уже не так. Как минимум, hwi в Hive не работает (команда в тикетах рекомендует Hue).

Книга даёт быстрое поверхностное представление. С её помощью (знаний из неё) вы не научитесь работать с Hadoop и прочим. Она нужна именно для преодоления порога входа, не более. Дальше надо читать мануалы / учебники / статьи, писать код.

Можно читать. Можно не читать. Если освоить, лишним не будет.