Weiter zum Inhalt

Review „Building Hadoop Clusters“

4030OS_VideoWie vor einigen Tagen schon einmal angekündigt, habe ich das Video-Tutorial „Building Hadoop Clusters“ zum Review von den netten Kollegen bei PacktPub erhalten.

Mittlerweile habe ich das komplette Tutorial geschaut und muss sagen: Das Tutorial ist hervorragend für wirkliche Anfänger geeignet.

Aber kommen wir zu etwas ausführlicheren Informationen. Das Tutorial ist in 8 Kapitel mit jeweils 3 Videos und zeigt die Installation eines Hadoop 2.0 Clusters in der Amazon Cloud.
In den ersten Kapiteln führt der Autor Sean Mikha ausführlich in die Amazon Web Services (AWS) und die benötigten Linux-Befehle ein, die man für ein minimales Setup benötigt. Die Anweisungen in diesen Kapitel sind wirklich gut aufbereitet und es macht regelrecht Spaß Sean zu folgen. Und das selbst dann, wenn es eigentlich Themen sind, die ich schon kannte (Rechtevergabe, key-based SSH Zugänge etc.). Hier haben sich auch ein paar kleine Flüchtigkeitsfehler eingeschlichen, die aber dem Ganzen nicht schaden. Zum Beispiel empfiehlt der Autor den SSH Service neu zu starten, nur weil die ssh_config angepasst wurde. Das werde ich mit ihm jedoch noch einmal konkret persönlich besprechen – er ist sehr kontaktfreudig, wenn es um sein Tutorial geht.

Mit dem Kapitel 6 wird das Tutorial „endlich“ sehr Hadoop spezifisch. Es wird beschrieben, wie mithilfe des Ambari Projectes ein Cluster mit 3 Nodes aufgebaut und überwacht werden kann. Der im Tutorial betonte Punkt, dass man minimum „large“ Instanzen nutzen soll, kann ich nur unterstreichen. Die Fehler treten bereits beim Installieren auf. Leider sind die „large“ Instanzen nicht Teil des kostenlosen AWS Programmes. Allerdings sprechen wir hier über wenige Cents, solange die angelegten Instanzen auch immer brav wieder heruntergefahren bzw. terminiert werden, wenn sie nicht mehr gebraucht werden.
Wer übrigens auch darüber stolpert, dass die empfohlene AMI nicht mehr existiert, keine Sorge. Wählt einfach ein anderes CentOS 6.2 Image von RightImage aus, damit funktioniert es dann auch.

Den einzig wirklich negativen Punkt den ich zu dem gesamten Tutorial habe ist das Fehlen von weiterführenden Informationen, wo zum Beispiel die Befehle bzw. Kommandoabfolgen für die Optimierungen noch einmal zur Verfügung gestellt werden. Denn gerade die letzten Videos sind doch recht schwer zu verfolgen, wenn ich versuche das Gezeigte direkt anzuwenden.

Also: Das Training ist hervorragend für den Entwickler geeignet, der bis jetzt noch überhaupt keinen Kontakt mit AWS und Haddop Clustern hatte. Für mich hätte der Teil mit den Linux Setup Instruktionen deutlich kürzer sein können, aber hey, ich gehöre auch nicht 100%-ig der Zielgruppe an.

 

Wer jetzt Lust auf das Training bekommen hat, kann noch 7 Tage lang 10% sparen. Einfach den Code CETNUJK beim Bestellen eingeben. Der Code gilt noch bis zum 7.7.2014.

Kommentar verfassen

Dein E-Mail wird nicht veröffentlicht oder weitergegeben. Pflichtfelder sind mit * markiert.

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close