ZooKeeper é o compoñente de Hadoop que se encarga de coordinar as distintas tarefas que se han executar nun contorno Hadoop. ZooKeeper é un servizo de coordinación de alto rendemento para aplicativos distribuídos. Presenta os servizos comúns – tales como xestión, configuración, sincronización… – nunha interface simple, para que non haxa que escribir estes servizos dende cero.
Está deseñado para que sexa sinxelo programar con el, e emprega un modelo de datos ao estilo das estruturas de directorios en árbore dos sistemas de ficheiros. Funciona en Java, e existen vinculadores (bindings) para as linguaxes Java e máis C .
Hive é unha infraestrutura de almacenamento de datos construída na cimeira do proxecto Hadoop que proporciona ferramentas que permiten resumos de datos, consultas personalizadas, e análise de grandes conxuntos de datos almacenados nos ficheiros dentro dun sistema Hadoop. Tamén proporciona un mecanismo para estruturar estes datos, e unha linguaxe simple de consultas chamada Hive QL , baseada en SQL .
Ao mesmo tempo, esta linguaxe permítelles tamén aos programadores do paradigma Mapreduce acoplar os seus propios mapeadores e redutores para levar a cabo análises máis sofisticadas que non estean incluídas nas capacidades internas da linguaxe.
