HBase é o nome da base de datos do proxecto Hadoop . Trátase dun produto de código aberto de almacenamento distribuído e orientado a columnas, segundo o modelo exposto no documento de Google Bigtable: Un Sistema de Almacenamento Distribuído para Datos Estruturados .
Do mesmo modo que Bigtable emprega o almacenamento de datos distribuído que lle proporciona o Sistema de Ficheiros de Google (coñecido como Google File System , ou GFS), HBase é quen de ofrecer características similares ás de Bigtable empregando por debaixo a infraestrutura de Hadoop.
O obxectivo de HBase é lograr o almacenamento de táboas realmente grandes, con milleiros de millóns de filas e millóns de columnas, funcionando sobre unha infraestrutura de agrupamentos de computadores correntes.
HBase ten os seguintes requirimentos:
- Java 1.6 , a ser posible a versión de Sun
- Hadoop 0.19.x
- ssh debe estar instalado, e o servidor sshd funcionando, para empregar os scripts de xestión remota de daemons de Hadoop
- É necesario facer uns retoques no ficheiro /etc/security/limits.conf
- Os reloxos dos nodos do agrupamento deben estar razoablemente sincronizados. Aconséllase empregar NTP
Nesta ligazón pódese atopar unha guía para comezar a traballar con HBase.
