Mancomún

Apache Hadoop: HBase

Martes, 24 Marzo 2009

HBaseHBase é o nome da base de datos do proxecto Hadoop . Trátase dun produto de código aberto de almacenamento distribuído e orientado a columnas, segundo o modelo exposto no documento de Google Bigtable: Un Sistema de Almacenamento Distribuído para Datos Estruturados .

Do mesmo modo que Bigtable emprega o almacenamento de datos distribuído que lle proporciona o Sistema de Ficheiros de Google (coñecido como Google File System , ou GFS), HBase é quen de ofrecer características similares ás de Bigtable empregando por debaixo a infraestrutura de Hadoop.

O obxectivo de HBase é lograr o almacenamento de táboas realmente grandes, con milleiros de millóns de filas e millóns de columnas, funcionando sobre unha infraestrutura de agrupamentos de computadores correntes.

HBase ten os seguintes requirimentos:

  • Java 1.6 , a ser posible a versión de Sun
  • Hadoop 0.19.x
  • ssh debe estar instalado, e o servidor sshd funcionando, para empregar os scripts de xestión remota de daemons de Hadoop
  • É necesario facer uns retoques no ficheiro /etc/security/limits.conf
  • Os reloxos dos nodos do agrupamento deben estar razoablemente sincronizados. Aconséllase empregar NTP

 Nesta ligazón pódese atopar unha guía para comezar a traballar con HBase.

Xunta

Xunta de Galicia, Información mantida e publicada na internet pola Xunta de Galicia

Atención á cidadanía - Accesibilidade - Aviso legal - Mapa do portal