本篇是对HBase官方参考文档的大体翻译,介于本人英文水平实在有限,难免有纰漏之处。本篇不只是对官方文档的翻译,还加入了一些本人对HBase的理解。在翻译过程中,一些没有营养的废话,我就忽略了没有翻译。本篇按照 2016年 5、6 月 最新版的 进行翻译,此时:
而 stable 文件夹中的内容:
---------------------------------------------------------------------------------------------------------------------------------------------
Getting Started(准备开始)
1、简介
文档将带你搭建和运行一个单节点、单实例的HBase,随后是一个伪分布式的单机实例,最后是一个完全分布式的集群。
2、快速开始--单机模式HBase
本指南描述的是在本地文件系统中搭建单机模式下的HBase。对于一个HBase生产环境下的实例来说,这是不恰当的配置,但是,在本地测试情况下运行是允许的。本章节将要像你展示使用HBase shell 命令创建一个表,插入数据,对表进行put和scan操作,enable 或者 disable 表,并且运行和停止HBase。除去下载HBase,整个过程应该不超过十分钟。
在本地文件系统下使用HBase不保证耐久性。如果文件未正常关闭,本地HDFS文件系统实现将丢失编辑的内容。当你试用新软件时这是很有可能发生的,经常启动和停止守护进程通常是并不干净的。你需要确保在HDFS运行HBase所有的写入是已经保存了的。针对本地文件系统的运行能够让你快速熟悉怎样生产系统任务,获取第一阶段的评价。关于本地文件系统上的问题更详尽的描述,请访问 HBASE-3696 。
在HBase 0.94.X 版本之前,HBase期望的IP地址是 127.0.0.1。Ubuntu及一些其他分支默认是 127.0.0.1,这将给你带来麻烦。
*** Example 1. 对于Ubuntu,HBase 0.94.x及早期版本正确的配置如下。如果你陷入困境,请使用如下配置。
127.0.0.1 localhost 127.0.0.1 ubuntu.ubuntu-domain ubuntu
2.1、JDK版本要求
*** HBase 0.98.5 及 更新版本,必须在集群的每一个节点设置JAVA_HOME。hbase-env.sh提供了一个便利的机制。
2.2、开始使用HBase
步骤:下载,配置,启动。
(1)、从 Apache Download Mirrors 列表中选择一个下载站。它为你提供HBase发布版的镜像。点击名为“stable”的文件夹,然后下载以“.tar.gz”结尾的二进制文件到本地文件系统。在HBase 1.X版本之前,一定要选择你可能用到的Hadoop的更迟版本对应的HBase版本(大部分情况下,你应该选择hadoop 2.X版本的,类似hbase-0.98.13-hadoop2-bin.tar.gz)。暂时不下载以 “src.tar.gz”结尾的文件。
(2)、解压下载文件,并打开目录。
$ tar xzvf hbase-<?eval ${project.version}?>-bin.tar.gz $ cd hbase-<?eval ${project.version}?>/
(3)、对于HBase 0.98.5 及之后版本,在启动HBase前,你需要设置JAVA_HOME环境变量。在HBase 0.98.5之前,如果没有设置环境变量,HBase尝试检测Java的位置。你可以通过操作系统的一般机制来设置环境变量,但HBase提供一个中枢机制 conf/hbase-env.sh 。编辑该文件,取消 JAVA_HOME 前的注释符,并设置你本机适当的位置。
*** 这个指令假设集群的每个节点都采用同样的配置。如果不一致,你需要单独设置每个节点。
(4)、编辑 conf/hbase-site.xml 这个HBase主配置文件。这时候,你仅需要指定本地文件系统中HBase和Zookeeper写数据的目录即可。默认是在/tmp目录下新建一个目录。许多机器在重启后是会删除/tmp目录内容的,所以你需要存储数据到别处。下面的配置将存储HBase的数据在testuser用户主目录下的hbase目录。在标签<configuration>下粘贴<property>标签,在一个新安装的HBase中这应该是个空的。你不要创建HBase数据目录。HBase会为你这么做。如果你创建了目录,HBase会迁移,而这不是你想要的。
*** Example 2. HBase的单例模式的 hbase-site.xml 配置: