Hadoop2.5.2 HA高可靠性集群搭建(Hadoop+Zookeeper)

日期：2020-06-19 栏目：程序人生浏览：次

1.1 Hadoop1.0的单点问题

Hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。在hadoop1时代，只有一个NameNode。如果该NameNode数据丢失或者不能工作，那么整个集群就不能恢复了。这是hadoop1中的单点问题，也是hadoop1不可靠的表现。如下图所示，便是hadoop1.0的架构图；

Hadoop2.5.2 HA高可靠性集群搭建(Hadoop+Zookeeper)

1.2 hadoop2.0对hadoop1.0单点问题的解决

为了解决hadoop1中的单点问题，在hadoop2中新的NameNode不再是只有一个，可以有多个（目前只支持2个）。每一个都有相同的职能。一个是active状态的，一个是standby状态的。当集群运行时，只有active状态的NameNode是正常工作的，standby状态的NameNode是处于待命状态的，时刻同步active状态NameNode的数据。一旦active状态的NameNode不能工作，通过手工或者自动切换，standby状态的NameNode就可以转变为active状态的，就可以继续工作了。这就是高可靠。

1.3 使用JournalNode实现NameNode(Active和Standby)数据的共享

Hadoop2.0中，2个NameNode的数据其实是实时共享的。新HDFS采用了一种共享机制，Quorum Journal Node（JournalNode）集群或者Nnetwork File System（NFS）进行共享。NFS是操作系统层面的，JournalNode是hadoop层面的，我们这里使用JournalNode集群进行数据共享（这也是主流的做法）。如下图所示，便是JournalNode的架构图。

Hadoop2.5.2 HA高可靠性集群搭建(Hadoop+Zookeeper)

两个NameNode为了数据同步，会通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控edit log的变化，把变化应用于自己的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了

1.4 NameNode之间的故障切换

对于HA集群而言，确保同一时刻只有一个NameNode处于active状态是至关重要的。否则，两个NameNode的数据状态就会产生分歧，可能丢失数据，或者产生错误的结果。为了保证这点，这就需要利用使用ZooKeeper了。首先HDFS集群中的两个NameNode都在ZooKeeper中注册，当active状态的NameNode出故障时，ZooKeeper能检测到这种情况，它就会自动把standby状态的NameNode切换为active状态。

下面关于Hadoop的文章您也可能喜欢，不妨看看：

Ubuntu14.04下Hadoop2.4.1单机/伪分布式安装配置教程

CentOS安装和配置Hadoop2.2.0

Ubuntu 13.04上搭建Hadoop环境

Ubuntu 12.10 +Hadoop 1.2.1版本集群配置

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）

Ubuntu下Hadoop环境的配置

单机版搭建Hadoop环境图文教程详解

二.Hadoop（HA）集群的搭建

2.1 配置详细

主机名 IP NameNode DataNode Year Zookeeper JournalNode

mast1 192.168.177.131 是是否是是
mast2 192.168.177.132 是是否是是
mast3 192.168.177.133 否是是是是

2.2 安装jdk

（省略）安装jdk和配置环境变量

2.2 SSH免登录

(省略)，参考：

2.4 Zookeeper集群搭建

（省略），参考，，这是我的solr集群部署，也是使用zookeeper进行管理，zookeeper这里步骤跟操作一模一样，最后我的zoo.cfg文件如下所示

内容版权声明：除非注明，否则皆为本站原创文章。

转载注明出处：https://www.heiqu.com/0b763706b96093d2d8029bac14e9d1f8.html