Hadoop 添加删除datanode及tasktracker

日期：2020-10-31 栏目：程序人生浏览：次

首先：

建议datanode和tasktracker分开写独立的exclude文件，因为一个节点即可以同时是datanode和tasktracker，也可以单独是datanode或tasktracker。

1、删除datanode

修改namenode上的hdfs-site.xml

<property> <name>dfs.hosts</name> <value>/usr/local/hadoop/conf/datanode-allow-list</value> </property> <property> <name>dfs.hosts.exclude</name> <value>/usr/local/hadoop/conf/datanode-deny-list</value> </property>

其中dfs.host列出了连入namenode的节点，如果为空，则所有的datanode都可以连入namenode。如果不为空，则文件中存在的datanode可以连入。

dfs.hosts.exclude列出了禁止连入namenode的节点。

如果一个节点同时存在于dfs.hosts和dfs.hosts.exclude，则禁止连入。

具体步骤

（1）将要删除的datanode加入到dfs.hosts.exclude指定的文件中。（最好使用主机名，IP有时可能不生效）

（2）动态刷新配置，不需要重启namenode

hadoop dfsadmin -refreshNodes

（3）通过hadoop dfsadmin -report或webui，可以看到，该datanode的状态为Decommissioning

（4）等待一段时间，该节点为dead状态。

（5）删除dfs.hosts文件中该节点

（6）

hadoop dfsadmin -refreshNodes

注：按照上面的操作后，如果你想要重新启用该节点为datanode，从dfs.hosts.exclude中删除该节点，refreshNodes，然后，到该节点上，重启启动该datanode：

/usr/local/hadoop/bin/hadoop-daemon.sh stop datanode /usr/local/hadoop/bin/hadoop-daemon.sh start datanode

注:正确的删除datanode的方法应该是按照上面的方法，使用exclude文件，而不应该直接去datanode上去sotp datanode，这样会造出数据丢失，而且stop以后，webui和hadoop dfsadmin -report都仍然显示该datanode节点。除非重新启动namenode。

之所以重新启用exclude的节点时可以stop datanode，因为此时该datanode不包含在cluster中，所以，stop后不会造成数据丢失。

2、添加datanode

如果存在dfs.hosts文件，且不为空，则添加新的datanode到该文件中，refreshNodes。

到新节点上，启动即可

/usr/local/hadoop/bin/hadoop-daemon.sh start datanode

如果不存在dfs.hosts文件，或文件为空，直接启动新节点即可。

3、删除tasktracker

原理和步骤与删除datanode一样。

<property> <name>mapred.hosts</name> <value>/usr/local/hadoop/conf/tasktracker-allow-list</value> </property> <property> <name>mapred.hosts.exclude</name> <value>/usr/local/hadoop/conf/tasktracker-deny-list</value> </property>

动态刷新配置的命令为：

hadoop mradmin -refreshNodes

立刻生效，可以在webui中看到，nodes节点数量的变化，以及Excluded Nodes节点的变化。

转载注明出处：http://www.heiqu.com/d4d50e942cd965a71f692432dd0ec958.html

Hadoop 添加删除datanode及tasktracker

相关推荐