基于单机的Hadoop伪分布式运行模拟实现(3)

日期：2020-06-06 栏目：程序人生浏览：次

现在，才可以执行Hadoop自带的WordCount列子了，使用下面命令开始提交任务，进入运行：

$ bin/hadoop jar hadoop-0.16.4-examples.jar wordcount input output

最后面两个参数分别为数据输入目录和数据处理完成后的输出目录，这里，不能在你的G:\hadoop-0.16.4目录中存在output这个目录，否则会报错的。

运行过程如图所示：

基于单机的Hadoop伪分布式运行模拟实现

通过上图，可以看出在运行一个Job的过程中，WordCount工具执行任务的进度情况，非常详细。

最后查看执行任务后，处理数据的结果，使用的命令行如下所示：

$ bin/hadoop dfs -cat output/part-00000

输出结果如图所示：

基于单机的Hadoop伪分布式运行模拟实现

最后，停止Hadoop进程，使用如下命令：

$ bin/stop-all.sh

如图所示：

基于单机的Hadoop伪分布式运行模拟实现

以上就是全部的过程了。