基于单机的Hadoop伪分布式运行模拟实现(3)

现在,才可以执行Hadoop自带的WordCount列子了,使用下面命令开始提交任务,进入运行:

$ bin/hadoop jar hadoop-0.16.4-examples.jar wordcount input output  

最后面两个参数分别为数据输入目录和数据处理完成后的输出目录,这里,不能在你的G:\hadoop-0.16.4目录中存在output这个目录,否则会报错的。

运行过程如图所示:

基于单机的Hadoop伪分布式运行模拟实现

通过上图,可以看出在运行一个Job的过程中,WordCount工具执行任务的进度情况,非常详细。

最后查看执行任务后,处理数据的结果,使用的命令行如下所示:

$ bin/hadoop dfs -cat output/part-00000  

输出结果如图所示:

基于单机的Hadoop伪分布式运行模拟实现

最后,停止Hadoop进程,使用如下命令:

$ bin/stop-all.sh

 

如图所示:

基于单机的Hadoop伪分布式运行模拟实现

以上就是全部的过程了。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/pxpfx.html