现在,才可以执行Hadoop自带的WordCount列子了,使用下面命令开始提交任务,进入运行:
$ bin/hadoop jar hadoop-0.16.4-examples.jar wordcount input output
最后面两个参数分别为数据输入目录和数据处理完成后的输出目录,这里,不能在你的G:\hadoop-0.16.4目录中存在output这个目录,否则会报错的。
运行过程如图所示:
通过上图,可以看出在运行一个Job的过程中,WordCount工具执行任务的进度情况,非常详细。
最后查看执行任务后,处理数据的结果,使用的命令行如下所示:
$ bin/hadoop dfs -cat output/part-00000
输出结果如图所示:
最后,停止Hadoop进程,使用如下命令:
$ bin/stop-all.sh
如图所示:
以上就是全部的过程了。