Ubuntu 11.04配置Hadoop0.20.2(3)

1、准备需要进行wordcount的文件

sudo gedit /tmp/test.txt

(打开后随便输入一些内容,如"mu ha ha ni da ye da ye da",然后保存退出)

2、将准备的测试文件上传到dfs文件系统中的firstTest目录下

Hadoop dfs -copyFromLocal /tmp/test.txt firstTest

(注:如dfs中不包含firstTest目录的话就会自动创建一个,关于查看dfs文件系统中已有目录的指令为"hadoop dfs -ls")

3、执行wordcount : hadoop-mapred-example0.20.2.jar wordcount firstTest result

(注:此语句意为“对firstTest下的所有文件执行wordcount,将统计结果输出到result文件夹中”,若result文件夹不存在则会自动创建一个)

4、查看结果

hadoop dfs -cat result/part-r-00000

(注:结果文件默认是输出到一个名为“part-r-*****”的文件中的,可用指令“hadoop dfs -ls result”查看result目录下包含哪些文件)

至此单节点环境搭建完成!

结果图:

Ubuntu 11.04配置Hadoop0.20.2

Ubuntu 11.04配置Hadoop0.20.2

Ubuntu 11.04配置Hadoop0.20.2


 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/20c7b2c6452ba3e59fd4b9a9b9d48cd4.html