Hadoop运行任务(Job)小结:第三方jar包、hadoop jar命

有一个问题是:好像通过eclipse提交的程序并没有在集群上执行,而是在本机上执行了。

2、在命令下运行

首先需要将程序打成jar包,我用的eclipse写程序,也就用eclipse打包了,如果工程中包含第三方的jar包,可以用一个插件

Fat Jar Eclipse Plug-In

将第三方的jar包一起打出来,下载地址:

手动打入第三方jar包参考:

用scp命令将打好的jar包以及输入文件上传到主节点。

用hadoop的dfs命令将输入文件上传到hdfs:

$ hadoop dfs -copyFromLocal localFilePath hdfsPath

用hadoop的jar命令运行任务:

$ hadoop jar ***.jar ***.***.***.MainClassName inputPath outputPath

其中指定主类时,需要把其包路径也指出来

更多Hadoop相关信息见Hadoop 专题页面 ?tid=13

linux

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/ca41142f66c679631393bcd8ee0b2cf0.html