1.先去Hadoop官网下载hadoop的源码
2.下载maven3,当前hadoop的最新版必须使用maven3编译
3.到hadoop下载源码目录执行mvn clean install;mvn eclipse:eclipse;
4.将源码导入eclipse;
5.在eclipse设置执行的WordCount.java的jvm启动参数,最少需要两个,输入目录和输出目录
6.然后就可以设置断点进行调试了,我们在处理mapreduce的主干流程上设置断点
org.apache.hadoop.mapred.LocalJobRunner这个类的run方法上
我们看到在我们设置的输入输出目录,然后使用默认的hadoop单机配置下,mapTask有16个,reduceTask有1个
我们先看看我们的输入目录,刚好是16个文件,说明每个输入文件默认启动一个mapTask