今天用Hadoop API打算往hadoop集群创建几个文件,然后写入数据试试,结果问题发生了,我的配置文件备份数是1,但是不管我怎么创建,创建的文件备份数都是3。代码如下:
public static void testHDFS() throws IOException{
String str="hdfs://cloudgis4:9000/usr/tmp/";
Path path=new Path(str);
Configuration conf=new Configuration();
FileSystem hdfs=path.getFileSystem(conf);
long begin=System.currentTimeMillis();
for(int i=0;i<10000;i++){
byte [] kkk=new byte[10000+1*i];
FSDataOutputStream fsDataOut=hdfs.create(new Path(str+i));
fsDataOut.write(kkk);
fsDataOut.close();
//hdfs.close();
}
long end=System.currentTimeMillis();
System.out.println("hdfs:"+(end-begin));
}
很奇怪,上网搜了一下发现了这个API:setReplication。用了这个之后,创建的文件备份数还是3,搜了下这个API的使用,发现这个API只能更改已经存在的文件的备份数。如果先创建再修改备份,无疑增加了框架的负担。后来想了想,明明配置文件修改成了1,那么就应该是这个应用程序没有读取配置文件。所以手动读取下配置文件就可以了。
conf.addResource(new Path("/usr/local/hadoop/conf/hdfs-site.xml"));
ps:hbase 权威指南上有这样一句话:
If you are configuring an IDE to run an HBase client, you could include the conf/
directory on your classpath. That would make the configuration files discoverable by