关于Hadoop的API写文件的备份数问题

今天用Hadoop API打算往hadoop集群创建几个文件,然后写入数据试试,结果问题发生了,我的配置文件备份数是1,但是不管我怎么创建,创建的文件备份数都是3。代码如下:

public static void testHDFS() throws IOException{
  String str="hdfs://cloudgis4:9000/usr/tmp/";
  Path path=new Path(str);
  Configuration conf=new Configuration();
  FileSystem hdfs=path.getFileSystem(conf);
  long begin=System.currentTimeMillis();
  for(int i=0;i<10000;i++){
   byte [] kkk=new byte[10000+1*i];
   FSDataOutputStream fsDataOut=hdfs.create(new Path(str+i));
   fsDataOut.write(kkk);
   fsDataOut.close();
   //hdfs.close();
  }
  long end=System.currentTimeMillis();
  System.out.println("hdfs:"+(end-begin));
 }

很奇怪,上网搜了一下发现了这个API:setReplication。用了这个之后,创建的文件备份数还是3,搜了下这个API的使用,发现这个API只能更改已经存在的文件的备份数。如果先创建再修改备份,无疑增加了框架的负担。后来想了想,明明配置文件修改成了1,那么就应该是这个应用程序没有读取配置文件。所以手动读取下配置文件就可以了。

conf.addResource(new Path("/usr/local/hadoop/conf/hdfs-site.xml"));

ps:hbase 权威指南上有这样一句话:

If you are configuring an IDE to run an HBase client, you could include the conf/

directory on your classpath. That would make the configuration files discoverable by

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/aebd1a250d744c8d514ab311746cd258.html