Hadoop配置多个硬盘

Hadoop的文档里明确提出了不需要使用RAID(见)。hadoop本身的冗余机制使得RAID的冗余机制变得多余了。

并且根据一篇文章《why not use RAID?》的描述:在Yahoo Hadoop Cluster的Benchmark中,测试Gridmix显示使用JBOD相比RAID能提高写性能10%以上。

#How_do_I_set_up_a_hadoop_node_to_use_multiple_volumes.3F

修改hdfs-site.xml的dfs.data.dir
<property>
  <name>dfs.data.dir</name>
  <value>/data0,/data1</value>
</property>

更多Hadoop相关信息见Hadoop 专题页面 ?tid=13

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/2f8fecccc4c5f94d8addbe539ed11eec.html