在Hadoop的文档里明确提出了不需要使用RAID(见)。hadoop本身的冗余机制使得RAID的冗余机制变得多余了。
并且根据一篇文章《why not use RAID?》的描述:在Yahoo Hadoop Cluster的Benchmark中,测试Gridmix显示使用JBOD相比RAID能提高写性能10%以上。
#How_do_I_set_up_a_hadoop_node_to_use_multiple_volumes.3F
修改hdfs-site.xml的dfs.data.dir
<property>
<name>dfs.data.dir</name>
<value>/data0,/data1</value>
</property>
更多Hadoop相关信息见Hadoop 专题页面 ?tid=13