1、 在Apache的官网下载Hadoop的比较稳定的版本,我现在下的是Hadoop0.20.203.0.
2、 配置Java环境。1.6版本以上。
相关阅读:
Ubuntu 7.10下配置Java环境补充笔记(图)
使用VMware安装Hadoop全过程
3、 解压Hadoop,设置conf下的hadoop-env.sh,设置里面的JAVA_HOME=/usr/lib/jvm/java-6-sun.
4、 Export HADOOP_INSTALL=/home/guoguo/hadoop/hadoop-0.20.203.0
5、 Export PATH=$PATH:$HADOOP_INSTALL/bin
6、 检查运行 hadoop version。
7、 如果有版本信息说明安装完成。
8、 设置SSH无密码验证。
a) ssh-keygen –t rsa
b) 路径都按默认的。
c) 进入 /home/guoguo/root/.ssh目录。
d) cat id_rsa.pub > authorized_keys
9、 分别配置core-site.xml、hdf-site.xml、mapred-site.xml。
a) conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
b) conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
c) conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
10、配置masters和slaves文件。因为是伪分布模式,所以两个都用127.0.0.1
11、编辑主机名 /etc/hosts加入
a) 127.0.0.1 master
b) 127.0.0.1 slave
12、启动hadoop(hadoop命令在hadoop目录的bin目录下)
a) hadoop namenode –format
b) start-all.sh
13、 在WEB下查看Hadoop的工作情况
a) :50070
b) :50030