Ubuntu单机安装配置Hadoop

因为是课程要求,所以在自己电脑上安装了Hadoop,由于没有使用虚拟机,所以使用单机模拟Hadoop的使用,可以上传文件,下载文件。

1.安装配置JDK

Ubuntu 18.04是自带Java1.8的,你可以在命令行输入java -version查看,如果你想重新配置的话请查看以下的教程。

1.下载JDK

单击下载地址进行下载

Ubuntu单机安装配置Hadoop

下载之前点击 Accept License Agreement, 然后下载 jdk-12_linux-64_bin.tar.gz


2.解压JDK

进行下载目录,打开terminal,输入
tar zxvf jdk-12_linux-64_bin.tar.gz

将解压后的文件夹移动到 /usr/local 文件夹中,在命令行中输入如下命令
sudo mv jdk-12_linux-64_bin /usr/local

jdk-12_linux-64_bin 为你解压后得到的文件夹,如果和你的不一样,清按实际情况进行修改。

3.配置Java环境

在terminal中输入如下命令
sudo gedit ~/.bashrc

在文件末尾写入如下内容
export JAVA_HOME=/usr/local/jdk-12_linux-64_bin
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

然后在terminal中输入如下命令
source ~/.bashrc

4.测试Java安装是否成功

在terminal中输入如下命令
java -version

如果配置成功的话会显示出java 的版本,再继续输入如下命令
javac

配置成功的话会显示出可以使用的命令


2.下载hadoop

请单击下载地址进行下载

下载 hadoop-2.7.6.tar.gz 这个版本,有需要可以下载其他版本

3.解压到 /opt 目录(如果有需要可以改为其他目录,后面的操作也要陆续修改)

打开terminal进入下载目录,执行命令
tar -zxvf hadoop-2.7.6.tar.gz  -C /opt/

4.配置hadoop环境变量

打开命令行,输入如下命令
sudo gedit /etc/profile

在文件中添加如下代码
export HADOOP_HOME=/opt/hadoop-2.7.6
export PATH=$PATH:$HADOOP_HOME/bin 

在命令行中执行如下命令
source /etc/profile

5.配置hadoop

5.1配置hadoop-env.sh

在命令行中执行如下命令
sudo gedit /opt/hadoop-2.7.6/etc/hadoop/hadoop-env.sh

找到# The java implementation to use.将其下面的一行改为:
export JAVA_HOME=/usr/local/jdk-12_linux-64_bin

如果你没有按照我上面的步骤安装java,清填写你自己的java路径

5.2 配置core-site.xml (5.2和5.3中配置文件里的文件路径和端口随自己习惯配置)

其中的IP:192.168.44.128为虚拟机ip,不能设置为localhost,如果用localhost,后面windows上用saprk连接服务器(虚拟机)上的hive会报异常

在命令行输入 ifconfig查看自己的ip地址,在下面的代码中将 192.168.44.128 改为你自己的ip就可以了

在命令行中输入如下命令
sudo gedit /opt/hadoop-2.7.6/etc/hadoop/core-site.xml

在打开的文件中添加如下内容
<configuration>
<property>
        <name>hadoop.tmp.dir</name>
        <value>file:///opt/hadoop-2.7.6</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.44.128:8888</value>
    </property>
</configuration>

保存并关闭文件,然后在命令行中输入以下命令
sudo gedit /opt/hadoop-2.7.6/etc/hadoop/hdfs-site.xml

在打开的文件中修改如下内容
<configuration>
        <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:///opt/hadoop-2.7.6/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:///opt/hadoop-2.7.6/tmp/dfs/data</value>
    </property>
</configuration>


6.SSH免密登陆

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/9d41ed77f74403c98ec31dad9fb05c75.html