Hadoop 1.2.1 单节点安装(Single Node Setup)步骤

日期：2020-08-10 栏目：程序人生浏览：次

一安装的前提条件

1.平台要求

(1). hadoop全面支持GNU/Linux,并且已经演示过部署在GNU/Linux上超过2000个节点的集群。

(2). Win32 仅支持作为开发平台，hadoop的分布式相关功能并未在Win32 上作全面测试，因此不建议在产品环境中使用win32平台。

2.软件要求

Linux和windows上都需要安装以下软件:

(1)必须安装JavaTM 1.6.x,最好是sun的.

(2)必须安装SSH，SSHD需要开启，hadoop脚本才能管理远程实例(remote Hadoop daemons)

另外:

Windows上必须安装Cygwin.

3.安装以上软件

Ubuntu Linux上安装举例:

$sudoapt-getinstallssh
$sudoapt-getinstallrsync

windows上安装了cygwin后，还需要安装openssh.

二下载最新稳定版hadoop 1.2.1

下载地址：

三准备启动Hadoop集群(单节点)

解压缩下载的hadoop,并编辑conf/hadoop-env.sh文件，将配置项JAVA_HOM设置为你安装的java的当前根目录。

开始运行一下命令:

1 $ bin/hadoop

如果显示的是hadoop命令的帮助，则表示设置正确。

接下来，你可以操作hadoop集群了，hadoop集群有三种模式:

Local (Standalone) Mode(独立模式)

Pseudo-Distributed Mode(伪分布式模式)

Fully-Distributed Mode(分布式模式)

在这里仅介绍前两种模式，第三种模式较复杂，以后单独介绍。

四独立模式使用

默认情况下，hadoop被配置成非分布式模式，即一个java进程，这样方便调试。

下面的命令将hadoop安装目录下的conf目录作为输入，然后将conf目录下的文件中符合给定正则表达式条件的内容找出来。输出即将内容写入指定的输出目录的文件中。

$mkdirinput
$cpconf/*.xml input
$ bin/hadoopjar hadoop-examples-*.jargrepinput output'dfs[a-z.]+'
$catoutput/*