大数据常用软件安装指南

一、基础软件安装

Linux 环境下 JDK 安装

Linux 环境下 Python 安装

虚拟机静态 IP 及多 IP 配置

二、Hadoop

Hadoop 单机环境搭建

Hadoop 集群环境搭建

基于 Zookeeper 搭建 Hadoop 高可用集群

三、Spark

Spark 开发环境搭建

基于 Zookeeper 搭建 Spark 高可用集群

四、Storm

Storm 单机环境搭建

Storm 集群环境搭建

五、HBase

HBase 单机环境搭建

HBase 集群环境搭建

六、Flume

Linux 环境下 Flume 的安装部署

七、Azkaban

Azkaban3.x 编译及部署

八、Hive

Linux 环境下 Hive 的安装部署

九、Zookeeper

Zookeeper 单机环境和集群环境搭建

十、Kafka

基于 Zookeeper 搭建 Kafka 高可用集群

版本说明

由于 Apache Hadoop 原有安装包之间兼容性比较差,所以如无特殊需求,本仓库一律选择 CDH (Cloudera's Distribution, including Apache Hadoop) 版本的安装包。它基于稳定版本的 Apache Hadoop 构建,并做了兼容性测试,是目前生产环境中使用最为广泛的版本。

最新的 CDH 5 的下载地址为: 。这个页面很大且加载速度比较慢,需要耐心等待页面加载完成。上半部分是文档链接,后半部分才是安装包。同一个 CDH 版本的不同框架间都做了集成测试,可以保证没有任何 JAR 包冲突。安装包包名通常如下所示,这里 CDH 版本都是 5.15.2 ,前面是各个软件自己的版本 ,未避免出现不必要的 JAR 包冲突,请务必保持 CDH 的版本一致

hadoop-2.6.0-cdh5.15.2.tar.gz hbase-1.2.0-cdh5.15.2 hive-1.1.0-cdh5.15.2.tar.gz

更多大数据系列文章可以参见 GitHub 开源项目数据入门指南

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyyzpd.html