简介
不收费的Hadoop版本主要有三个(均是国外厂商),分别是:
- Apache(最原始的版本,所有发行版均基于这个版本进行改进)
- Cloudera版本(
Cloudera’s Distribution Including Apache Hadoop
,简称CDH
) - Hortonworks版本(
Hortonworks Data Platform
,简称HDP
)
比较
版本 | 优点 | 缺点 |
---|---|---|
Apache社区版 | 完全开源免费、社区活跃、文档、资料详实 | 1. 版本管理比较混乱,各种版本层出不穷,很难选择,选择其他生态组件时,比如Hive,Sqoop,Flume,Spark等,需要考虑兼容性问题、版本匹配问题、组件冲突问题、编译问题等。2. 集群安装部署复杂,需要编写大量配置文件,分发到每台节点,容易出错,效率低。3. 集群运维复杂,需要安装第三方软件辅助。 |
CDH | 1. 版本管理清晰。2. 版本更新快。3. 集群安装部署简单。提供了部署、安装、配置工具,大大提高了集群部署的效率.运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。 | 厂商固定 |
CDH安装
参考以下链接: