0%

大数据平台CDH简介

简介

不收费的Hadoop版本主要有三个(均是国外厂商),分别是:

  • Apache(最原始的版本,所有发行版均基于这个版本进行改进)
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH
  • Hortonworks版本(Hortonworks Data Platform,简称HDP

比较

版本 优点 缺点
Apache社区版 完全开源免费、社区活跃、文档、资料详实 1. 版本管理比较混乱,各种版本层出不穷,很难选择,选择其他生态组件时,比如Hive,Sqoop,Flume,Spark等,需要考虑兼容性问题、版本匹配问题、组件冲突问题、编译问题等。2. 集群安装部署复杂,需要编写大量配置文件,分发到每台节点,容易出错,效率低。3. 集群运维复杂,需要安装第三方软件辅助。
CDH 1. 版本管理清晰。2. 版本更新快。3. 集群安装部署简单。提供了部署、安装、配置工具,大大提高了集群部署的效率.运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。 厂商固定

CDH安装

参考以下链接: