大数据平台CDH简介


简介

不收费的Hadoop版本主要有三个(均是国外厂商),分别是:

  • Apache(最原始的版本,所有发行版均基于这个版本进行改进)
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH
  • Hortonworks版本(Hortonworks Data Platform,简称HDP

比较

版本 优点 缺点
Apache社区版 完全开源免费、社区活跃、文档、资料详实 1. 版本管理比较混乱,各种版本层出不穷,很难选择,选择其他生态组件时,比如Hive,Sqoop,Flume,Spark等,需要考虑兼容性问题、版本匹配问题、组件冲突问题、编译问题等。2. 集群安装部署复杂,需要编写大量配置文件,分发到每台节点,容易出错,效率低。3. 集群运维复杂,需要安装第三方软件辅助。
CDH 1. 版本管理清晰。2. 版本更新快。3. 集群安装部署简单。提供了部署、安装、配置工具,大大提高了集群部署的效率.运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。 厂商固定

CDH安装

参考以下链接:


文章作者: wuzhiyong
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 wuzhiyong !
评论
 上一篇
vmware虚拟机意外关机后启动报错 vmware虚拟机意外关机后启动报错
虚拟机意外关机后启动报错 以独占方式锁定此配置文件失败。可能其它正在运行VMware进程在使用此配置文件 解决办法任务管理器 -> 启动 -> VMware Tray Process -> 禁用重启机器VMware Tr
2020-06-18
下一篇 
flink部署【高可用】 flink部署【高可用】
多机部署Flink standalone 集群部署前要注意的要点 每台机器上配置好java以及JAVA_HOME环境变量 最好挑选一台机器,和其他机器ssh 打通 每台机器上部署的Flink binary的目录要保证是同一个目录 如果需要用
2020-06-09
  目录