1. 程式人生 > >Apach Hadoop 與 CDH 區別

Apach Hadoop 與 CDH 區別

png arc 清晰 pla 等等 發行版 hadoop構建 升級 存儲

1、Apache Hadoop 不足之處

  • 版本管理混亂
  • 部署過程繁瑣、升級過程復雜
  • 兼容性差
  • 安全性低

2、Hadoop 發行版

  • Apache Hadoop
  • Cloudera’s Distribution Including Apache Hadoop(CDH)
  • Hortonworks Data Platform (HDP)
  • MapR
  • EMR
  • …

3、CDH能解決哪些問題

  • 1000臺服務器的集群,最少要花費多長時間來搭建好Hadoop集群,包括Hive、Hbase、Flume、Kafka、Spark等等

  • 只給你一天時間,完成以上工作?
  • 對於以上集群進行hadoop版本升級,你會選擇什麽升級方案,最少要花費多長時間?
  • 新版本的Hadoop,與Hive、Hbase、Flume、Kafka、Spark等等兼容?

4、CDH簡介 

  • Cloudera‘s Distribution, including Apache Hadoop
  • 是Hadoop眾多分支中的一種,由Cloudera維護,基於穩定版本的Apache Hadoop構建
  • 提供了Hadoop的核心
    – 可擴展存儲
    – 分布式計算

  • 基於Web的用戶界面

技術分享圖片

5、CDH的優點  

  • 版本劃分清晰
  • 版本更新速度快
  • 支持Kerberos安全認證
  • 文檔清晰
  • 支持多種安裝方式(Cloudera Manager方式)

6、CDH安裝方式

  • Cloudera Manager
  • Yum
  • Rpm
  • Tarball

7、CDH下載地址

  • CDH5.4
     http://archive.cloudera.com/cdh5/
  •Cloudera Manager5.4.3:

     http://www.cloudera.com/downloads/manager/5-4-3.html

Apach Hadoop 與 CDH 區別