1. 程式人生 > >Hadoop3 新特性、埠號的改變(二)

Hadoop3 新特性、埠號的改變(二)

Hadoop版本

  • Haddoop1.x
  • Haddoop2.x
  • Haddoop3.x

Haddoop3.0 GA 版本於2017年12月份正式釋出下面來說一下版本號後面的字尾表示的含義

  • Alpha:內部測試版
  • Beta:對外測試版(有點像iphone釋出最新ios11的時候都會先發布Beta版本讓大家去測試)
  • GA:general availability 官方正式釋出版
  • Release 釋出版
    所以我們在工程上要用 GA 版本

Hadoop 3 新特徵

  • 基於JDK1.8(最低版本要求)
  • 剔除過期的API和實現,廢棄hftp轉為webhfs替代
  • Classpath isolation:新增的防止不同版本 jar 包衝突
  • Shell重寫 (修復了Hadoop2指令碼的bug,啟動時的指令碼命令也有不同,建議執行Hadoop3的指令碼,大概有三分之一的地方不一樣)
  • 支援HDFS的擦除編碼 Erasure Encoding:預設EC策略可以節省50%的儲存空間,同時還可以承受更多的儲存故障(還在Haddoop2的基礎上增加恢復功能)
  • DataNode 內部添加了負載均衡 Disk Balancer,磁碟之間的負載均衡(假定有3臺伺服器的磁碟都滿了資料,資料儲存在DataNode當中,可以在買一塊磁碟插入,但其他磁碟還是滿的,新磁碟是空的,這就產生了資料傾斜,所以Hadoop3提供了 Disk Balancer 磁碟平衡器自動幫我們將滿磁碟分配到其他磁碟當中)
  • MapReduce任務級本地優化
  • MapReduce記憶體引數自動推斷
    • mapreduce.{map,reduce}.memory.mb和mapreduce.{map,reduce}.java.opts (在Hadoop2中是需要配置這兩項,但在3中就會根據任務執行級別自動推斷所需要的記憶體,所以3比2要快)
    • 基於 cgroup 的記憶體隔離和 IO Disk 隔離
    • 支援更改分配容器的資源 Container resizing

Hadoop 3 埠號的改變

分類 應用 Haddop 2.x port Haddop 3 port
NNPorts Namenode 8020 9820
NNPorts NN HTTP UI 50070 9870
NNPorts NN HTTPS UI 50470 9871
SNN ports SNN HTTP 50091 9869
SNN ports SNN HTTP UI 50090 9868
DN ports DN IPC 50020 9867
DN ports DN 50010 9866
DN ports DN HTTP UI 50075 9864
DN ports Namenode 50475 9865