Hadoop3 新特性、埠號的改變(二)
阿新 • • 發佈:2018-11-25
Hadoop版本
- Haddoop1.x
- Haddoop2.x
- Haddoop3.x
Haddoop3.0 GA 版本於2017年12月份正式釋出下面來說一下版本號後面的字尾表示的含義
- Alpha:內部測試版
- Beta:對外測試版(有點像iphone釋出最新ios11的時候都會先發布Beta版本讓大家去測試)
- GA:general availability 官方正式釋出版
- Release 釋出版
所以我們在工程上要用 GA 版本
Hadoop 3 新特徵
- 基於JDK1.8(最低版本要求)
- 剔除過期的API和實現,廢棄hftp轉為webhfs替代
- Classpath isolation:新增的防止不同版本 jar 包衝突
- Shell重寫 (修復了Hadoop2指令碼的bug,啟動時的指令碼命令也有不同,建議執行Hadoop3的指令碼,大概有三分之一的地方不一樣)
- 支援HDFS的擦除編碼 Erasure Encoding:預設EC策略可以節省50%的儲存空間,同時還可以承受更多的儲存故障(還在Haddoop2的基礎上增加恢復功能)
- DataNode 內部添加了負載均衡 Disk Balancer,磁碟之間的負載均衡(假定有3臺伺服器的磁碟都滿了資料,資料儲存在DataNode當中,可以在買一塊磁碟插入,但其他磁碟還是滿的,新磁碟是空的,這就產生了資料傾斜,所以Hadoop3提供了 Disk Balancer 磁碟平衡器自動幫我們將滿磁碟分配到其他磁碟當中)
- MapReduce任務級本地優化
- MapReduce記憶體引數自動推斷
- mapreduce.{map,reduce}.memory.mb和mapreduce.{map,reduce}.java.opts (在Hadoop2中是需要配置這兩項,但在3中就會根據任務執行級別自動推斷所需要的記憶體,所以3比2要快)
- 基於 cgroup 的記憶體隔離和 IO Disk 隔離
- 支援更改分配容器的資源 Container resizing
Hadoop 3 埠號的改變
分類 | 應用 | Haddop 2.x port | Haddop 3 port |
---|---|---|---|
NNPorts | Namenode | 8020 | 9820 |
NNPorts | NN HTTP UI | 50070 | 9870 |
NNPorts | NN HTTPS UI | 50470 | 9871 |
SNN ports | SNN HTTP | 50091 | 9869 |
SNN ports | SNN HTTP UI | 50090 | 9868 |
DN ports | DN IPC | 50020 | 9867 |
DN ports | DN | 50010 | 9866 |
DN ports | DN HTTP UI | 50075 | 9864 |
DN ports | Namenode | 50475 | 9865 |