【圖文跟進 】HADOOP 核心設計——負載均衡
阿新 • • 發佈:2018-12-20
hdfs叢集中的每一個datanode上的儲存的資料和自己的硬體佔比是相當的 這個時候我們可以認為這個hdfs叢集是負載均衡的
叢集的執行過程中,有可能造成叢集中的從節點的負載不均衡 如果叢集規模比較小的時候,叢集有自動負載均衡的能力,叢集的 自己在一段時間之後達到相對的負載均衡
叢集實現負載均衡的過程實際上就是資料塊移動的過程(跨節點)
- 714行,預設情況下負載均衡的頻寬,1M/s 很慢的
- 這個速度針對叢集規模比較小的時候可以的
- 叢集規模比較大的時候就不可以了 太慢了
叢集規模大的時候:手動負載均衡 1.start-balancer.sh -t 10% 這個命令不會立即執行 提升負載均衡的響應時效
2.調整頻寬
/start-balancer.sh -t 10% 引數意義:datanode中最大的儲存容量佔比 最小的儲存的容量佔比不超過10% 認為負載均衡的
hadoop01 | 2T | 1T | 50% |
hadoop02 | 2T | 1.1T | 55% |
hadoop03 | 2T | 0.8T | 40% |
55%-40%=15%>10% | 負載均衡 |