1. 程式人生 > >hdfs的副本放置策略

hdfs的副本放置策略

For the common case, when the replication factor is three, HDFS’s placement policy is to put one replica on the local machine if the writer is on a datanode, otherwise on a random datanode, another replica on a node in a different (remote) rack, and the last on a different node in the same remote rack.

以上是hadoop官網中hdfs模組的副本放置的描述,可以看出: 在預設情況下,一個檔案有三個副本。當writer(執行寫請求的客戶端)在datanode上時,第一個副本寫在本機上;當writer沒在datanode上時,隨機選一個機架裡的datanode放置。第二個副本放在和第一個副本不同的機架上的隨機daanode上。第三個副本和第二個副本在同一個機架,但是在不同的datanode上。