1. 程式人生 > >Hadoop節點的磁碟RAID

Hadoop節點的磁碟RAID

當搭建hadoop叢集的時候首先要注意的是節點的磁碟選型,這對hadoop叢集的讀寫和高可用有著很重要的影響

以下是對Hadoop叢集節點的磁碟配置建議:

  • HDFS NameNode作為重要的節點,其元資料儲存區最好做Raid-1(RAID-5需要至少3塊硬碟),當然較高版本 2.3 later 之後也無需這樣做了,可以對fsimage 和editlog 對目錄掛載在兩塊(也可以多塊)硬碟上,hadoop 會自動備份冗餘資訊的。

  • DataNode不要做Raid,因為在HDFS的軟體層面提供了資料的冗餘,而且如果磁碟陣列出現問題可能會導致整個節點不可用,讀寫效能測試並不如單盤mount的效果好,只需要掛在JBOD,dfs.data.dir配置多個磁碟掛載分割槽即可

  • 所有的節點的OS盤最好兩塊盤做Raid-1,防止os的問題導致節點不可用