Hadoop中namenode/secondarynamenode/yarn的一些配置
Hadoop在進行namenode -format的前(偽分佈)一般會選擇預設的配置,除了指定備份和tmp目錄。
還有一些其他的配置在真正叢集的時候也是一定要進行配置的。
簡單記錄一下hadoop的主要配置檔案中core-site.xml / hdfs-site.xml /mapred-site.xml/ yarn-site.xml的配置。
一、core-site.xml
真實環境是需要指定域名而不能是localhost
二、hdfs-site.xml
dfs.replication 是備份塊數,這臺機器我是偽分佈安裝的,就給了1塊
permissions是許可權檢查,應該true
namenode.http-address : namenode的web地址
namenode.secondary.httpaddress : secondary namenode 的web地址
namenode.name.dir : 指定namenode的資料儲存的本地目錄,預設是在tmp下的一個資料夾,單獨拿出來
namenode.name.edits : 同樣的道理
checkpoint就是secondary namenode的資料儲存本地目錄和日誌目錄。
三、yarn-site.xml
配置resourcemanager的hostname
配置jobhistory的address
配置webapp的address
四、slaves
將slaves中的主機名改成 hadoop-yarn.ptbird.cn 而不是localhost,因為上面配置都是使用的這個地址。
五、注意的問題
如果已經format,重新配置後為了省去麻煩,再次format的時候,最好刪除掉之前/data/dfs/的內容,否則即使format成功了,很多服務也起不來。
最常見的問題是datanode起不來,因為clusterId已經記錄過了,再次format會產生新的clusterId。
最好的做法是:
刪除/data/dfs/*後,重啟,然後再次format。