1. 程式人生 > >Hadoop中namenode/secondarynamenode/yarn的一些配置

Hadoop中namenode/secondarynamenode/yarn的一些配置

Hadoop在進行namenode -format的前(偽分佈)一般會選擇預設的配置,除了指定備份和tmp目錄。

還有一些其他的配置在真正叢集的時候也是一定要進行配置的。

簡單記錄一下hadoop的主要配置檔案中core-site.xml  / hdfs-site.xml /mapred-site.xml/ yarn-site.xml的配置。

一、core-site.xml

真實環境是需要指定域名而不能是localhost

conf-1

二、hdfs-site.xml

dfs.replication 是備份塊數,這臺機器我是偽分佈安裝的,就給了1塊

permissions是許可權檢查,應該true

namenode.http-address  :  namenode的web地址

namenode.secondary.httpaddress  :  secondary namenode 的web地址

namenode.name.dir :  指定namenode的資料儲存的本地目錄,預設是在tmp下的一個資料夾,單獨拿出來

namenode.name.edits : 同樣的道理

checkpoint就是secondary namenode的資料儲存本地目錄和日誌目錄。

conf-2

三、yarn-site.xml

配置resourcemanager的hostname

配置jobhistory的address

配置webapp的address

conf-3

四、slaves

將slaves中的主機名改成 hadoop-yarn.ptbird.cn 而不是localhost,因為上面配置都是使用的這個地址。

五、注意的問題

如果已經format,重新配置後為了省去麻煩,再次format的時候,最好刪除掉之前/data/dfs/的內容,否則即使format成功了,很多服務也起不來。

最常見的問題是datanode起不來,因為clusterId已經記錄過了,再次format會產生新的clusterId。

最好的做法是:

刪除/data/dfs/*後,重啟,然後再次format。