YARN叢集-historyserver
阿新 • • 發佈:2018-12-22
目錄
簡介
我們經常會向yarn叢集上提交任務,但是任務執行完後,我們就不能再檢視log檔案了。此時我們可以開啟historyserver,實現yarn叢集上歷史任務的儲存。
配置
非高可用(HA)模式的配置
1.修改%HADOOOP_HOME/etc/hadoop/yarn-site.xml檔案
<property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>2592000</value> </property> <property> <name>yarn.log.server.url</name> <value>http://node01:19888/jobhistory/logs</value> </property> <property> <name>yarn.nodemanager.remote-app-log-dir</name> <value>hdfs://node01:9000/user/hpe/yarn-logs/</value> </property>
yarn.nodemanager.remote-app-log-dir是檔案存放位置,可以是本地位置,也可以是HDFS上的位置,建議是存放在HDFS上。檔案存放在HDFS上,目錄一定要存在。
配置名 | 描述 |
---|---|
yarn.log-aggregation-enable | 是否啟用日誌聚合。 日誌收集聚合 每個容器的日誌,這些日誌移動到檔案系統 |
yarn.log-aggregation.retain-seconds | 日誌儲存時間 |
yarn.log.server.url | 為日誌聚合伺服器URL |
yarn.nodemanager.remote-app-log-dir | 日誌存放目錄 |
高可用(HA)模式的配置
<property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>2592000</value> </property> <property> <name>yarn.log.server.url</name> <value>http://node01:19888/jobhistory/logs</value> </property> <property> <name>yarn.nodemanager.remote-app-log-dir</name> <value>hdfs://mycluster/user/hpe/yarn-logs/</value> </property>
mycluster是在hdfs-site.xml中配置的dfs.nameservices的值。注意:高可用模式後面不要加埠號了。
開啟
1.重啟yarn叢集
#先關閉yarn叢集
stop-yarn.sh
start-yarn.sh
2.開啟historyserver
mr-jobhistory-daemon.sh start historyserver
3.檢視程序
jps可以看到JobHistoryServer程序。
然後就可以自己嘗試提交任務了。任務結束後去頁面http://node01:8088檢視歷史任務。
如果能夠看到這些日誌,那麼historyserver服務就開啟成功了。