1. 程式人生 > >Hadoop企業開發場景案例,虛擬機器伺服器調優

Hadoop企業開發場景案例,虛擬機器伺服器調優

## Hadoop企業開發場景案例 ### 1 案例需求 ​ (1)需求:從1G資料中,統計每個單詞出現次數。伺服器3臺,每臺配置4G記憶體,4核CPU,4執行緒。 ​ (2)需求分析: ​ 1G/128m = 8個MapTask;1個ReduceTask:1個mrAppMaster ​ 平均每個節點執行10個/3臺 ≈ 3個任務(4 3 3) ### 2 HDFS引數調優 ​ (1)修改:hadoop-env.sh ``` shell export HDFS_NAMENODE_OPTS = "-Dhadoop.security.logger=INFO,RFAS -Xmx1024m" export HDFS_DATANODE_OPTS = "-Dhadoop.security.logger=ERROR,RFAS -Xmx1024m" ``` ​ (2)修改:hdfs-site.xml ```shell ``` ​ (3)修改core-site.xml ```shell ``` ​ (4)將配置分發到三臺伺服器上 ``` shell rsync -av 分發的檔名稱 使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 3 MapReduce 引數調優 ​ (1)修改mapred-site.xml ``` shell ``` ​ (2)伺服器分發配置檔案 ```shell rsync -av 分發的檔名稱 使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 4 Yarn引數調優 ​ (1)修改Yarn-site.xml ```shell ``` ​ (2)伺服器分發配置檔案 ```shell rsync -av 分發的檔名稱 使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 10.3.5 執行程式 ​ (1)重啟叢集 ```shell sbin/stop-yarn.sh sbin/start-yarn.sh ``` ​ (2)執行 WordCount 程式 ```shell hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput ``` 說明:在hadoop資料夾下執行命令,/input 為要統計的 1G 資料所在的資料夾目錄,/output 為要輸出統計結果的資料夾目錄。 ​ (3)觀察 Yarn 任務執行頁面 ​ 網址:hadoop103:8088 ​ (4)執行結果 ​ /wcinput/work.txt原內容: ![](https://img2020.cnblogs.com/blog/2199087/202103/2199087-20210316213057410-490673413.png) ​ 執行結果:生成資料夾/wcoutput ![](https://img2020.cnblogs.com/blog/2199087/202103/2199087-20210316213049494-755101326.png) ##### 加入QQ群:947117563,一起加入小猿森林吧!!群裡可以摘果實