Hadoop企業開發場景案例，虛擬機器伺服器調優

阿新 • • 發佈：2021-03-17

## Hadoop企業開發場景案例 ### 1 案例需求（1）需求：從1G資料中，統計每個單詞出現次數。伺服器3臺，每臺配置4G記憶體，4核CPU，4執行緒。（2）需求分析： 1G/128m = 8個MapTask；1個ReduceTask：1個mrAppMaster 平均每個節點執行10個/3臺 ≈ 3個任務（4 3 3） ### 2 HDFS引數調優（1）修改：hadoop-env.sh ``` shell export HDFS_NAMENODE_OPTS = "-Dhadoop.security.logger=INFO,RFAS -Xmx1024m" export HDFS_DATANODE_OPTS = "-Dhadoop.security.logger=ERROR,RFAS -Xmx1024m" ``` （2）修改：hdfs-site.xml ```shell ``` （3）修改core-site.xml ```shell ``` （4）將配置分發到三臺伺服器上 ``` shell rsync -av 分發的檔名稱使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 3 MapReduce 引數調優（1）修改mapred-site.xml ``` shell ``` （2）伺服器分發配置檔案 ```shell rsync -av 分發的檔名稱使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 4 Yarn引數調優（1）修改Yarn-site.xml ```shell ``` （2）伺服器分發配置檔案 ```shell rsync -av 分發的檔名稱使用者名稱@主機名稱:儲存配置檔案地址 ``` ### 10.3.5 執行程式（1）重啟叢集 ```shell sbin/stop-yarn.sh sbin/start-yarn.sh ``` （2）執行 WordCount 程式 ```shell hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput ``` 說明：在hadoop資料夾下執行命令，/input 為要統計的 1G 資料所在的資料夾目錄，/output 為要輸出統計結果的資料夾目錄。（3）觀察 Yarn 任務執行頁面網址：hadoop103:8088 （4）執行結果 /wcinput/work.txt原內容： ![](https://img2020.cnblogs.com/blog/2199087/202103/2199087-20210316213057410-490673413.png) 執行結果：生成資料夾/wcoutput ![](https://img2020.cnblogs.com/blog/2199087/202103/2199087-20210316213049494-755101326.png) ##### 加入QQ群：947117563，一起加入小猿森林吧！！群裡可以摘果實

Hadoop企業開發場景案例，虛擬機器伺服器調優

Hadoop企業開發場景案例，虛擬機器伺服器調優

HotSpot虛擬機器GC調優指南

JVM（JAVA虛擬機器）調優及原理

關於Java虛擬機器效能調優方法的一些分析

windows虛擬機器效能調優

一句話解決Ping問題（主機，開發板，虛擬機器）

Hadoop叢集環境搭建（雲伺服器，虛擬機器都適用）

scrapy | scrapy-redis實現分散式爬取：原理，實戰案例（虛擬機器）

【完全分散式Hadoop】（一）從虛擬機器Centos6.5的安裝開始

VirtualBox 虛擬機器和宿主機之間的網路連線，虛擬機器和主機都可以上網

Nginx實戰 1.7-1.11 Nginx架構分析，虛擬機器配置

Linux安裝，虛擬機器VMware-workstation安裝CentOS作業系統的安裝手冊

【搭建Hadoop叢集看一篇成高手系列01】hadoop執行環境的搭建篇——虛擬機器準備

mac的虛擬機器上安裝wampserver，mac訪問虛擬機器伺服器

使用qemu-img管理虛擬機器磁碟映象（建立虛擬機器，虛擬機器快照）

用VMware建立Linux系統時使用者名稱，全名，虛擬機器名的區別

2018年最新JAVA架構師包含技術總綱-微服務，高併發，分散式，效能優化，spring，mybatis底層原始碼，虛擬機器，基礎框架架構，系統架構

VMware下CentOS6.5在NAT網路模式下虛擬機器之間互訪，虛擬機器和主機互訪

ubuntu作業系統，虛擬機器掛起，繼續執行虛擬機器後，無網路連線，該怎麼辦？

linux命令中rz sz命令無法使用，虛擬機器出現亂碼

Hadoop企業開發場景案例，虛擬機器伺服器調優

相關推薦