hadoop備戰：yarn框架的搭建（mapreduce2）

阿新 • • 發佈：2018-11-23

author welcome start profile handler prope indent 好用機器名

昨天沒有寫好了沒有更新。今天一起更新，yarn框架也是剛搭建好的。

我這裏把hadoop放在了我的個人用戶hadoop下了。你也能夠嘗試把它放在/usr/local,考慮的問題就相對多點。

主要的軟硬件配置：

x86臺式機，window7 64位系統

wmware虛擬機(x86的臺式機至少是4G內存，才幹開2臺虛機)

centos6.4操作系統

hadoop-2.2.0.tar.gz

jdk-6u24-linux-i586.bin

WinScp 遠程文件傳輸工具，非常好用。能夠用於windows和虛擬機

Linux之間文件相互拷貝。

一、root下的配置

a) 改動主機名：vi /etc/sysconfig/network

Master, slave1,

b) 解析Ip: vi /etc/hosts

由於採用的是Host-only連接網絡，主機上Vmnet1的ip:192.168.137.1

192.168.137.50 master

192.168.137.55 slave1

c) 調試網絡：
採用自定的vmnet1,默認是host-only這樣的方式。連接網絡，配置網絡。

改動後記得調用 service network restart

確保三臺虛擬機能夠相互ping

通。（非常好弄的，我如今的問題怎樣讓虛擬機連接外網，我會在近期的博客中。弄清楚，繼續關註我的博客）

d) 關閉防火墻
查看：service iptables status

關閉：service iptables stop

查看防火墻有無自啟動：

Chkconfig –-list | grep iptables

關閉自啟動：

Chkconfig iptables off

二、hadoop用戶下的配置

a) 創建用戶hadoop,設置password，進入用戶

useradd hadoop

passwd hadoop

b) master創建公私秘鑰

分別在兩臺虛擬機上生成：ssh-keygen –t rsa.

.ssh是一個隱藏的文件 #cd .ssh可進入

1)將id_rsa.pub復制給authorized_keys

Cp id_rsa.pub authorized_keys

2)將master中的authorized_keys復制給slave1的/home/hadoop/.ssh下

scp authorized_keys [email protected]:/home/hadoop/.ssh/

3)將master拷貝過來的authorized_keys拷貝到slave1本身所創的authorized_keys下

4）驗證ssh的免password生效：

a)能夠嘗試發個小文件給對方機器。假設沒有提示要求password。那麽你的免password就生效了。

b)也能夠直接ssh+對方機器名（hostname改過之後），能夠進入對方用戶環境則說明生效。

c) 將hadoop拷貝拷貝到相應的master機子中/home/hadoop/

配置hadoop用戶的環境變量 vi /etc/profile,加入例如以下內容：

#set java enviroment

export JAVA_HOME=/usr/local/jdk

export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin

# Hadoop

export HADOOP_PREFIX="/home/hadoop/hadoop"

export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin

export HADOOP_COMMON_HOME=${HADOOP_PREFIX}

export HADOOP_HDFS_HOME=${HADOOP_PREFIX}

export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}

export HADOOP_YARN_HOME=${HADOOP_PREFIX}

註：su + username實現切換用戶。

d) 編輯/home/hadoop/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/local/jdk

e) 編輯/home/hadoop/etc/hadoop/yarn-env.sh

export JAVA_HOME=/usr/local/jdk

f) 編輯/home/hadoop/etc/hadoop/core-site.xml

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>



<value>/home/hadoop/hadoop/tmp</value>

</property>

g) 編輯/home/hadoop/etc/hadoop/hdfs-site.xml

<property>

<name>dfs.replication</name>



<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>



<value>file:/home/hadoop/hadoop/dfs/namenode</value>

<final>true</final>

</property>

<property>

<name>dfs.datanode.data.dir</name>



<value>file:/home/hadoop/hadoop/dfs/datanode</value>

</property>

h) 編輯/home/hadoop/hadoop/etc/hadoop/yarn-site.xml

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

h) 編輯/home/hadoop/hadoop/etc/hadoop/mapred-site.xml

註：默認沒有mapred-site.xml文件，copy mapred-site.xml.template 一份為 mapred-site.xml就可以

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

<final>true</final>

</property>

三、啟動和測試

1、啟動Hadoop

1.1、第一次啟動須要在Master.Hadoop 運行format ： hdfs namenode -format ：

格式化成功，你能找到一句話：

1.2、在Master.Hadoop運行 start-dfs.sh ：

在Slave1驗證啟動進程例如以下：

1.3、在Master運行 start-yarn.sh ：

在Slave1 驗證啟動進程例如以下：

四、演示案例：（單詞計數）

1）先實現以下的生成文件夾命令：

2）本地創建三個文件 micmiu-01.txt、micmiu-03.txt、micmiu-03.txt, 分別寫入例如以下內容：

micmiu-01.txt：

Hi Michael welcome to Hadoop

more see micmiu.com

micmiu-02.txt：

Hi Michael welcome to BigData

more see micmiu.com

micmiu-03.txt：

Hi Michael welcome to Spark

more see micmiu.com

3）然後cd 切換到Hadoop的share/hadoop/mapreduce下運行

[hadoop@master mapreduce]$ hadoop jar hadoop-mapreduce-examples-2.2.0.jar wordcount /user/micmiu/wordcount/in /user/micmiu/wordcount/out

ps: hdfs 中 /user/micmiu/wordcount/out 文件夾不能存在否則運行報錯。

5）到此 wordcount的job已經運行完畢。運行例如以下命令能夠查看剛才job的運行結果：

hadoop的童鞋們，有問題加關註，評價中說明問題。

hadoop備戰：yarn框架的搭建（mapreduce2）

author welcome start profile handler prope indent 好用機器名昨天沒有寫好了沒有更新。今天一起更新，yarn框架也是剛搭建好的。我

springboot 專案框架搭建（一）：新增定時任務

ps: 在我們的專案開發過程中，經常需要定時任務來幫助我們來做一些內容，springboot預設已經幫我們實行了，只需要新增相應的註解就可以實現一.構建專案，如圖所示：建立一個用於執行定時任務的介面，以及一個介面的實現類。二.添加註解

ONVIF學習-ONVIF開發框架搭建（C++）

nts red port ice 框架搭建代碼 nal tails 服務器第一步、下載gsoap 從gsoap官網（http://www.genivia.com/products.html#notice）下載最新版gsoap（博主用的是gsoap_2.8.45

Hybrid開發框架搭建（一）PhoneGap簡介

本系列部落格將介紹採用PhoneGap、Backbone、Seajs、Ratchet和SPM等js庫或工具搭建一個Web主體型的Hybrid模式的移動應用開發框架。 Phonegap是一款開源的開發框架，旨在讓開發者使用HTML、Javascript、CSS等Web&nb

webpack前端自動化框架搭建（一）

1.建立資料夾webpack_demo 2.執行cmd cd webpack_demo 3.初始化npm管理package.json npm init 4.建立如下資料夾目錄 5.在根目錄下建立webpack.config.j

AngularJs前端框架搭建（一）

(持續更新) 寫在最前面，從實習到畢業後這大半年來都是在現在所在的公司工作，才開始接觸公司的專案時，後端都是用的熟悉的知識，然後前端卻用了從來沒聽說過得angularjs，從開始接觸到現在，也算是會熟練的寫裡面的內容了吧。但是整體還是很迷糊，最近正好有個自己的

ssm框架搭建（三）-controller層-springMVC

mvc層，控制檢視層。主要負責與頁面的互動。最後的檔案結構圖首先是Controller層：UserController.java package com.ssm.controller; import org.springframework.b

框架搭建（五）單獨配置hibernate

1.匯入dtd檔案約束，自行百度查，一抓一大把 2.建立一個包，匯入我們需要的實體類&orm元資料例如： 2.配置主配置檔案，hibernate.cfg.xml  <property nam

Spring boot 2.0 結合常用框架搭建（一）

Spring boot 2.0釋出有一段時間了，本文一系列主要是說自己在搭建框架時的一些心得體會，使用了Spring boot 2.0+Mybatis+MySql+redis+shiro等等一系列成熟框架吧！idea 建立新專案選spring boot 2.0 ,這裡都不說

STS（Spring Tool Suite）下SSM（Spring+SpringMVC+Mybatis）框架搭建（二）

搭建 div 圖片 control 網盤 ext lmap wid 方便繼完成controller配置並使用controller實現頁面跳轉，現連接數據庫進行登錄。在SSM框架中，使用Mybatis與數據庫連接，因此需要配置關於mybatis的配置。廢話少說直接開始

【java】SSM框架搭建（一）——idea搭建maven聚合工程

一、前言以前開發的java使用的是Eclipse開發的，前一段時間換成了idea。還有點不習慣，然後自己就研究了一下如何使用idea搭建 maven的聚合工程。二、架構說明

android MVP + dagger2 + Retrofit + Rxjava+okhttp android基礎專案框架搭建（2）--之MVP引入

上一篇文章中，我們已經成功的引入了Dagger2;今天我們將繼續使用android MVP模式對程式碼進行實現。#1 將MainActivity.java檔案移動到ui包下，並在ui包下建立view包； view包下存放介面。包及類結構如圖 2 新建presenter包，

【從零開始搭建自己的.NET Core Api框架】（三）集成輕量級ORM——SqlSugar：3.3 自動生成實體類

i++ 點運算自己的 yui content project style ref 數據庫表系列目錄一. 創建項目並集成swagger 　　1.1 創建　　1.2 完善二. 搭建項目整體架構三. 集成輕量級ORM框架——SqlSugar 　　3.1 搭建環境　

搭建eclipse+tomcat+maven+shiro+springmvc+jpa專案（二）：基本框架搭建

1、pom.xml配置 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://m

Maven專案搭建（二）：Maven搭建SSM框架

上一章給大家講解了如何使用Maven搭建web專案。這次給大家介紹一下怎麼使用Maven搭建SSM框架專案。首先我們來看一下pom.xml的屬性介紹：

Maven項目搭建（二）：Maven搭建SSM框架

mod ring 交互插件 license plugin res myba put 上一章給大家講解了如何使用Maven搭建web項目。這次給大家介紹一下怎麽使用Maven搭建SSM框架項目。首先我們來看一下pom.xml的屬性介紹：

【YARN】Hadoop YARN框架搭建

前提配置 Yarn架構配置【mapred-site.xml.temple配置】先重新命名為mapred-site.xml <configuration> <propert

（1）Hadoop筆記：Hadoop2.X搭建和配置

注： 1.環境為linux CentOS release 6.6 (Final)，非虛擬機器。 2.Hadoop版本2.8.3 3.JDK版本1.8.0_111 4.Hadoop的搭建分為三種形式：單機模式、偽分佈模式、完全分佈模式，本文為偽分佈模式。

Hadoop+spark+jupyter環境搭建（三）：Pyspark+jupyter部署在Linux

Hadoop+spark+jupyter環境搭建順序請參照：我們已經實現了Spark on Yarn的搭建，但我們還希望有一個友好的開發介面，也便於展示成果，因此我們選擇了jupyter。他的本質就是一個 web app，也支援多種語言，完全滿足我們的要求。1.安裝

Python3+Selenium2完整的自動化測試框架實現（一）：自動化測試環境搭建

添加在線安裝自動化 eight str rain 中間自動打開發的 1 環境搭建準備（1）下載Python3版本的安裝包，直接官網下載即可：Python官網：https://www.python.org/ （2）下載Python的基礎工具包

hadoop備戰：yarn框架的搭建（mapreduce2）

主要的軟硬件配置：

一、root下的配置

二、hadoop用戶下的配置

三、啟動和測試

四、演示案例：（單詞計數）

相關推薦