CentOS7部署Hadoop2.7.5全分散式群集

阿新 • • 發佈：2019-02-07

思路

安裝虛擬機器
安裝JDK
克隆
安裝HADOOP
配置ssh
搭建hadoop叢集
1. 配置hadoop-env.sh
2. 配置hadoop-core-site.xm
3. 配置hadoop-hdfs-site.xm
4. 配置hadoop-mapred-site.xml
5. 配置hadoop-yarm-site.xml
配置slave
傳送hadoop檔案到所有機子上
測試

安裝虛擬機器

安裝JDK

克隆

我是直接克隆虛擬機器，要是有伺服器或者自安裝也可以。
點選完整克隆
這裡寫圖片描述

安裝HADOOP

配置HADOOP

修改UUID

vim /etc/sysconfig/network-scripts/ifcfg-ens33

這裡寫圖片描述
因為克隆過來的UUID是相同的，可以刪除重新生成，也可以修改其中一個數就可以了，裡面的數值是16進位制的，在這範圍內就可以。

修改計算機名

hostnamectl –static set-hostname hadoop01

這裡寫圖片描述

修改對映

vim /etc/hosts

192.168.164.137 hadoop01 www.hadoop01.com
192.168.164.136 hadoop02 www.hadoop02.com
192.168.164.138 hadoop03 www.hadoop03.com

這裡寫圖片描述
CentOS7克隆之後IP地址是自動分配的，所以不需要自己設定
查詢本機IP

ifconfig

檢驗是能聯通，在win的cmd ping一下
這裡寫圖片描述
改名之後可以通過名字來在虛擬機器之間通訊

配置SSH

cd /root/.ssh
ssh-keygen -t rsa

ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03
# hadoop01,hadoop02,hadoop03是我的主機名，主機名自己設定的

搭建全分佈環境

規劃

主機名稱	IP地址	功能
hadoop01	192.168.164.137	NameNode,DataNode,ResourceManager,NodeManager
hadoop02	192.168.164.136	DataNode,NodeManager
hadoop03	192.168.164.138	DataNode,NodeManager

所有機子都需要配置
1.JDK 2.SSH免登陸 3.Hadoop叢集

配置hadoop-env.sh

vim /usr/local/hadoop-2.7.5/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64
export HADOOP_CONF_DIR=/usr/local/hadoop-2.7.5/etc/hadoop/

配置core-site.xml

vim /usr/local/Hadoop-2.7.5/etc/Hadoop/core-site.xml

<configuration>
<!-- configuration hdfs file system namespace -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop01:9000</value>
    </property>
<!-- configuration hdfs cache size of the operation -->
    <property>
        <name>io.file.buffer.size</name>
        <value>4096</value>
    </property>
<!-- configuration hdfs Temporary data storage directory -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/mshing/bigdata/tmp</value>
    </property>
</configuration>

配置hdfs-site.xml

vim /usr/local/hadoop-2.7.5/etc/hadoop/hdfs-site.xml

<configuration>

    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/hadoopdata/dfs/name</value>
    </property>

    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>

    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/hadoopdata/dfs/data</value>
    </property>

    <property>
        <name>dfs.chechpoint.dir</name>
        <value>/home/hadoop/hadoopdata/checkpoint/dfs/cname</value>
    </property>

    <property>
        <name>dfs.http.address</name>
        <value>hadoop01:50070</value>
    </property>

    <property>
        <name>dfs.secondary.http.address</name>
        <value>hadoop01:50090</value>
    </property>

    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>false</value>
    </property>

    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>

</configuration>

配置mapred-site.xml

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
vim etc/hadoop/mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        <final>true</final>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop01:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop01:19888</value>
    </property>
</configuration>

配置yarn-site.xml

vim etc/hadoop/yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>hadoop01:8032</value>
    </property>
    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>hadoop01:8030</value>
    </property>
    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>hadoop01:8031</value>
    </property>
    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>hadoop01:8033</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>hadoop01:8088</value>
    </property>
</configuration>

配置slaves

vim etc/hadoop/slaves

這裡寫圖片描述

遠端分發到伺服器上

scp -r /usr/local/hadoop-2.7.5/ hadoop02:/usr/local/
scp -r /usr/local/hadoop-2.7.5/ hadoop03:/usr/local/

啟動之前需要格式化

啟動之前，在namenode伺服器上先格式化，只需格式化一次就好了

hadoop namenode -format

這裡寫圖片描述

測試

啟動namenode,datanode,ResourceManager,NodeManager節點

全啟動：

start-all.sh

模組啟動：

start -dfs.sh
start -yarn.sh

單個程序啟動/停止：

hadoop-damon.sh start/stop namenode
hadoop-damons.sh start/stop datanode
yarn-damon.sh start/stop namenode
yarn-damons.sh start/stop namenode
mr-jobhistory-daemon.sh start/stop historyserver

驗證
在三臺機子分別輸入

jps

就可以看到啟動的程序了

CentOS7部署Hadoop2.7.5全分散式群集

思路安裝虛擬機器安裝JDK 克隆安裝HADOOP 配置ssh 搭建hadoop叢集配置hadoop-env.sh 配置hadoop-core-site.xm 配置hadoop-hdfs-site.xm 配置hadoop-mapred-site.xm

CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程）

CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程） CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程）經過幾天的嘗試，終於在CentOS7下安裝hadoop，實現偽分散式，並且測試成功現在簡要的回訴一篇，以方便記憶

Spark處理框架搭建【VM15 + CentOS7 + Hadoop2.7.5 + Scala2.12.7 + Spark2.3.1】

一、目的二、準備工作三、安裝過程 1 解除安裝Linux自帶的jdk 檢視系統自帶的jdk [[email protected] ~]# java -version openjdk version "1.8.0_161" OpenJDK Runt

Centos7.5搭建Hadoop2.8.5完全分散式叢集

一、基礎環境設定 1. 準備4臺客戶機（VMware虛擬機器）系統版本：Centos7.5 192.168.208.128 ——Master 192.168.208.129 ——Slaver-1 192.168.208.130 ——Slaver-2 192.168.208.130 ——Slaver-3

基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。一、所需硬體，軟體要求使用 VMWare構建三臺虛擬機器模擬真實物理環境作業系統：CentOS6.5 二、必備條件 hadoop搭建需

hbase1.2.3+zookeeper3.4.9+hadoop2.7.3完全分散式部署遇到的問題

啟動start-hbase.sh 後hbase沒有啟動檢視日誌如下： ERROR [main] master.HMasterCommandLine: Master exiting java.io.IOException: Could not start ZK with 3

Hadoop2.7.5 +Spark2.3.0+Anaconda2-5.1.0分散式叢集搭建

這幾天因為學習需要搭建了一個由3個節點組成的hadoop和spark分散式叢集，做記錄如下（已生成目錄，可按需檢視）。叢集搭建環境及安裝軟體版本 centos6 jdk1.8.0_161 hadoop2.7.5 Spark2.3.0 Scala-2.11.8 An

CentOS7下搭建hadoop2.7.3完全分散式

這裡搭建的是3個節點的完全分散式，即1個nameNode，2個dataNode，分別如下： CentOS-master nameNode 192.168.11.128 CentOS-node1 dataNode 192.168.11.131 Cen

centos7系統單機安裝部署hadoop2.6.5

今天單機安裝部署Hadoop，就順便記錄一下安裝過程1 首先需要下載jdk和hadoop的安裝包我安裝的版本是Hadoop-2.6.5.tar.gz（注意不要下載成hadoop-2.6.5-src.tar.gz）和jdk-8u162-linux-x64.tar.gz2 安裝j

Hadoop2.7.5+Hbase1.2.6完全分散式搭建

1.叢集安裝主機名MasterzookeeperregionServerMaster11Slave1備份11Slave2112.ssh（在Hadoop分散式搭建中已經完成）3.修改Master中Hbase的conf目錄下regionservers檔案，類似於Hadoop修改s

windows下部署Hadoop2.7.4

windows hadoop一、環境 windows 7 64bit jdk 1.8 hadoop 2.7.4 下載地址：http://hadoop.apache.org/releases.html二、步驟 1）下載並安裝jdk，，記得設置好JAVA_HOME系統環

CentOS6.7 安裝hadoop2.7.5

hadoop單機版安裝一、下載hadoop二進制包下載地址：http://mirrors.hust.edu.cn/apache/hadoop/common/二、環境準備1、安裝JDK(1.8.0_151)2、安裝openssh-clients註意： CentOS6.7 默認沒有安裝openssh-client

Centos7 安裝hadoop2.7.3和jdk1.8

配置 tin source 沒有 https prope font col 配置環境變量下載好hadoop和jdk軟件包，傳到虛擬機上第一步：安裝jdk並配置環境變量解壓 tar -xvf 配置環境變量 vim /etc/profile #set ja

Centos7 下 mysql5.7-mmm 高可用群集

主從復制 replica 數據 balance 預熱日誌文件 monitor 文件 ase Centos7 下 mysql5.7-mmm 高可用群集 MMM介紹 MMM( Master- Master replication manager for MYSQL, MYSQ

CentOS7安裝Hadoop2.7.3完整步驟

1.環境，3臺CentOS7，64位，Hadoop2.7需要64位Linux，CentOS7 作業系統二十分鐘就可以安裝完成， Master 192.168.1.32 Slave1 192.168.1.33 Slave2 192.168.1.31 2.(1

hadoop2.7.5單機版安裝及wordCount執行

hadoop2.7.5單機版安裝簡介 Hadoop主要完成兩件事，分散式儲存和分散式計算。 Hadoop主要由兩個核心部分組成： 1.HDFS：分散式檔案系統，用來儲存海量資料。 2.MapReduce：並行處理框架，實現任務分解和排程。 HDFS 是一個分散

滴滴雲部署 Hadoop2.7.7+Hive2.3.4

1.本例叢集架構如下：此處我們使用的是滴滴雲主機內網 IP，如果需要外部訪問 Hadoop，需要繫結公網 IP 即 EIP。有關滴滴雲 EIP 的使用請參考以下連結： https://help.didiyun.com/hc/kb/section/1035272/ M

centos7下Hadoop2.8.4全分佈搭建之HDFS叢集搭建（一）

1)搭建前的準備注意：（以下操作可以先配置一臺，然後通過scp命令傳送到其他兩臺虛擬機器上傳送到其他機器 scp -r 主機名: 注意:載入環境變數 source /etc/profile

CentOS7安裝Hadoop2.7.3完整流程及總結

一、前言配置一臺master伺服器，兩臺（或多臺）slave伺服器; master可以無密碼SSH登入到slave; 解除安裝centos7自帶的openjdk,通過SecureCRT的rz命令上傳jdk-7u79-linux-x64.tar.gz檔案到伺

hadoop2.7.4 完全分散式搭建(4臺)

1. 叢集的規劃描述：hadoop HA機制的搭建依賴與zookeeper，所以選取三臺當作zookeeper叢集，總共準備了4臺主機，分別是hadoop01,hadoop02,hadoop03,hadoop04，其中hadoop01和hadoop02做namenode主

CentOS7部署Hadoop2.7.5全分散式群集

思路

安裝虛擬機器

安裝JDK

克隆

安裝HADOOP

配置HADOOP

修改UUID

修改計算機名

修改對映

配置SSH

搭建全分佈環境

配置hadoop-env.sh

配置core-site.xml

配置hdfs-site.xml

配置mapred-site.xml

配置yarn-site.xml

配置slaves

遠端分發到伺服器上

啟動之前需要格式化

測試

相關推薦