Hadoop2.7.4分散式叢集安裝配置檔案

阿新 • • 發佈：2019-01-10

叢集環境

Hadoop版本為2.7.4
JDK版本1.8.0_144
安裝了三臺虛擬機器分別設定名稱和IP如下

主機名稱	IP地址
master	192.168.1.15
slave01	192.168.1.16
slave02	192.168.1.17

伺服器上安裝hadoop的目錄結構為
/home/使用者名稱/hadoop
software: 存放的是安裝的軟體包
app : 存放的是所有軟體的安裝目錄
hadoop2.7.4就在app目錄下，這裡我的機器的使用者都是null
hadoop主要配置檔案有core-site.xml,hdfs-site.xml,mapred-site.xml，yarn-site.xml
可以瀏覽官網檢視詳細的預設的配置，連結如下

core-default.xml
hdfs-default.xml
mapred-default.xml
yarn-default.xml
也可以通過下載解壓hadoop後在目錄下搜尋*default.xml,找到這些預設配置

安裝Hadoop

下載hadoop並解壓到app目錄下

tar -zxvf hadoop-2.7.4.tar.gz -C ~/hadoop/app

配置Hadoop 環境變數

vim /etc/profile新增

# Hadoop Env
export HADOOP_HOME=/home/null/hadoop/app/hadoop-2.7.4
export 
 PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

修改$HADOOP_HOME/etc/hadoop下的配置檔案

$HADOOP_HOME就是hadoop安裝目錄位置
這裡只是將分散式叢集的一些必要的簡化了的配置羅列出來了，更個性化的配置還是要參照官方文件進行設定

修改hadoop-env.sh檔案

//修改JAVA_HOME路徑為jdk的安裝路徑  
export JAVA_HOME=/home/null/hadoop/app/jdk1.8.0_144

修改yarn-env.sh檔案

//修改JAVA_HOME路徑為jdk的安裝路徑  
export JAVA_HOME=/home/ 
null/hadoop/app/jdk1.8.0_144

修改slaves檔案

master 既作為 NameNode 也作為 DataNode

master  
slave01  
slave02

修改core-site.xml檔案

該檔案可以覆蓋一部分用於控制Hadoop核心的預設的關鍵配置

引數	預設值	解釋
fs.defaultFS	file:///	namenode RPC互動埠
fs.default.name	file:///	被棄用，是用fs.defaultFS代替
hadoop.tmp.dir	/tmp/hadoop-${user.name}	其他臨時目錄的根地址

先在$HADOOP_HOME目錄下手動建立tmp資料夾，等下指定hadoop.tmp.dir為它，hadoop.tmp.dir是hadoop檔案系統依賴的基礎配置，很多路徑都依賴它。hdfs-site-xml中預設配置namenode 和datanode的存放位置的地址就是基於此。 LINUX 系統中，在服務重啟後，/tmp 下的目錄被清空，所以要轉到持久化的地址

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/null/hadoop/app/tmp</value>
    </property>
</configuration>

修改hdfs-site.xml檔案

通過該配置檔案可以修改有關的HDFS的預設配置

引數	預設值	解釋
dfs.replication	3	決定著系統裡面的檔案塊的資料備份個數
dfs.namenode.secondary.http-address	0.0.0.0:50090	secondary namenode服務地址和埠
dfs.namenode.name.dir	file://${hadoop.tmp.dir}/dfs/name	決定namenode的fsimage檔案在本地檔案系統的儲存位置，如果是以逗號分割的目錄列表，將會複製到所有目錄中，冗餘
dfs.datanode.data.dir	file://${hadoop.tmp.dir}/dfs/data	決定datanode的資料塊在本地檔案系統的儲存位置，如果目錄不存在將被建立如果許可權允許的話

<configuration>
    <property>    
        <name>dfs.namenode.secondary.http-address</name>    
        <value>master:50090</value>    
    </property> 
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
</configuration>

副本數目不能大於datanode數目
在core-site.中配置了hadoop.tmp.dir，這裡保持預設即可

修改mapred-site.xml檔案

該檔案中的屬性可以覆蓋用於控制MapReduce任務執行的預設屬性值

引數	預設值	解釋
mapreduce.framework.name	local	MapReduce 作業的執行框架
mapreduce.jobhistory.address	0.0.0.0:10020	MapReduce的歷史伺服器通訊地址
mapreduce.jobhistory.webapp.address	0.0.0.0:19888	MapReduce的歷史伺服器web介面地址

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

預設情況下，Hadoop歷史伺服器是沒有啟動的，我們可以通過下面的命令來啟動Hadoop歷史伺服器

sbin/mr-jobhistory-daemon.sh  start historyserver

修改yarn-site.xml檔案

該檔案中的配置項可以覆蓋用於控制YARN元件中的預設屬性值

引數	預設值	解釋
yarn.nodemanager.aux-services	無	NodeManager上執行的附屬服務。需配置成mapreduce_shuffle，才可執行MapReduce程式
yarn.resourcemanager.hostname	0.0.0.0	ResourceManager的主機名
yarn.resourcemanager.address	${yarn.resourcemanager.hostname}:8032	ResourceManager 對客戶端暴露的地址。客戶端通過該地址向RM提交應用程式，殺死應用程式等
yarn.resourcemanager.scheduler.address	${yarn.resourcemanager.hostname}:8030	ResourceManager 對ApplicationMaster暴露的訪問地址。ApplicationMaster通過該地址向RM申請資源、釋放資源等
yarn.resourcemanager.webapp.address	${yarn.resourcemanager.hostname}:8088	ResourceManager對外web ui地址。使用者可通過該地址在瀏覽器中檢視叢集各類資訊
yarn.nodemanager.resource.memory-mb	8192	NodeManager總的可用實體記憶體。注意，該引數是不可修改的，一旦設定，整個執行過程中不可動態修改。另外，該引數的預設值是8192MB，即使你的機器記憶體不夠8192MB，YARN也會按照這些記憶體來使用
yarn.nodemanager.resource.cpu-vcores	8	NodeManager總的可用虛擬CPU個數

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>1024</value>
    </property>
    <property>
        <name>yarn.nodemanager.resource.cpu-vcores</name>
        <value>1</value>
     </property>
</configuration>

這裡我架設的虛擬機器是1g記憶體1CPU1核的，沒設定最後兩個屬性時，NodeManager啟動報錯記憶體不足
相關問題可以參考我的另外一篇部落格

啟動Hadoop叢集

格式化檔案系統

在master中執行

hdfs namenode -format

啟動NameNode和DataNode

在master $HADOOP_HOME下執行

sbin/.start-dfs.sh

使用jps命令檢視master上的程序如下

DataNode
SecondaryNameNode
NameNode
Jps

使用jps命令分別檢視slave01和slave02上的程序如下

Jps
DataNode

啟動 ResourceManager 和 NodeManager

在master $HADOOP_HOME下執行

sbin/start-yarn.sh

使用jps命令檢視master上的程序如下

DataNode
NodeManager
ResourceManager
SecondaryNameNode
NameNode
Jps

使用jps命令分別檢視slave01和slave02上的程序如下

Jps
NodeManager
DataNode

終於！Hadoop叢集成功啟動

Hadoop2.7.4分散式叢集安裝配置檔案

叢集環境 Hadoop版本為2.7.4 JDK版本1.8.0_144 安裝了三臺虛擬機器分別設定名稱和IP如下主機名稱 IP地址 master 192.168.1.15 slave01 192.168.1.16

CentOS 6.5 安裝 MySQL cluster 7.4.8 的安裝配置

一、準備軟體環境：VMware 10、CentOS 6.5、MySQL cluster 7.4.8 1、兩臺虛擬機器IP分別為192.168.80.140、192.168.80.142 2、節點規劃：節點

CentOS 7.4 64位安裝配置MySQL8.0

第一步：獲取mysql YUM源 image.png 點選下載 image.png 獲取到下載連結：https://repo.mysql.com//mysql80-community-release-el7-1.noarch.rpm 第二步：下載和安

Hadoop分散式叢集安裝配置步驟

之前介紹過Hadoop偽分散式模式的安裝配置步驟，現在記錄一下分散式叢集的安裝配置步驟，本文使用3臺測試伺服器，下面是各伺服器的角色： - node1：NameNode, DataNode, NodeManager - node2：SecondaryNameNode,

ZooKeeper-3.4.6叢集安裝配置

ZooKeeper是一個分散式開源框架，提供了協調分散式應用的基本服務，它向外部應用暴露一組通用服務——分散式同步（Distributed Synchronization）、命名服務（Naming Service）、叢集維護（Group Maintenance）等，簡化分

CentOS7+Hadoop2.7.2(HA高可用+Federation聯邦)+Hive1.2.1+Spark2.1.0 完全分散式叢集安裝

本文件主要記錄了Hadoop+Hive+Spark叢集安裝過程，並且對NameNode與ResourceManager進行了HA高可用配置，以及對NameNode的橫向擴充套件（Federation聯邦） 1VM網路配置將子網IP設定為192.168.1.0：將閘道器設定

Hadoop2.6完全分散式多節點叢集安裝配置

<name>fs.defaultFS</name> <value>hdfs://Master.Hadoop:9000</value> </property> <property> <name>io.fil

分散式ZooKeeper-3.4.10叢集安裝

ZooKeeper是一個為分散式應用所設計的開源協調服務，其設計目的是為了減輕分散式應用程式所承擔的協調任務。它可以為使用者提供同步、配置管理、分組和命名等服務。 jstorm需要zk配合使用，記錄安裝文件。一、基礎環境： JDK　　　：1.8.0_65 （要求

spark-2.4.0-hadoop2.7-高可用(HA)安裝部署

1. 主機規劃主機名稱 IP地址作業系統部署軟體執行程序備註 mini01 172.16.1.11【內網】 10.0.0.11 【外網】

Hadoop2.7.4叢集搭建

HDFS：分散式檔案系統 MAPREDUCE：分散式運算程式開發框架 HIVE：基於HADOOP的分散式資料倉庫，提供基於SQL的查詢資料操作 HBASE：基於HADOOP的分散式海量資料庫

hadoop2.7.4 完全分散式搭建(4臺)

1. 叢集的規劃描述：hadoop HA機制的搭建依賴與zookeeper，所以選取三臺當作zookeeper叢集，總共準備了4臺主機，分別是hadoop01,hadoop02,hadoop03,hadoop04，其中hadoop01和hadoop02做namenode主

Hadoop2.7.4完全分散式環境搭建

軟體版本虛擬機器管理軟體：VMware WorkStation Pro 12.0 作業系統：CentOS 6.7 Hadoop：Hadoop 2.7.4 JDK：jdk-8u65-linux-x64.tar.gz 一、環境準備 1、修改各個節點主機名：vi /e

Hadoop2.7.4安裝部署詳解

Apache Hadoop.Hadoop的版本很特殊，是由多條分支並行的發展著。大的來看分為3個大的系列版本：1.x，2.x，3.x .Hadoop1.0由一個分散式檔案系統HDFS和一個離線計算框架MapReduce組成.Hadoop 2.0則包含一個支援NameNode橫向擴充套件的HDFS，一個資源管

ZooKeeper-3.3.4叢集安裝配置

ZooKeeper分散式模式安裝（ZooKeeper叢集）也比較容易，這裡說明一下基本要點。首先要明確的是，ZooKeeper叢集是一個獨立的分散式協調服務叢集，“獨立”的含義就是說，如果想使用ZooKeeper實現分散式應用的協調與管理，簡化協調與管理，任何分散式應用都可以使用，這就要歸功於Zookee

Hadoop2.7.4在Windows 7(64位)詳細配置(完美版)

hadoop環境搭建相對麻煩，需要安裝虛擬機器過著cygwin什麼的，所以通過查資料和摸索，在window上搭建了一個，不需要虛擬機器和cygwin依賴，相對簡便很多。官網下載JDK 1.8版本配置好java環境官網下載hadoop-2.7.

spark1.6.0+Hadoop2.6.0+Scala-2.11.7 搭建分散式叢集

昨天又搗鼓了一下，網上有些寫得很不錯的教程，自己經過嘗試後覺得需要整理一下。 spark的執行模式有多種(見官網和Spark的Standalone模式安裝部署): local(本地模式)：常用於本地開發測試，本地還分為local單執行緒和local-clu

基於Hadoop2.7.2分散式環境，安裝HBase

1. 下載HBase並解壓縮 ① 到官網下載HBase，下載連結HBase官網下載，1.4.8版本是stable版本，可以選擇下載該版本，本人下載的是hbase-1.4.6-bin.tar.gz 。也有映象下載地址：HBase映象下載 ② 解壓縮HBase

MySql-5.7.17 -winx64的安裝配置

mysql一、下載軟件1. 進入mysql官網，登陸自己的Oracle賬號(沒有賬號的自己註冊一個),下載Mysql-5.7.17，下載地址：http://dev.mysql.com/downloads/mysql/2.將下載好的文件解壓到指定目錄，解壓在E:\mysql-5.7.17-winx64二、安裝

windows下部署Hadoop2.7.4

windows hadoop一、環境 windows 7 64bit jdk 1.8 hadoop 2.7.4 下載地址：http://hadoop.apache.org/releases.html二、步驟 1）下載並安裝jdk，，記得設置好JAVA_HOME系統環

CentOS 7.4 yum方式安裝LAMP環境，並部署WordPress，使用XCache優化性能

yum lamp wordpress centos7 一、安裝LAMP環境：# yum -y install httpd mariadb-server php-mysql php程序包版本：httpd：2.4.6mariadb-server：5.5.56php-mysql（PHP連接MySQL

Hadoop2.7.4分散式叢集安裝配置檔案

叢集環境

安裝Hadoop

下載hadoop並解壓到app目錄下

配置Hadoop 環境變數

修改$HADOOP_HOME/etc/hadoop下的配置檔案

修改hadoop-env.sh檔案

修改yarn-env.sh檔案

修改slaves檔案

修改core-site.xml檔案

修改hdfs-site.xml檔案

修改mapred-site.xml檔案

修改yarn-site.xml檔案

啟動Hadoop叢集

格式化檔案系統

啟動NameNode和DataNode

啟動 ResourceManager 和 NodeManager

相關推薦