Hadoop叢集部署實戰

阿新 • • 發佈：2021-07-10

模組

以三臺機器為例，分別為 hadoop000 ，hadoop001，hadoop002 。在這些機器上我需要部署哪些模組呢？

HDFS: NameNode，DataNode
YARN: ResourceManager，NodeManager

如下圖所示：

修改 hostname 與 hosts

以機器1為例，其它機器類似。

修改hostname

vim /etc/hostname

hadoop000

修改ip對映

vim /etc/hosts

192.168.199.100 localhost
192.168.199.100 hadoop000
192.168.199.101 hadoop001
192.168.199.102 hadoop002

注：不能簡單地只copy-paste到其它機器上，需要適當修改。

配置 ssh 登入

首先，每臺機器上需要已安裝 ssh 。

然後，到每臺機器上，分別生成一遍 rsa key pair ：ssh-keygen -t rsa 。

最後，將 public key 拷貝到其它機器上，以機器1為例，其它機器類似。

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop000
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop001
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop002

(注：SSH免密碼登入詳解，可參考這一篇 -> https://www.cnblogs.com/maxstack/p/13609285.html

）

安裝 JDK

首先，在機器1上安裝並配置JDK。

在 hadoop000 上部署 jdk ，download and unzip
將 jdk bin 配置到系統環境變數 bash_profile ，config JAVA_HOME and PATH

然後，將機器1的東西拷貝到其它機器上。（注意拷貝的目錄需要保持一致）

scp -r jdk1.8.0_91 hadoop@hadoop001:~/app/java/
scp -r jdk1.8.0_91 hadoop@hadoop002:~/app/java/

scp ~/.bash_profile hadoop@hadoop001:~/
scp ~/.bash_profile hadoop@hadoop002:~/

部署 Hadoop

和 JDK 類似，先在機器1上配置好，然後拷貝到其它機器上。

1. download hadooop and unzip

2. configuration change

2.1 hadoop-env.sh

配置 JAVA_HOME

JAVA_HOME=XXX

2.2 core-site.xml

配置主節點

<property>
	<name>fs.default.name</name>
	<value>hdfs://hadoop000:8020</value>
</property>

2.3 hdfs-site.xml

配置儲存目錄

<property>
  <name>dfs.namenode.name.dir</name>
  <value>/home/hadoop/app/tmp/dfs/name</value>
</property>

<property>
  <name>dfs.datanode.data.dir</name>
  <value>/home/hadoop/app/tmp/dfs/data</value>
</property>

2.4 yarn-site.xml

配置 yarn

<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
 </property>

<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop000</value>
</property>

2.5 mapred-site.xml

配置 mapreduce 框架

<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>

2.6 slaves

配置從節點

hadoop000
hadoop001
hadoop002

3. copy to other machines

scp -r hadoop-2.6.0-cdh5.15.1 hadoop@hadoop001:~/app/hadoop/
scp -r hadoop-2.6.0-cdh5.15.1 hadoop@hadoop002:~/app/hadoop/

scp ~/.bash_profile hadoop@hadoop001:~/
scp ~/.bash_profile hadoop@hadoop002:~/

4. format namenode

到每臺機器上，格式化 NN

hadoop namenode -format

啟動 Cluster

登入一臺機器，比如 hadoop000 ，啟動HDFS：

./start-dfs.sh

同樣地，啟動 yarn：

./start-yarn.sh

最後，到每臺機器上使用jps，或者使用 UI ，觀察模組啟動情況。

Hadoop叢集部署實戰

模組以三臺機器為例，分別為 hadoop000 ，hadoop001，hadoop002 。在這些機器上我需要部署哪些模組呢？

5000+字硬核乾貨！Redis 分散式叢集部署實戰

原理： Redis叢集採用一致性雜湊槽的方式將叢集中每個主節點都分配一定的雜湊槽，對寫入的資料進行雜湊後分配到某個主節點進行儲存。

docker--redis叢集部署實戰

1.建立網絡卡 docker network create redis --subnet 172.38.0.0/16 2.通過指令碼建立六個redis配置檔案

CentOs7 Hadoop叢集部署

技術標籤：hadoop 前言 Hadoop單節點偽分佈部署參考這篇，本篇來進行真正多節點部署。

使用docker部署hadoop叢集

最近要在公司裡搭建一個hadoop測試叢集，於是採用docker來快速部署hadoop叢集。

Docker部署MongoDB分片+副本集叢集（實戰）

技術標籤：部署運維引言本次實踐部署mongodb叢集，主要借鑑於該部落格（https://blog.csdn.net/weixin_42104521/article/details/103731266）。

Python工程師的大資料之路（七a）Hadoop,ZooKeeper,HIVE,Spark叢集部署

技術標籤：大資料 JDK,Hadoop,ZooKeeper,HIVE,Spark一波流安裝 1、環境說明2、網路配置和免密登入3、環境變數4、MySQL安裝5、解壓Java,Hadoop,ZooKeeper,HIVE,Spark6、配置檔案6.1、Hadoop配置6.2、ZooKeeper配

Dapr + .NET Core實戰（十四）虛擬機器叢集部署 mDNS + Consul

前面我們說了在單機模式下和K8S叢集下的Dapr實戰，這次我們來看看如何在不使用K8S的情況下，在一個傳統的虛擬機器叢集裡來部署Dapr。

大資料Hadoop-Spark叢集部署知識總結（一）

大資料Hadoop-Spark叢集部署知識總結一、啟動/關閉 hadoop myhadoop.sh start/stop 分步啟動：

插曲：Kafka的叢集部署實踐及運維相關

前言上一篇 Kafka 的文章 --- 插曲：大白話帶你認識Kafka 中我們應該已經瞭解了一些關於基礎角色和叢集架構相關的問題，這時候我們應該很想了解一下如何構建生產中的Kafka叢集或者一些相關的運維工具，所以就應運而

Flink 系列（八）—— Flink Standalone 叢集部署

一、部署模式 Flink 支援使用多種部署模式來滿足不同規模應用的需求，常見的有單機模式，Standalone Cluster 模式，同時 Flink 也支援部署在其他第三方平臺上，如 YARN，Mesos，Docker，Kubernetes 等。以下主要介紹

零基礎搭建Hadoop叢集

一、配置虛擬機器器網路（NAT 模式）宿主機ipconfig截圖： Vmnet8網路配置：虛擬機器器網路配置：

Hadoop 系列（五）—— Hadoop 叢集環境搭建

一、叢集規劃這裡搭建一個 3 節點的 Hadoop 叢集，其中三臺主機均部署 DataNode 和 NodeManager 服務，但只有 hadoop001 上部署 NameNode 和 ResourceManager 服務。

Ceph叢集部署

一概述 1.1 背景近期進行公司業務容器化改造，在為kubernetes提供儲存選型方面，在選型中本地儲存不可跨node，NFS共享儲存不好做高可用，因此選型Ceph來為k8s提供儲存類。特此筆記以備後用。

【Hadoop筆記】Hadoop叢集安裝

Hadoop叢集安裝小白剛剛開始學習Hadoop，本文記錄一下Hadoop叢集的安裝過程，不當之處望大佬指出。

MongoDB分片叢集部署詳解

一、環境說明 1、我們prod環境MongoDB的叢集架構是做的分片叢集的部署，但是目前我們沒有分片，即所有資料都在一個分片上，後期如果數量大，需要分配，叢集隨時可以分片，對業務方透明

Flink 叢集搭建,Standalone,叢集部署,HA高可用部署

基礎環境準備3臺虛擬機器器配置無密碼登入配置方法:https://ipooli.com/2020/04/linux_host/

02 . 分散式儲存之FastDFS 高可用叢集部署

單節點部署和原理請看上一篇文章 https://www.cnblogs.com/you-men/p/12863555.html 環境 [Fastdfs-Server]

Hadoop叢集之淺析安全模式

叢集啟動順序： NameNode啟動 NameNode啟動時，首先將映象檔案（Fsimage）載入記憶體，並執行編輯日誌（Edits）中的各項操作。一旦在記憶體中成功建立檔案系統元資料的映像，則建立一個新的Fsimage檔案和一個空的編輯

Kubernetes（k8s）之jenkins實現k8s應用的版本升級和迴歸，k8s叢集部署專案

1、想要實現jenkins一鍵自動釋出程式碼的話，還需要手動在k8s部署一下叢集專案。首先，建立一個deloypment，如下所示：