偽叢集與簡單完全分散式叢集的搭建

阿新 • • 發佈：2018-12-10

我是在root許可權下搭建的流程比較簡單

1.簡單單機Hadoop叢集（偽分散式）搭建流程

下載 JDK 與Hadoop壓縮包，將檔案傳入linux系統中

解壓配置環境：

①首先可以配置JDK與hadopp環境：

自己可以首先建立一個在根目錄下建立一個apps資料夾，將安裝包傳遞到改檔案目錄下

②解壓安裝包

tar -zxvf jdk-7u25-linux-x64.tar.gz

tar -zxvf cenos-6.5-hadoop-2.6.4.tar.gz

配置 ~/.bash_profile

Vi ~/.bash_profile 進入配置環境

JAVA_HOME=/apps/ （我的jdk路徑在test檔案下安）

# User specific environment and startup programs
 JAVA_HOME=/test/java/jdk1.7.0_25
HADOOP_HOME=/apps/hadoop-2.6.4

PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export PATH

Path=*****************:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

Source ~/.bash_profile

載入修改後的配置

修改apps/haoop-2.6.4/etc/下的配置檔案

配置2個檔案 core-site.xml hdfs-site.xml

配置

①Core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://hadoop-1:8020</value>

</property>

②配置hdfs-site.xml

<name>dfs.replication<name> 複製檔案

<value>3</value> 複製檔案的數量

</property>

<name>dfs.namenode.name.dir</name>

<value>/app/hadoop/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/app/hadoop/dfs/data</value>

</property>

配置 etc/hadoop/hadoop-env.sh 中的環境變數

3、配置檔案完成之後，首先格式化標頭檔案

命令： hadoop namenode -format 格式化

此處出錯一般發生在hdfs-site.xml中的<name>dfs.namenode.name.dir</name>

<value>/app/hadoop/dfs/name</vaue>

啟動namenode

Hadoop-daemon.sh start namenode

啟動datanode

Hadoop-daemon.sh start namenode

在啟動namenode 與datanode時，要在完成命令之後，檢視/apps/hadoop/loggs下面的對應的日誌資訊，檢視啟動是否成功過或產生了什麼異常

也可以通過使用jps命令檢視啟動是否成功

配置完成

命令為： hadoop fs -ls /

上傳檔案的命令為 hadoop fs -put ** / 將檔案上傳到hadoop的根目錄下

登陸網址http://localhost:50070 檢視是否搭建成功

2.搭建完全分散式叢集流

根據自己電腦配置，建立機器數量，此處以5臺為例

檢視叢集狀態：hadoop dfsadmin -report

安裝jdk環境，然後安裝hadoop配置環境

關閉防火牆

2.角色分配

第一臺作為namanode 和resurceManager資源管理節點

第2、3、4作為datanode資料節點

第5臺作為secondarynamenode節點

準備工作（配置主機名和對應的ip）

給機器一次命名為hadoop-1 hadoop-2 hadoop-3 hadoop-4 hadoop-5

vi /cd /etc/sysconfig/network 修改名字為hadoop-*

wq儲存退出

在root使用者下輸入命令： hostname hadoop-*

Vi /ect/hosts 修改：192.168.1.1 hadoop-*

wq儲存退出

在Hadoop-1使用者下，為了可以叢集的的啟動需要在hosts中配置每臺機器的ip 和對應發主機名字

配置無密登陸，一般系統都會自帶ssh工具

首先輸入命令：ssh-keygen 生成金鑰

將金鑰傳送到需要無密登陸的機器中

命令為：ssh-copy-id -i 192.168.1.1

一次重複上面的命令，實現無密登陸

按照偽叢集的步驟，配置環境
對於etc中6個檔案的配置

----------------------core-site.xml-------------------------

<name>fs.defaultFS</name>

<value>hdfs://hadoop-1:9000</value>

</property>

---------------------------------hdfs-site.xml--------------------------

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>/app/hadoop/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/app/hadoop/dfs/data</value>

</property>

<name>dfs.secondary.http.address</name>//指定secondarynamenode節點機器

<value>hadoop-5:50090</value>

</property>

<name>dfs.namenode.checkpoint.dir</name>

<value>/app/hadoop/dfs/namesecondary</value>

</property>

</configuration>

--------------------------------------mapred-site.xml-------------------------------

<name>mapreduce.framework.name</name>

</property>

</configuration>

---------------------------------------yarn-site.xml---------------------------------

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name> //指定資料資源管理的機器

<value>hadoop-1</value>

</property>

</configuration>

-----------------------------------------Hadoop-env.sh-------------為hadooppei配置java

配置java路徑

-----------------------------------------slaves--------------------配置奴隸檔案，用於啟動資料節點

hadoop-2

hadoop-3

hadoop-4

以上配置完成，後即可在hadoop-1上進行啟動叢集

首先格式化namenode 命令為： hadoop name-node -format

啟動所有節點： start-all.sh

啟動命令完成之後，使用命令：hadoop dfsadmin -report 檢視活躍節點

也可以檢視活躍節點

檢視Hadoop叢集的根目錄的命令為：hadoop fs -ls /

上傳檔案命令為:hadoop fs -put 檔案 / 將檔案上傳到根目錄

4.關閉叢集使用命令：stop-all.sh

偽叢集與簡單完全分散式叢集的搭建

我是在root許可權下搭建的流程比較簡單 1.簡單單機Hadoop叢集（偽分散式）搭建流程下載 JDK 與Hadoop壓縮包，將檔案傳入linux系統中解壓配置環境： ①首先

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

Hadoop完全分散式叢集的搭建

如果前一章的內容你看懂了，那麼請先刪除之前搭建的三個新伺服器重新克隆三個！！！(博主絕對不是故意為之，真的只是忘記了？) Hadoop完全分散式叢集的搭建 1.分散式叢集搭建規劃 2.叢集的配置（許可權問題，命令執行位置問題請自行注意） 2.1

Centos7.5搭建Hadoop2.8.5完全分散式叢集

一、基礎環境設定 1. 準備4臺客戶機（VMware虛擬機器）系統版本：Centos7.5 192.168.208.128 ——Master 192.168.208.129 ——Slaver-1 192.168.208.130 ——Slaver-2 192.168.208.130 ——Slaver-3

Hadoop-3.1.1完全分散式叢集搭建

一、工作準備 1.虛擬機器安裝Vmware 安裝CentOs虛擬機器三臺 master 192.168.33.101 slave1 192.168.33.102 slave2 192.168.33.103 2.虛擬機器配置

（八）完全分散式模式搭建Hadoop叢集

小技巧：配置好一臺伺服器後，通過 scp -r /opt/zookeeper-3.4.7/ hadoop02:/opt/ 命令，把檔案傳送到另外兩臺機器。 1、搭建方案引入zookeeper，通過註冊臨時節點來監控服務是否掛掉，保證能及時切換到正在執行的服務上，防止單點

CentOS7搭建Hadoop2.6完全分散式叢集環境

3臺主機 192.168.30.207 Master 192.168.30.251 Node1 192.168.30.252 Node2 直接用root裝,省事. 有特殊需求自行add user裝. 以下步驟除非特殊說明,否則每臺都必須配置. 1.rpm -ivh XX

VirtualBox+Centos7+(jdk1.7.0_71+Hadoop-2.6.0)/(jdk1.10+Hadoop-2.9.1)搭建完全分散式叢集平臺

VirtualBox+Centos7+(jdk1.7.0_71+Hadoop-2.6.0)/(jdk1.10+Hadoop-2.9.1)搭建完全分散式叢集平臺本文有很多是自定義的，可以根據自己的實際情況和需求修改，儘量會用紅色標註出來，當然按照步驟，一步一步應該也能成功，不

一、Hadoop2.x完全分散式叢集搭建

實驗環境規劃 192.168.1.101 cmaster0 192.168.1.102 cslave0 192.168.1.103 cslave1 三臺伺服器都是安裝的CentOS6.8作業系統配置/etc/hosts [[email protected] ~]#

CentOS6.5搭建hadoop完全分散式叢集

搭建完全分散式叢集-------------------------------前提條件：已經按照之前的步驟搭建完偽分散式。https://blog.csdn.net/weixin_42006411/article/details/80500217搭建hadoop偽分散式連結

centos7搭建hadoop完全分散式叢集

搭建步驟 1.安裝centos7，並進行準備工作（可以安裝一個之後然後克隆） 2.修改各個centos7的hostname和hosts 3.建立使用者和使用者組 4.配置centos7網路，是centos7系統之間以及和hosts主機之間可以通過互相ping通

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備 1.1 Win7官網下載hadoop包本文使用版本hadoop-2.6.5.tar.gz 1.2 配置jdk 1.3 centos7叢集伺服器主機名系統

hadoop2.7.1在vmware上3臺centos7虛擬機器上的完全分散式叢集搭建

叢集架構 centos7的安裝安裝java hadoop全分佈 ssh無密碼登入 hadoop叢集正常啟動測試以下內容均屬個人理解，如有偏差，望大家諒解。叢集架構 3臺虛擬機器都在同一個區域網中，網段是192.168.10.0，子網掩碼是

kafka完全分散式叢集搭建-kafka_2.11-0.9.0.1

最近在學習分散式的訊息系統kafka，特此記錄搭建kafka叢集過程。環境：機器IP與名稱對應關係如下： 192.168.152.192 master 192.168.152.1

ubuntu18.04 搭建hadoop完全分散式叢集（Master、slave1、slave2）共三個節點

一、硬體配置以及作業系統：所需要的機器以及作業系統：一臺mac os筆記本、一臺window筆記本（CPU雙核四執行緒，記憶體8G），其中mac os用於遠端操作，window筆記本裝有虛擬機器，虛擬出3個ubuntu18.04系統（配置CPU1個執行緒2個，記憶體1.5G，硬碟分配每個7

在VM虛擬機器上搭建Hadoop2.7.3+Spark2.1.0完全分散式叢集

1.選取三臺伺服器（CentOS系統64位） 114.55.246.88主節點　　114.55.246.77 從節點　　114.55.246.93 從節點之後的操作如果是用普通使用者操作的話也必須知道root使用者的密碼，因為有些操作是得

VM+CentOS+hadoop2.7搭建hadoop完全分散式叢集

寫在前邊的話：最近找了一個雲端計算開發的工作，本以為來了會直接做一些敲程式碼，處理資料的活，沒想到師父給了我一個課題“基於質量資料的大資料分析”，那麼問題來了首先要做的就是搭建這樣一個平臺，毫無疑問，底層採用hadoop叢集，在此之上，進行一些其他元件的安裝和二

基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。一、所需硬體，軟體要求使用 VMWare構建三臺虛擬機器模擬真實物理環境作業系統：CentOS6.5 二、必備條件 hadoop搭建需

hadoop學習第二天~Hadoop2.6.5完全分散式叢集搭建和測試

環境配置：系統 centos7 節點 192.168.1.111 namenode 192.168.1.115 datanode2 192.168.1.116 datanode3 java 環境 :

HBase完全分散式叢集環境搭建過程總結

一、前言暑期實驗室實習學姐告知學習HBase，便利用複習之餘的時間搭建HBase環境，先前不瞭解搞了個單機版的，學姐說實驗室開發不用單機2333[尷尬]，於是又開始建立虛擬機器開始完全分散式叢集環境的搭建。搭建主要是各種百度，也遇到了一些bug，也來來回回刪增了

偽叢集與簡單完全分散式叢集的搭建

相關推薦