大資料hadoop叢集的搭建總結及步驟

阿新 • • 發佈：2018-12-16

CentOS6.5mini版hadoop叢集搭建流程

CentOS 7 系列：

關閉防火牆：systemctl stop firewalld

禁止防火牆開機啟動：systemctl disable firewalld

安裝虛擬機器的時候需要配置好主機名和網路

主機名：master，slave1，slave2

網路配置：

1. 自動連線

2. ipv4 手動

------------------ 三個都要執行的操作

-2.驗證網路配置是否正確：ifconfig

-1.驗證主機名是否正確：hostname

master，slave1，slave2

0. 安裝 ssh 服務（mini版要安裝ssh，桌面版無須安裝 ssh ）

yum -y install openssh-server 安裝 ssh 伺服器

yum -y install openssh-clients 安裝 ssh 客戶端

1. 分別關閉防火牆

service iptables stop

2. 分別禁止防火牆開機啟動

chkconfig iptables off

3. 分別配置 /etc/hosts 檔案，增加一下內容

192.168.37.101 master

192.168.37.102 slave1

192.168.37.103 slave2

4. 分別執行 ssh-keygen 生成公鑰和私鑰

5. 分別執行 ssh-copy-id master /root/.ssh/id_rsa.pub 把公鑰傳送給 master

----------------- master 執行的操作

6. master 執行 cat /root/.ssh/authorized_keys 檢查是否收集到了所有的公鑰

7. master 執行命令把 authorized_keys 傳送給 slave1 和 slave2

scp /root/.ssh/authorized_keys [email protected]:/root/.ssh/

------------------ 三個都要執行的操作

8. 分別執行，共 9 次

ssh master exit

ssh slave1 exit

ssh slave2 exit

消除第一次登入的 yes

------------------ 以下操作都在 master 上進行

9. 上傳 jdk 到 master 的 /opt/SoftWare 資料夾

10.解壓 jdk tar -xvf jdk

11.配置 jdk 環境變數 vi /etc/profile

在檔案最後追加一下內容：

export JAVA_HOME=/opt/SoftWare/jdk1.8.0_141

export JRE_HOME=/opt/SoftWare/jdk1.8.0_141/jre

export CLASSPATH=.:$JRE_HOME/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

12.重新整理環境變數 source /etc/profile

13.驗證是否配置成功 java -version

15.上傳 hadoop 到 /opt/SoftWare 並解壓

16.進入解壓後的 hadoop 資料夾建立

tmp，logs，hdfs，hdfs/name，hdfs/data 五個資料夾

16.使用 nodepad++ 進行配置檔案的修改，都在 hadoop-2.7.3/etc/hadoop

1. hadoop-env.sh

修改第 25 行的 ${JAVA_HOME} 為自己的 jdk 安裝目錄

2. yarn-env.sh

修改第 23 行，解註釋，修改路徑為自己的 jdk 安裝目錄

3. salves

修改 localhost 為 slave1 和 slave2

4. mv mapred-site.xml.template mapred-site.xml 重新命名 mapred-site.xml.template

5. 配置檔案參考附件

17.把 SoftWare 資料夾拷貝到 slave1 和 slave2 的 opt 下

scp -r /opt/SoftWare/ [email protected]:/opt/

18.把 /etc/profile 檔案拷貝到 slave1 和 slave2 的 /etc 下

scp /etc/profile/ [email protected]:/etc/

------------------ 三個都要執行的操作

19.分別去 slave1 和 slave2 重新整理環境變數，驗證 java 是否配置成功

20.鎖定時間同步

安裝時間同步軟體 ntpdate：yum -y install ntp ntpdate

把時間寫入硬體進行鎖定：hwclock --systohc

----------------- master 執行的操作

21.進入 hadoop-2.7.3/bin 目錄

22.使用 ./hdfs namenode -format 進行格式化

出現 /hdfs/name has been successfully formatted 表示成功

不允許多次格式化，會導致叢集無法啟動

如果出錯：

1. 修改配置檔案

2. 刪除三個上的 hdfs/name 和 hdfs/data 資料夾

3. 把修改的內容傳送到 slave1 和 salve2 下

時刻保持 3 個虛擬機器的配置檔案是一致的

4. 重新格式化

23.進入 hadoop-2.7.3/sbin 目錄，使用 ./start-dfs.sh 啟動 hdfs 服務

---------------- 三個虛擬機器執行的命令

分別執行 jps 命令

master：

NameNode

SecondaryNameNode

slave1 和 slave2：

DataNode

訪問：http://192.168.37.101:50070

Live Nodes 2

----------------- master 執行的命令

24.進入 hadoop-2.7.3/sbin 目錄，使用 ./start-yarn.sh 啟動 yarn 服務

---------------- 三個虛擬機器執行的命令

25.分別執行 jps 命令

master：

ResourceManager

slave1 和 slave2：

NodeManager

訪問：http://192.168.37.101:8088

---------------- master 執行命令

26.進入 hadoop-2.7.3/sbin 目錄，使用 ./stop-dfs.sh 關閉 hdfs 服務

進入 hadoop-2.7.3/sbin 目錄，使用 ./stop-yarn.sh 關閉 yarn 服務

切記：關虛擬機器前先關閉 hadoop 叢集，不然可能會導致叢集的崩潰

大資料hadoop叢集搭建之後的操作

1.節點的服役和退役(hdfs) [退役] 1.新增退役節點的ip到黑名單,不要更新白名單. [/soft/hadoop/etc/dfs.hosts.exclude.txt] s205 2.配置hdfs-site.xml

大資料hadoop叢集的搭建總結及步驟

CentOS6.5mini版hadoop叢集搭建流程 CentOS 7 系列：關閉防火牆：systemctl stop firewalld 禁止防火牆開機啟動：systemctl disable firewalld 安裝

大資料Hadoop叢集環境搭建（五）

Hadoop環境搭建Hadoop本地模式安裝 Hadoop部署模式 Hadoop部署模式有：本地模式、偽分佈模式、完全分散式模式。區分的依據是NameNode、DataNode、ResourceManager、NodeManager等模組執行在幾個JVM程序、幾個機器。一、本地模

大資料Hadoop叢集環境搭建（四）

安裝JDK 安裝Java JDK 1、檢視是否已經安裝了java JDK。 [[email protected] Desktop]# java –version 注意：Hadoop機器上的JDK，最好是Oracle的Java JDK，不然會有一些問題，比如可能沒

大資料Hadoop叢集環境搭建（三）

在配置hadoop環境中一、修改Hostname 1. 臨時修改hostname [[email protected] localhost]# hostname hadoop 這種修改方式，系統重啟後就會失效。 2、永久修改hostname 想永久修改，應

大資料Hadoop叢集環境搭建（二）

第一部分 Linux環境安裝一、Vmware網路模式介紹參考：http://blog.csdn.net/collection4u/article/details/14127671 二、Linux環境VMware14與CenterOs7安裝版本參考：https://blo

大資料Hadoop叢集環境搭建（一）

前言 Hadoop在大資料技術體系中的地位至關重要，Hadoop是大資料技術的基礎，對Hadoop基礎知識的掌握的紮實程度，會決定在大資料技術道路上走多遠。這是一篇入門文章，Hadoop的學習方法很多，網上也有很多學習路線圖。本文的思路是：以安裝部署Apache Hadoop2.x

大資料分散式叢集搭建（9）

Sqoop相比於其他的工具搭建起來很容易需要用到下面的東西 sqoop-1.4.6.tar.gz sqoop-1.4.6.jar mysql-connector-java-5.1.21.jar

大資料面試題之Hadoop叢集搭建步驟

一、開啟需要搭建Hadoop叢集的主從節點伺服器，配置好靜態IP、主機名hostname、主機IP對映檔案hosts、關掉防火牆二、通過遠端登入工具（我用的是SecureSRT）登入到Linux系統，登入前需要在Windows系統中C:\Windows\System32\

【大資料技術】1.hadoop叢集搭建

近年來，大資料技術越來越吃香，也是追求高薪的必備技能之一。近些日子，打算技術轉型，開始研究大資料技術，基於對JAVA、LINUX系統有一定的基礎，完成hadoop叢集搭建（1個master和1個slave）。一、準備工具 VMvare、centOS6.3、SSH Secure客戶端（

大資料學習——hadoop叢集搭建2.X

1.準備Linux環境 1.0先將虛擬機器的網路模式選為NAT 1.1修改主機名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=itcast ### 1.2修改IP 兩種方式：第一種：通過Linux圖形介面進行修改（強烈推薦）進入Linux圖形

搭建大資料處理叢集（Hadoop，Spark，Hbase）

搭建Hadoop叢集配置每臺機器的 /etc/hosts保證每臺機器之間可以互訪。 120.94.158.190 master 120.94.158.191 secondMaster 1、建立hadoop使用者先建立had

[大資料]hadoop 聯邦機制及配置檔案

hadoop 聯邦機制 1 原理即多個ha 聯合組成一套叢集環境，對外提供一致介面【ViewFs】（相當於擴容）即cluserID 相等但是相同的datanode服務於不同的namenode。原理是通過namenodeID和blockPool-id來判別檔案存放的位置

hadoop Cloudera-Manager叢集搭建總結

1、網上搭建步驟很多，我參考的這個連結的：https://blog.csdn.net/suifeng3051/article/details/45477773 2、安裝上述步驟基本沒問題，但是有幾點注意如下：（1）服務端安裝完畢後客戶端最好手工的方式在每個客戶端上

Hadoop叢集配置安裝,詳細步驟及講解

**涉及linux命令一定要注意大小寫和空格,linux系統對此敏感** **hadoop叢集的安裝一定要靜下心一步一步來** 1、關閉防火牆(防火牆最好關閉,不然以後linux操作會有很多麻煩) 1)輸入命令: vi etc/selinux/config 其中改為 SELINU

大資料架構師：如何從零基礎搭建大資料hadoop生態圈

從年初起，幾家國際大廠的開發者大會，無論是微軟Build、Facebook F8還是稍後的Google I/O，莫不把“AI優先”的大旗扯上雲霄。如果這一波AI大潮只是空喊幾句口號，空提幾個戰略，空有幾家炙手可熱的創業公司，那當然成不了什麼大氣候。但風浪之下，我們看到的卻是，Google一線的各大業

大資料-Hadoop-HDFS（分散式檔案系統）環境搭建

1：Hadoop三大核心元件 A：分散式檔案系統HDFS B：分散式資源排程器 C：分散式計算框架MapReduce 2：HDFS簡介： HDFS架構：HDFS採用Master/Slave架構即：一個Master（NameNode）對應多個Slave(DataNode)

Hadoop叢集搭建與經驗總結

(002)最近要研發一款資料傳輸服務的產品需要用到Hadoop叢集，之前搭建過後來長時間不用就給忘記了，這次搭好來記錄一下搭建方法與經驗總結 Hadoop叢集的搭建原料： VM虛擬機器 JDK1.8 hadoop2.7.3 注：將jdk1.8.ta

高效的大資料開發環境搭建及實戰

內容大綱：一、開發環境準備1.IDE開發工具選擇及安裝2.Java SDK版本選擇及安裝3.Spark開發語言版本選擇及安裝4.下載Spark的安裝程式5.安裝Maven6.安裝sbt7.IDE的外掛選擇、安裝及配置二、從零開始創建第一個Spark程式－ HelloSpa

大資料Hadoop測試環境搭建(CM、CDH5離線安裝)

伺服器可用虛擬機器，記憶體8G，硬碟50G至少3臺伺服器，namenode1臺，datanode2臺主伺服器裝好cm後，scp到另2臺伺服器手動啟動cloudera-scm-server和cloudera-scm-agent，service容易出各種問題有服務要用到apache到httpd，需要安裝副本不足問

大資料hadoop叢集的搭建總結及步驟

相關推薦