vmware搭建hadoop集群完整過程筆記

阿新 • • 發佈：2017-08-12

器）修改文件權限配置環境 chmod 出現問題 2.6.0 img key文件無權限

搭建hadoop集群完整過程筆記

一、虛擬機和操作系統

　　環境：ubuntu14+hadoop2.6+jdk1.8

　　虛擬機：vmware12

二、安裝步驟：

先在一臺機器上配置好jdk和hadoop:

　　1.新建一個hadoop用戶

　　　　用命令：adduser hadoop

　　2.為了讓hadoop用戶有sudo的權限：

　　　　用root用戶打開sudors文件添加紅色框裏面的內容：

　　　　打開文件：

　　　　添加內容：

　　　　技術分享

　　3.配置jdk，我把jdk的壓縮包放在了hadoop的用戶目錄下，然後也解壓在當前目錄下

　　　　技術分享

　　　　修改配置文件（配置環境變量）：在下面這個位置添加紅色框裏面的內容，其中紅色下劃線上面的內容根據個人jdk的安裝路徑而修改

　　　　技術分享

　　　　修改配置文件之後要讓配置文件起效，輸入以下命令：

　　　　輸入命令：java -version，如果出現jdk的版本則表示安裝成功，如下：

　　　　技術分享

　　　　*****************到這裏，成功配置了jdk，接下來是配置hadoop*********************

　　　　4.同樣是把hadoop的壓縮包放到hadoop的用戶主目錄下（/home/hadoop），然後解壓在當前目錄下：

　　　　技術分享

　　　　5.修改配置文件（配置hadoop環境變量），在剛剛配置的jdk環境變量上添加內容：

　　　　技術分享

　　　　修改後，也要讓配置文件重新起效

　　　　然後進入hadoop的安裝目錄的bin目錄下

　　　　技術分享

　　　　輸入以下命令查看hadoop的版本，如果能看到hadoop的版本信息，則證明配置成功：

　　　　技術分享

　　　　************************以上以及配置好了單機版本的hadoop環境***********************************

接下來克隆配置好的機器，克隆兩臺：打開vmvare: 虛擬機>管理>克隆。（建議新克隆出來的兩臺機器分別命令為slave1,slave2）

　　技術分享

　　一直點擊下一步完成克隆。其中克隆類型選擇創建完整克隆。

　　技術分享

　　1.分別修改各虛擬機的hostname，分別為master,slave1,slave2

　　2.修改三臺虛擬機的hosts文件，這樣接下來就不需要記住ip地址了，用主機名代替ip地址就可以了

　　　　（ip地址分別為三臺機器的Ip地址，可以分別在三臺機器上通過ifconfig命令查看）

　　　技術分享

　　　這一步完成後，最好重啟一次系統，以便生效。然後可以用ping master(或slave1、slave2)試下，正常的話，應該能ping通。

　　　註：hostname不要命名為“xxx.01,xxx.02”之類以“.數字”結尾，否則到最後hadoop的NameNode服務將啟動失敗。

　　　3.設置靜態ip

　　　　master主機設置靜態ip，在slave上也要參考設置修改成具體的ip

　　　　執行命令

　　　　sudo gedit /etc/network/interfaces

　　　　打開文件修改成已下內容

　　　　auto lo

　　　　iface lo inet loopback

　　　　auto eth0

　　　　iface eth0 inet static

　　　　address 192.168.140.128 //這裏是本機器的Ip地址

　　　　netmask 255.255.255.0 //不用修改

　　　　network 192.168.140.0 //網段，根據Ip修改

　　　　boardcast 192.168.140.255 //根據Ip修改

　　　　gateway 192.168.140.2 //網關，把ip地址後面部門修改成2

　　　　4.配置ssh面密碼登錄　　

　　　　在ubuntu上在線安裝

　　　　執行命令

　　　　sudo apt-get install ssh

　　　　**********************************************

　　　　配置ssh的實現思路:

　　　　在每臺機子上都使用ssh-keygen生成public key，private key

　　　　所有機子的public key都拷到一臺機子如master上

　　　　在master上生成一個授權key文件authorized_keys

　　　　最後把authorized_keys拷給所有集群中的機子，就能保證無密碼登錄

　　　　***************************************************

　　　　實現步驟:

　　　　1 .先在master上，在當前用戶目錄下生成公鑰、私鑰對

　　　　執行命令

　　　　$cd /home/hadoop

　　　　$ssh-keygen -t rsa -P ‘‘

　　　　即：以rsa算法，生成公鑰、私鑰對，-P ‘‘表示空密碼。

　　　　該命令運行完後，會在個人主目錄下生成.ssh目錄，裏面會有二個文件id_rsa（私鑰） ,id_rsa.pub(公鑰)

　　　　2 .導入公鑰

　　　　執行命令

　　　　cat .ssh/id_rsa.pub >> .ssh/authorized_keys

　　　　執行完以後，可以在本機上測試下，用ssh連接自己

　　　　執行命令

　　　　$ssh master

　　　　如果不幸還是提示要輸入密碼，說明還沒起作用，還有一個關鍵的操作

　　　　查看權限，如果是屬於其他用戶的，需要修改該文件給其他用戶權限

　　　　執行命令

　　　　chmod 644 .ssh/authorized_keys

　　　　修改文件權限，然後再測試下 ssh master，如果不需要輸入密碼，就連接成功，表示ok，一臺機器已經搞定了。

　　　　如出現問題試解決

　　　　請先檢查SSH服務是否啟動，如果沒啟動，請啟動！

　　　　如果沒有.ssh目錄則創建一個:

　　　　執行命令

　　　　$cd /home/hadoop

　　　　$mkdir .ssh

　　　　如無權限，使用命令修改要操作文件夾的owner為當前用戶：

　　　　執行命令

　　　　sudo chown -R hadoop /home/hadoop

　　　　3 .在其它機器上生成公鑰、密鑰，並將公鑰文件復制到master

　　　　以hadoop身份登錄其它二臺機器 slave1、slave2，執行 ssh-keygen -t rsa -P ‘‘ 生成公鑰、密鑰

　　　　然後用scp命令，把公鑰文件發放給master（即：剛才已經搞定的那臺機器）

　　　　執行命令

　　　　在slave1上:

　　　　scp .ssh/id_rsa.pub [email protected]:/home/hadoop/id_rsa_1.pub

　　　　在slave2上:

　　　　scp .ssh/id_rsa.pub [email protected]:/home/hadoop/id_rsa_2.pub

　　　　這二行執行完後，回到master中，查看下/home/hadoop目錄，應該有二個新文件id_rsa_1.pub、id_rsa_2.pub，

　　　　然後在master上，導入這二個公鑰

　　　　執行命令

　　　　$cat id_rsa_1.pub >> .ssh/authorized_keys

　　　　$cat id_rsa_2.pub >> .ssh/authorized_keys

　　　　這樣，master這臺機器上，就有所有3臺機器的公鑰了。

　　　　4 .將master上的“最全”公鑰，復制到其它機器

　　　　繼續保持在master上

　　　　執行命令

　　　　$scp .ssh/authorized_keys [email protected]:/home/hadoop/.ssh/authorized_keys

　　　　修改其它機器上authorized_keys文件的權限

　　　　slave1以及slave2機器上，均執行命令

　　　　chmod 600 .ssh/authorized_keys

　　　　5. 驗證

　　　　在每個虛擬機上，均用命令 ssh+其它機器的hostname 來驗證，如果能正常無密碼連接成功，表示ok

　　　　如在slave1

　　　　執行命令

　　　　ssh slave1

　　　　ssh master

　　　　ssh slave2

　　　　分別執行以上命令要保證所有命令都能無密碼登錄成功。

　　　　5.修改hadoop配置文件

　　　　　　先配置hdfs，所以先修改4個配置文件:core-site.xml , hdfs-site.xml , hadoop-env.sh , slaves

　　　　到hadoop的該目錄下：

　　　　1).修改core-site.xml

　　　　技術分享
　　　　上面配置的路徑/home/hadoop/tmp，如果不存在tmp文件夾，則需要自己新建tmp文件夾

　　　　2.修改hdfs-site.xml

　　　　技術分享

　　　　3.修改hadoop-env.sh，（有教程上面還需要配置HADOOP_HOME的環境變量，本人這裏沒有配置但是沒問題，因為在前面已經配置過了）

　　　　技術分享

　　　　4.修改slaves，刪掉原來的內容，添加其他兩個節點的主機名

　　　　技術分享

　　　　5.分發到集群的其它機器

　　　　把hadoop-2.6.0文件夾連同修改後的配置文件，通過scp拷貝到其它2臺機器上。

　　　　執行命令

　　　　$scp -r hadoop-2.6.0/ [email protected]: hadoop-2.6.0

　　　　修改這四個文件之後，hdfs服務就配置成功了。通過運行start-dfs.sh啟動hdfs服務，檢查是否配置成功。

　　　　技術分享

　　　　啟動完畢之後，輸入jps，如果顯示NameNode和Jps則表示配置成功。

　　　　6.接下來配置mapreduce，要修改yarn-site.xml , mapred-site.xml文件

　　　　修改yarn-site.xml文件

　　　　技術分享

　　　　7.修改mapred-site.xml

　　　　技術分享

　　　　8.分發到集群的其它機器

　　　　把hadoop-2.6.0文件夾連同修改後的配置文件，通過scp拷貝到其它2臺機器上。

　　　　執行命令

　　　　$scp -r hadoop-2.6.0/ [email protected]: hadoop-2.6.0

　　　　運行start-yarn.sh腳本，啟動mapreduce服務。顯示紅色框裏面的三個內容則表示配置成功。

　　　　技術分享

vmware搭建hadoop集群完整過程筆記

器）修改文件權限配置環境 chmod 出現問題 2.6.0 img key文件無權限搭建hadoop集群完整過程筆記一、虛擬機和操作系統　　環境：ubuntu14+hadoop2.6+jdk1.8 　　虛擬機：vmware12 二、安裝步驟：先在一臺機器上

ubuntu16.04搭建hadoop集群環境

address hadoop 集群所有 ipv ret 加載文件 keygen -- manager 1. 系統環境Oracle VM VirtualBoxUbuntu 16.04Hadoop 2.7.4Java 1.8.0_111master：192.168.19.12

Amabari搭建Hadoop集群(一)

hdp ambari 一、系統環境1.系統版本[root@manager ~]# cat /etc/centos-release CentOS Linux release 7.4.1708 (Core)2.主機規劃主機名IP地址角色manager192.168.10.131ambari-serverv

Amabari搭建Hadoop集群(二)

amabr hdp 一、進入登陸頁面1.在瀏覽器中輸入ambari-server端地址，初始賬戶和密碼都是admin2.登陸後進入向導界面，點擊Launch Install Wizard3.設置集群名稱二、安裝相關組件1.選擇HDP版本，註意選擇使用本地源2.輸入其他節點的主機名或IP，並選擇SSH配

虛擬機搭建Hadoop集群

openss 正常 orien gac 使用 encoding text 外網 source 安裝包準備操作系統：ubuntu-16.04.3-desktop-amd64.iso 軟件包：VirtualBox 安裝包：hadoop-3.0.0.tar.gz，jdk-8u

Linux 搭建Hadoop集群 ----workcount案例

oms 配置參數 org 自己 exception http user 缺少文件 msg 在 Linux搭建集群---JDK配置 Linux搭建集群---SSH免密登陸 Linux搭建集群---集群搭建成功的基礎上實現workcount案例註意虛擬機三臺啟動集群

CDH搭建Hadoop集群(Centos7)

local 配置 tp服務器 order zxvf false 一個用戶指向 comm 一、說明節點(CentOS7.5) Server || Agent CPU node11 Server || Agent 4G nod

Hadoop集群搭建筆記

reduce ati prompt ucc xshell 格式化 load obj apache 1、安裝虛擬機 VMware workstation CentOS 鏡像安裝Linux虛擬機：（在Win7上） 1）安裝VMwareWorkstations（可

在搭建好Hadoop集群后，namenode與datanode兩個過程不能起來，或者一個啟動之後另一個自動關閉

故障現像：此故障可以算是在換電腦搭集群后最多的故障了，首先是從節點上相關程序都沒起來，後來又是程序起來後從節點上datanode節點沒起來，最後是datanode程序起來之後，主節點上namenode程序又沒起來。此故障看起來一波三折，實際上在理解好相關原理後

Hadoop集群搭建(非HA)

圖形界面網絡模式 jdk 初始 hadoop2 orm 一個程序猿添加 1.準備Linux環境 1.0先將虛擬機的網絡模式選為NAT 1.1修改主機名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=i

Hadoop集群搭建(三) Hbase

hbase hadoop hdfs 前面已經完成Zookeeper和HDFS的安裝，本文會詳細介紹Hbase的安裝步驟。以及安裝過程中遇到問題的匯總。Hadoop集群搭建(一) ZookeeperHadoop集群搭建(二) HDFS下面開始Hbase的安裝。Hbase的服務器規劃192.168.6

Hadoop集群搭建

hadoop集群 manage 臨時 status shuffle centos6 添加 jdk8 ast 1.集群簡介 Hadoop集群具體來說包括兩個集群：HDFS集群和YARN集群，兩者邏輯上分離，但物理上常在一起。 HDFS集群：負責海量數據的存儲，集群中的角色主要

Hadoop學習之路（四）Hadoop集群搭建和簡單應用

get allocated reduce plugins caching handle ces -h per 概念了解主從結構：在一個集群中，會有部分節點充當主服務器的角色，其他服務器都是從服務器的角色，當前這種架構模式叫做主從結構。主從結構分類： 1、一主多從

Hadoop學習之路（五）Hadoop集群搭建模式和各模式問題

數據場景模式問題沒有問題：重裝故障 style 分布式集群的通用問題當前的HDFS和YARN都是一主多從的分布式架構，主從節點---管理者和工作者問題：如果主節點或是管理者宕機了。會出現什麽問題？群龍無首，整個集群不可用。所以在一主多從的架構中都會

Hadoop集群搭建二（Linux虛擬機）

AI .org vmware 完成 devices 所有版本選擇 windows 點擊搭建Linux虛擬機 VMware虛擬機安裝Linux 系統 1、首先打開網易開源鏡像站: http://mirrors.163.com/ 當然，大家也可以使用阿裏開源鏡像站

4.Hadoop集群搭建之啟動

urn 生成狀態 CP data 其他 sla site 驗證配置好Hadoop、HDFS、YARN、Zookeeper集群後，需要按照順序啟動。前期準備配置好Hadoop、HDFS、YARN、Zookeeper集群先stop掉所有的hadoop服務使用jp

Linux上安裝Hadoop集群(CentOS7+hadoop-2.8.0)--------hadoop環境的搭建

html -a 總結全分布式 .html oop details clas HR Linux上安裝Hadoop集群(CentOS7+hadoop-2.8.0)------https://blog.csdn.net/pucao_cug/article/details/716

hadoop集群管理系統搭建安裝規劃說明

關於 RoCE mil 平臺管理系業務好的技術超過 Hadoop分布式集群環境搭建是每個入門級新手都非常頭疼的事情，因為你可能花費了很久的時間在搭建運行環境，最終卻不知道什麽原因無法創建成功。但對新手來說，運行環境搭建不成功的概率還蠻高的。在之前的分享文章中給ha

Hadoop集群環境搭建

strong clu text data- dep table 什麽隱藏文件 --nodeps 第一部分：準備Linux環境創建虛擬機安裝系統的步驟在這裏就不講了，詳細步驟請看本人其他文章打開建好的虛擬機一、修改Hostname1、臨時修改hostname hostn

BigData--hadoop集群搭建之zookeer安裝

其他 ron fault ntp time pro art 變量 tick Zookeeper安裝 cd /opt/ tar -zxvf zookeeper-3.4.10.tar.gzmv zookeeper-3.4.10 /opt/zookeeper修改配置文件cd /

vmware搭建hadoop集群完整過程筆記

相關推薦