適合小白的 Hadoop 叢集配置搭建，非常詳細

阿新 • • 發佈：2019-01-01

準備工作：

1。VMware Workstation 14 中安裝虛擬機器 ，版本為 CentOS7（我搭建的叢集為三臺，安裝一臺克隆兩臺，這裡不做解釋，可自行百度）
2。JDK1.8 ，下載地址為  https://pan.baidu.com/s/15YA23CYnT3L-9f6Ao-gzrw
3。hadoop2.7.5 下載地址為 https://pan.baidu.com/s/1Fyfb77R6Tl1ct3pm_yaLdA

新建使用者

每個虛擬機器建立一個hadoop使用者並加入到root組中

#新增使用者hadoop到root組中
useradd -m hadoop -G root -s /bin/bash
#修改使用者密碼--輸入密碼，再次輸入密碼  （建議密碼也設定為hadoop） 

passwd hadoop

修改ip為靜態ip

vi /etc/sysconfig/network-scripts/ifcfg-ens33

注意： 最後末尾處新增的ip地址網段要和虛擬機器中的網段保持一致，（Ip自定義但是不能超過255）
其中這兩個中的第三位數字要和VMware Workstation中的網段一致，檢視網段看第二張圖
開啟的位置是 ：編輯 ->虛擬網路編輯器

IPADDR=192.168.255.131
GATEWAY=192.168.255.2

這裡寫圖片描述

修改完成後，重啟網管

[root@dnn1 ~]systemctl restart network

然後修改主機名方便以後訪問（不需要在輸入ip那麼麻煩了以後）

[root@dnn1 ~]# echo nnn > /etc/hostname

修改對映

vim /etc/hosts

向這個hosts檔案追加三行，格式為 Ip地址主機名，一會方便linux 系統之間進行通訊

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain 
6
192.168.255.130 nn
192.168.255.131 dn1
192.168.255.132 dn2

完成之後重啟

[root@dnn1 ~]# reboot

安裝上述的方法將其他兩臺虛擬機器也修改了，保證ip不一樣就可以

root 是超級管理員使用者，所做操作無法更改，我們叢集的搭建是在hadoop 使用者上搭建的，標題即使以後有什麼問題也不會影響到整個系統

用hadoop使用者登入到每臺機器上

[root@dnn1 ~]# sudo hadoop

在使用者根目錄下面配置 SSH 無密碼登入

     [hadop@nnn ~]$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa 
     [hadop@nnn ~]$ ssh-copy-id dnn1    
     [hadop@nnn ~]$ ssh-copy-id dnn2
##然後測試是否主機之間登入是否需要密碼
    [hadop@nnn ~]$ ssh dnn1
    #檢視主機名，列印的是dnn1 ，無密碼登入成功，然後退出
    [hadop@dnn1 ~]$ hostname
    dnn1
    [hadop@dnn1 ~]$ exit
    [hadop@nnn ~]$ ssh dnn2  
    #檢視主機名，列印的是dnn2 ，無密碼登入成功，然後退出
    [hadop@dnn2 ~]$ hostname
    dnn2
   [hadop@dnn1 ~]$ exit

配置Java和Hadoop 的環境變數
新建opt資料夾（用於存放安裝Linux軟體的）
將下載的 jdk 1.8 和hadoop2.7.5的安裝包解壓到opt 資料夾中，然後解壓配置環境變數

[[email protected] ~]$ mkdir opt
[[email protected] ~]$ vi ~/.bashrc
###向檔案中新增如下程式碼（jdk8資料夾和hadoop2 是jdk 和hadoop檔案解壓後更改的名字）
#JAVA_JDK1.8
export JAVA_HOME=/home/hadoop/opt/jdk8
export PATH=$PATH:$JAVA_HOME/bin
#HADOOP
export HADOOP_HOME=/home/hadoop/opt/hadoop2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

使環境變數生效（每臺機子）

 [hadop@nnn ~]$ source ~/.bashrc

叢集搭建開始了

搭建hadoop全分散式叢集

進入hadoop解壓目錄 
在/home/hadoop/opt/hadoop2/etc/hadoop/資料夾下面修改以下 5個檔案
    1 core-site.xml
    2 hdfs-site.xml
    3 mapred-site.xml
    4 yarn-site.xml
    5 slaves
1.core-site.xml 
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://nnn:9000</value>
        <!-- nnn是master 的 主機名， 9000不固定，只要埠沒有被佔用就可以 -->
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/home/hadoop/opt/hadoop2/tmp</value>
    </property>
</configuration>

2.hdfs-site.xml 
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
                 <!-- 這個數字2 代表你有幾臺子節點，這個不要錯 -->
        </property>
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>nnn:50090</value>
                <!-- nnn是master 的 主機名 -->
        </property>

        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/home/hadoop/opt/hadoop2/tmp/dfs/name</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/home/hadoop/opt/hadoop2/tmp/dfs/data</value>
        </property>
</configuration>

3.mapred-site.xml   
<property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
</property>
<property>
      <name>mapreduce.app-submission.cross-platform</name>
      <value>true</value>
</property>
</configuration>

4.yarn-site.xml 配置yarn的主機地址洗牌的預設框架
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>nnn</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>

</configuration>
5.slaves    #配置所有dn的主機名稱        
dn1
dn2

進入hadoop的安裝目錄，遠端分發到伺服器上
[[email protected] ~]$ cd /home/hadoop/opt/

#將整個hadoop2 複製到 其他兩臺機器上 $PWD 是當前的目錄，意思是將 hadoop2 整個資料夾複製到dnn1和dnn2 的這個相同路徑下
scp -r  hadoop2/ dnn1:$PWD
scp -r  hadoop2/ dnn2:$PWD

啟動叢集

一、格式化hdfs 檔案系統（只需要這第一次，以後啟動不需要了，只在nnn（master節點上啟動，其他的節點不需要啟動） ）
[hadop@nnn ~]$ hadoop namenode -format

二、啟動dfs 服務和yarn 服務
[hadop@nnn ~]$ start-dfs.sh
[hadop@nnn ~]$ start-yarn.sh

三、驗證是否有開啟的服務，在nnn(master 機器上) 輸入jps 檢視有程序沒有
這裡寫圖片描述
然後分別在 dnn1 和dnn2 (slaves 節點) 輸入jps 檢視是否有程序

四、驗證是否能夠在web 端瀏覽頁面，在瀏覽器中輸入 nnn：50070
注意：如果你的頁面打不開，有兩種可能，
1.你在windows 上的ip 對映沒有配置，
2 Linux 的防火牆沒有關

1修改windows ip 對映

C:\Windows\System32\drivers\etc\hosts

將這個檔案拷貝到桌面上，修改後覆蓋（管理員許可權，無法直接開啟修改，只能替換）
末尾新增
這裡寫圖片描述

2修改防火牆

禁止開機啟動

[[email protected] ~]# systemctl disable firewalld

修改裡面的引數 SELINUX=disabled

[[email protected] ~]# vim /etc/selinux/config
以後開機就永遠都是關閉防火牆了

`
再次測試訪問hadoop web 頁面
訪問nnn:50070
這裡寫圖片描述

檢視活著的子節點是否為2 （即子節點的數量）

這裡寫圖片描述
因為我的叢集有三臺，master 一臺，slave為兩臺，所以活著的節點資訊是2
到此叢集就啟動成功了~
哈哈！！！恭喜你，叢集搭建成功，若有什麼問題，歡迎留言！我會給大家回覆的

適合小白的 Hadoop 叢集配置搭建，非常詳細

準備工作： 1。VMware Workstation 14 中安裝虛擬機器，版本為 CentOS7（我搭建的叢集為三臺，安裝一臺克隆兩臺，這裡不做解釋，可自行百度） 2。JDK1.8 ，下載地址為 https://pan.baidu.com/s/15Y

適合小白入門python的書籍，進來瞄一眼吧！

近一兩年Python這門程式語言，關注量一直都是很高，今天小編給大家聊一下學習Python語言可以發展哪些方向，以及Python語言在未來的發展前景。首先：Python語言在學術上非常受歡迎，不是計算機專業的人，很多都在學習Python。因為這個語言的前景是不可限量的，而且他的語法非常的簡單易

spring註解方式，使用jax-ws配置webservice，適合小白。看不會你打死我！

前提條件：java –spring框架，註解（能夠掃描@webService標籤） 1. 經過一天的煎熬和掙扎，終於把webservice的其中非常簡單的配置方法給弄明白了，就是JAX-WS配置webservice,真的非常簡單，只是細節一一旦出了點問題，全盤皆輸，為了

如何快速的搭建一個maven+springmvc的專案，適合小白易懂，進來看看

第2步：第3步：第4步：建立完成之後點選專案右鍵選擇java EE Tools 選擇第二個建立web.xml 第5步：開啟pom.xml進行新增依賴  <properties>

Unity 釋出成android包的環境搭建步驟(詳細，適合小白)

一： JDK環境的安裝和配置 1 下載與安裝JDK 注意：unity 4.x對應使用1.7版本，unity 5.x對應使用1.8版本。 1.1 搜尋引擎輸入JDK1.8，如下圖： 1.2 點開第一個，往下拉，如下圖： 1.3

項目實戰！爬取5萬篇好奇心日報文章，適合小白練手的實戰案例！

microsoft 找到用戶數 clas 復制 parse span 入門知識 soup Python的知識很多，基本的入門就有很多東西要學，還有各種合樣的庫要學習。很多同學學了一段時間，進展很慢，學了前面忘了後面！要麽就是揠苗助長找一些特別難的例子，結果太難了，失去信心

Hadoop叢集的搭建（虛擬機器準備，JDK和Hadoop安裝，Hadoop目錄結構）

目錄虛擬機器準備 JDK和Hadoop安裝 Hadoop的目錄結構：虛擬機器準備環境：一臺剛裝好的CentOS，操作如下： [[email protected] ~]# ifconfig 獲取當前主機的ip地址，然後使用shell登入，使用she

redis叢集搭建（非常詳細，適合新手）

redis叢集搭建在開始redis叢集搭建之前，我們先簡單回顧一下redis單機版的搭建過程下載redis壓縮包，然後解壓壓縮檔案；進入到解壓縮後的redis檔案目錄（此時可以看到Makefile檔案），編譯redis原始檔；把編譯好的redis原始檔

Hadoop叢集環境搭建（雲伺服器，虛擬機器都適用）

為了配置方便，為每臺電腦配置一個主機名： vim /etc/hostname 各個節點中，主節點寫入：master ，其他從節點寫入：slavexx 如果這樣修改不能生效，則繼續如下操作 vim /etc/cloud/cloud.cfg 做preserve_hostname: true 修改 reb

VMware 下Hadoop叢集環境搭建之虛擬機器克隆,Hadoop環境配置

在上一篇我們完成了ContOS網路配置以及JDK的安裝,這一篇將在上一篇的基礎上繼續講解虛擬機器的克隆,hadoop環境搭建虛擬機器克隆. 利用上一篇已經完成網路配置和jdk安裝的虛擬機器在克隆兩臺虛擬機器. 1. 將擬機hadoop01關機.

Hadoop叢集化搭建（二）配置JAVA環境

軟體環境作業系統 CentOS 6.4 64bit (Basic Server + 桌面環境) 虛擬機器 VMware Workstation 12.0

大資料平臺Hadoop的分散式叢集環境搭建，官網推薦

1 概述本文章介紹大資料平臺Hadoop的分散式環境搭建、以下為Hadoop節點的部署圖，將NameNode部署在master1，SecondaryNameNode部署在master2，slave1、slave2、slave3中分別部署一個DataNode節點 NN

Hadoop叢集化搭建（三）配置SSH互信

軟體環境作業系統 CentOS 6.4 64bit (Basic Server + 桌面環境) 虛擬機器 VMware Workstation 12.0

Hadoop叢集化搭建（一）網路配置

軟體環境作業系統 CentOS 6.4 64bit (Basic Server + 桌面環境) 虛擬機器 VMware Workstation 12.0

sql常用語句整理(包括增刪改查)，適合小白使用

SELECT * FROM Persons WHERE ROWNUM <= 2; 7、LIKE 操作符、SQL 萬用字元(1)從"Persons" 表中選取居住在以 "N" 開始的城市裡的人：SELECT * FROM Persons WHERE City LIKE'N%'; (2)從"Person

mac小白入門教程配置，以及一些好用的tips推薦（主要針對開發人員）

Mac&macOS簡介 App Store：蘋果電腦軟體商店 iTunes：在 Mac 上管理 iPhone 的利器 iTunes Store：購買軟體和數字產品 Apple Store：蘋果在官網和實體零

hadoop叢集配置（一，單點配置）

參考書籍：Hadoop+Speak大資料巨量分析與機器學習整合開發實戰。林大貴。不錯單點叢集機器學習都可以。走一遍hadoop叢集配置在一臺節點上建立新使用者Hadoop useradd Hadoop 新增密碼 passwd hadoop 更新包：

Git是什麼鬼，適合小白觀看~

首先我是上來就開始用Git，然後同事跑我這裡一頓命令，視窗從哪裡開啟的都不知道，操作完問題解決就走了，what？我完全沒看懂他在做什麼，下一次無論我要克隆專案還是提交我還是不會，於是同事又過來一頓弄，最後還是沒看懂~最後就想說學東西最好是系統的去學習，由淺到深，

eclipse+sdk+adk安卓開發環境部署（全程詳解，適合小白）

寫給第一次想在自己Windows上建立eclipse的Android開發環境的朋友們，為了確保大家能順利完成開發環境的搭建，希望對準備進入Android開發的朋友有幫助。我們知道eclipse+sdk+adk有很多版本的選擇，為了方便剛接觸的朋友首先我介紹本人的套裝：

適合小白的暴力求子集方法，瞭解一下？

前言　　最近在上C++課的時候老師留了一道課後作業，求n個數字的全部子集，比如說輸入6就列印{1， 2， 3， 4，5， 6}的全部子集。　　當時我腦中第一反應就是用遞迴列舉隨便打一打啊，不過後來有位同學問我思路，突然不知所措，因為我們當時才講了基本資料型別和while、if

適合小白的 Hadoop 叢集配置搭建，非常詳細

準備工作：

新建使用者

修改ip為靜態ip

root 是超級管理員使用者，所做操作無法更改，我們叢集的搭建是在hadoop 使用者上搭建的，標題即使以後有什麼問題也不會影響到整個系統

在使用者根目錄下面配置 SSH 無密碼登入

使環境變數生效（每臺機子）

叢集搭建開始了

啟動叢集

1修改windows ip 對映

2修改防火牆

禁止開機啟動

修改裡面的引數 SELINUX=disabled

檢視活著的子節點是否為2 （即子節點的數量）

相關推薦