Linux 搭建Hadoop叢集成功

阿新 • • 發佈：2018-12-07

內容基於（自己的真是操作步驟編寫）

Linux 搭建Hadoop叢集---Jdk配置

Linux 搭建Hadoop叢集 ---SSH免密登陸

一：下載安裝 Hadoop

1.1：下載指定的Hadoop

hadoop-2.8.0.tar.gz

1.2：通過XFTP把檔案上傳到master電腦bigData目錄下

1.3：解壓hadoop壓縮檔案

tar -xvf hadoop-2.8.0.tar.gz

1.4：進入壓縮檔案之後複製路徑

/bigData/hadoop-2.8.0

1.5：配置Hadoop的環境變數

vim /etc/profile

新增如下配置：

export HADOOP_HOME=/usr/bigdata/hadoop/hadoop-2.8.0

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

讓檔案生效:

wq!儲存並退出

source /etc/profile讓檔案生效

二：Hadoop叢集的配置

2.1:進入hadoop的配置檔案位置

進入hadoop配置檔案目錄

cd hadoop2.8.0/etc/hadoop/

2.2:配置hadoop-env.sh檔案

vim hadoop-env.sh

加入如下配置：

export JAVA_HOME=/usr/bigdata/java/jdk1.8.0_121

2.3:配置yarn-env.sh檔案

vim yarn-env.sh

加入如下配置：

export JAVA_HOME=/usr/bigdata/java/jdk1.8.0_121

2.4:配置slaves檔案，增加slave主機名或者IP地址

01.vim slaves

刪除原有localhost，加入子機器名稱或者ip地址

2.5:配置core-site.xml檔案

01.vim core-site.xml

02.在

configuration節點下加入如下配置：

<property>
     <name>fs.defaultFS</name>
     <value>hdfs://master:9000</value>
</property>
<property>
     <name>hadoop.tmp.dir</name>
    <value>/usr/bigdata/hadoop/hadoop-2.8.0/tmp</value> 
</property>

2.6:配置hdfs-site.xml檔案

vim hdfs-site.xml

在configuration節點下加入如下配置：

<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>master:50090</value>
</property>
<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>
<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/bigdata/hadoop/hadoop-2.8.0/hdfs/name</value>
</property>
<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/bigdata/hadoop/hadoop-2.8.0/hdfs/data</value>
</property>

2.7:配置yarn-site.xml檔案

在configuration節點下加入如下配置：

vim yarn-site.xml

<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<property>
     <name>yarn.resourcemanager.address</name>
     <value>master:8032</value>
 </property>
<property>
     <name>yarn.resourcemanager.scheduler.address</name>
     <value>master:8030</value>
</property>
<property>
      <name>yarn.log-aggregation-enable</name>
      <value>true</value>
</property>
<property>
      <name>yarn.resourcemanager.resource-tracker.address</name>
      <value>master:8031</value>
</property>
<property>
      <name>yarn.resourcemanager.admin.address</name>
      <value>master:8033</value>
</property>
<property>
      <name>yarn.resourcemanager.webapp.address</name>
      <value>master:8088</value>
</property>

2.8:配置mapred-site.xml檔案

mapred-site.xml.template存在

mapred-site.xml不存在

先要copy一份

cp mapred-site.xml.template mapred-site.xml

然後編輯

vim mapred-site.xml

在configuration節點下加入如下配置：

<property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
</property>
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
<property>
     <name>mapreduce.jobhistory.webapp.address</name>
     <value>master:19888</value>
</property>

2.9:把配置好的hadoop檔案複製到其他的子機器中

scp -r /usr/bigdata/hadoop/hadoop-2.8.0 [email protected]:/usr/bigdata/hadoop

3.0把配置好的/etc/profile複製到其他兩個子機器中

scp /etc/profile [email protected]:/etc/profile

分別在兩個子機器中應用/etc/profile

source /etc/profile

3.1：在master 主機器中執行

hdfs namenode -format

3.2：在master 主機器中啟動hadoop環境

進入/usr/bigdata/hadoop/hadoop-2.8.0/sbin

./start-all.sh 啟動hadoop叢集

./stop-all.sh 關閉hadoop叢集

3.3：jps

vim jps

3.4：啟動JobHistoryServer

./mr-jobhistory-daemon.sh start historyserver

訪問頁面：

http://192.168.77.99:50070

http://192.168.77.99:50090

http://192.168.77.99:8088

http://192.168.77.99:19888

Hadoop叢集搭建成功

3.5關閉：

第一步：

關閉JobHistoryServer

./mr-jobhistory-daemon.sh stop historyserver

第二步：

關閉hadoop叢集

./stop-all.sh

Linux 搭建Hadoop叢集成功

內容基於（自己的真是操作步驟編寫） Linux 搭建Hadoop叢集---Jdk配置 Linux 搭建Hadoop叢集 ---SSH免密登陸一：下載安裝 Hadoop 1.1：下載指定的Hadoop hadoop-2.8.0.tar.gz 1.2：通過XFTP把檔案上傳到master電腦bi

Ubuntu 搭建hadoop叢集成功，但MobaXterm無法遠端連線叢集各個節點

由於我是在VMware上使用的ubuntu系統，因此解決這個問題需要先了解一下VMware三種網路工作模式：我們可以看到有VMnet0（橋接模式）、VMnet1（僅主機模式）、VMnet8（NAT模式）其中： VMnet0表示的是：用於橋接模式下的虛擬交換機；

本地搭建hadoop叢集--hadoop2.7.6-src在linux上編譯解決downloading過慢教程

第一步：工具的準備 apache-ant-1.9.9-bin.tar.gz apache-maven-3.0.5-bin.tar.gz hadoop-2.7.6-src.tar.gz jdk1.7 就好別用1.8 據說用1.8 maven 編譯會報各種錯。 protobuf-2

在Linux的Centos6.5搭建hadoop叢集環境

Centos6.5搭建hadoop叢集環境先概括一下整體思路安裝centos6.5主機關閉防火牆和selinux 配置網路時間同步 ssh無密碼登入設定安裝jdk 安裝hadoop 啟動 wordcount測試安

docker中搭建Hadoop叢集

前提：jdk和ssh服務都已經安裝完成，如未完成，請參考博主所寫部落格 1、建立映象容器 -P將容器的所有埠對映到主機埠 docker run -itd -v /c/Users:/root/build -P -h master --name master --net mynetwork --

使用VMware搭建Hadoop叢集虛擬網路配置

使用NET模式，DNS地址就配置成閘道器的地址 NET虛擬網路配置 1、開啟VMware虛擬網路編輯器編輯-->虛擬網路編輯器-->VMnet8-->更改設定 2、配置主機網路地址 &nb

centos7克隆及網路和主機名配置（VMware15搭建Hadoop叢集）

1、克隆選中右鍵，選擇紅色方框（虛擬機器必須關閉狀態） 2、選中現有快照，但如果沒有拍攝快照則無法選中（如果能選中，則可以忽略此步驟）解決辦法: 一.選中需要克隆的虛擬機器右鍵點選二.更改名稱，點選拍攝快照三。如果不需要已經有了的快照，可以刪除了重新拍攝

配置NTP服務ntpd/ntp conf（搭建Hadoop叢集可參考）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

centos7搭建hadoop叢集之xcall指令碼

在一些特定場景下，需要所有節點同時執行相同的命令，比如主機hadoop1執行ls命令，其他節點主機也同時執行ls命令，實現這種效果快捷方式一般有兩種： 1.使用工具，同一傳送執行命令，如SecureCRT,同時連線所有節點，在視窗下面可以直接輸入需要同時執行的命令。優

centos7搭建hadoop叢集之rsync和xsync

文章記錄於各個伺服器（或者虛擬機器等）已經配置了ssh免密登入，可執行下面操作，未配置ssh免密登入，可參考：https://blog.csdn.net/yhblog/article/details/84029535 此文章是基於centos7minimal版本的，純淨系統，所以還

【搭建Hadoop叢集看一篇成高手系列01】hadoop執行環境的搭建篇——虛擬機器準備

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/wx1528159409 目錄 1. 在VMware Workstation下安裝CentOs，新建虛擬機器並安裝VMtools 2. 修改虛擬機器IP，聯網並連線Xshell 3

Centos 6.5 搭建hadoop 叢集

-----本叢集搭建案例，以4節點為例進行搭建 1.JDK環境安裝（jdk-7u45-linux-x64.tar.gz 為例下載地址： https://download.csdn.net/download/sq347216161/10308549） 1.1.上傳jdk安裝包 1.2.規

從零開始搭建hadoop叢集

創作不易，請勿抄襲，轉載請註明出處。如有疑問，請加微信 wx15151889890，謝謝。 [本文連結:]https://blog.csdn.net/wx740851326/article/details/https://blog.csdn.net/wx740851326/article

在搭建Hadoop叢集環境時遇到的一些問題

最近在學習搭建hadoop叢集環境，在搭建的過程中遇到很多問題，在這裡做一些記錄。1. SSH相關的問題　　問題一: ssh: connect to host localhost port 22: Connection refused　　問題二: 遠端連線需要輸入密碼。　　參照以下部落格即可解決:　　　　Li

Windows 的java客戶端實現上傳檔案到Linux的Hadoop叢集上(注意ip和埠是否一致)

我這幾天一直在學大資料，處於入門階段，然後老師的視訊中教學有用windows的java客戶端上傳檔案到Linux的Hadoop叢集，但是這邊出BUG了一直上傳不上去，執行程式後一直沒反應。。。。弄了幾天（雖然這幾天在做前端專案~~~）然後問群裡的大佬，他們說應該是ip和埠

基於Centos7+Docker 搭建hadoop叢集

總體流程：獲取centos7映象為centos7映象安裝ssh 使用pipework為容器配置IP 為centos7映象配置java、hadoop 配置hadoop 1.獲取centos7映象 $ docker pull centos:7 //檢視當前已下載docke

本地搭建hadoop叢集--kylin的安裝（叢集部署）

kylin官方安裝文件 http://kylin.apache.org/cn/docs/install/configuration.html 總結： 1、關於麒麟高可用涉及負載均衡官網都說超出範圍了，安裝只考慮安裝的事情，其餘的先忽略 2、kylin在啟動的時候會自動檢測你本地h

本地搭建hadoop叢集--sqoop的安裝.1.4.7 使用db2

安裝 1、解壓tar包 2、進入conf目錄 3、修改配置檔案 cp -a sqoop-env-template.sh sqoop-env.sh vm sqoop-env.sh export HADOOP_COMMON_HOME=/opt/mo

本地搭建hadoop叢集--hbase和zookeeper的安裝

zookeeper的安裝 1、解壓tar包 2、修改配置檔案 cd conf cp -a zoo_sample.cfg zoo.cfg vim zoo.cfg 配置 dataDir=/opt/module/zookeeper-3.4.12/data 以

本地搭建hadoop叢集-hive多節點訪問(hive2.3.3)

一、思路 1.安裝hadoop叢集。我這裡使用的是自己編譯的2.7.6 2.元資料使用mysql作為技術支撐 3.配置hive引數分發至各個節點 4.hive服務端啟動 5.各個節點hive客戶端訪問二、mysql的安裝 rpm -q mysq

Linux 搭建Hadoop叢集 成功

一：下載安裝 Hadoop

1.1：下載指定的Hadoop

1.2：通過XFTP把檔案上傳到master電腦bigData目錄下

1.3：解壓hadoop壓縮檔案

1.4：進入壓縮檔案之後 複製路徑

1.5：配置Hadoop的環境變數

二：Hadoop叢集的配置

2.1:進入hadoop的配置檔案位置

2.2:配置hadoop-env.sh檔案

2.3:配置yarn-env.sh檔案

2.4:配置slaves檔案，增加slave主機名或者IP地址

2.5:配置core-site.xml檔案

2.6:配置hdfs-site.xml檔案

2.7:配置yarn-site.xml檔案

2.8:配置mapred-site.xml檔案

2.9:把配置好的hadoop檔案複製到其他的子機器中

3.0把配置好的/etc/profile複製到其他兩個子機器中

3.1：在master 主機器中執行

3.2：在master 主機器中啟動hadoop環境

3.3：jps

3.4：啟動JobHistoryServer

3.5關閉：

相關推薦

Linux 搭建Hadoop叢集成功

1.4：進入壓縮檔案之後複製路徑