Docker環境下部署單機偽分散式hadoop環境

阿新 • • 發佈：2021-08-04

準備工作：準備hadoop-2.7.7.tar.gz、jdk-8u191-linux-x64.tar.gz壓縮包，版本可以不同，我這裡用的是hadoop-2.7.7和jdk1.8。

1. 上傳hadoop-2.7.7.tar.gz、jdk-8u191-linux-x64.tar.gz壓縮包。

[root@master ~]# cd /home/azl

[root@master azl ]# ll

2. 建立Dockerfile檔案

[root@master azl ] # vim Dockerfile

#選擇centos7.7.1908作為基礎映象#選擇centos7.7.1908作為基礎映象

FROM centos:centos7.7.1908

#映象維護者資訊（根據自己的資訊進行修改）

MAINTAINER [email protected]

#構建容器時需要執行的命令

#安裝openssh-server. openssh-clents. sudo、 vim和net-tools軟體包

RUN yum install -y openssh-server openssh-clients sudo vim net-tools

#生成相應的主機金鑰檔案

RUN ssh-keygen -t rsa -f /etc/ssh/ssh_host_rsa_key

RUN ssh-keygen -t ecdsa -f /etc/ssh/ssh_host_ecdsa_key

RUN ssh-keygen -t ed25519 -f /etc/ssh/ssh_host_ed25519_key

#將宿主機的檔案拷貝至境像(ADD會自動解壓)，這裡要切換到jdk和hadoop壓縮包所在路徑

ADD jdk-8u191-linux-x64.tar.gz /usr/local

ADD hadoop-2.7.7.tar.gz /usr/local

#設定環境變數

ENV CENTOS_DEFAULT_HOME /root

ENV JAVA_HOME /usr/local/jdk1.8.0_191

ENV HADOOP_HOME /usr/local/hadoop-2.7.7

ENV JRE_HOME ${JAVA_HOME}/jre

ENV CLASSPATH ${JAVA_HOME}/lib:${JRE_HOME}/lib

ENV PATH ${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

#終端預設登入進來的工作目錄

WORKDIR $CENTOS_DEFAULT_HOME

#啟動sshd服務並且暴露22埠

EXPOSE 22

CMD ["/usr/sbin/sshd", "-D"]CMD ["/usr/sbin/sshd", "-D"]

3. 編譯docker檔案

[root@master azl ] # docker build -t xxx/hadoop:2.7.7 . #-t後面是映象名，根據需要修改

4. 設定網路

[root@master azl ] # docker network ls

[root@master azl ] # docker network inspect [容器id]

5. 建立自己的網路

[root@master azl ] # docker network create --subnet=172.22.0.0/16 mynetwork（mynework網路名隨便取）

6. 檢視映象

[root@master azl ] # docker images

7. 執行容器並進行埠對映

[root@master azl ] #docker run -d --name hadoop --hostname hadoop -P -p 50070:50070 -p 8088:8088 -p 19888:19888 --net mynetwork --ip 172.22.0.2 b3327df9f137[映象id]

8. 檢視容器

[root@master azl ] # docker ps

可以看到容器已經執行起來了，下面進入容器內部

9. 進入容器

[root@master azl ] # docker exec -ti 98b98c1b083c[容器id] /bin/bash

10. 設定ssh免密登入

[root@hadoop ~ ] # cd ~/.ssh

如果出現這種情況，說明root使用者下沒有登陸過ssh，登陸一下就好了

執行ssh localhost

一路回車，再次執行cd ~/.ssh,成功進入.ssh目錄

[root@hadoop ~ ] # ssh-keygen -t rsa，一路回車

生成兩個檔案，一個私鑰，一個公鑰，執行：cp id_rsa.pub authorized_keys

11. 本機無金鑰登入

修改authorized_keys許可權：chmod 644 authorized_keys

嘗試登入和退出，好了，現在可以無金鑰登入了。

12. 建立臨時資料夾

[root@hadoop ~]# mkdir /usr/local/hadoop-2.7.7/tmp

[root@hadoop ~]# mkdir -p /usr/local/hadoop-2.7.7/dfs/namenode_data

[root@hadoop ~]# mkdir -p /usr/local/hadoop-2.7.7/dfs/datanode_data

13. 切換到hadoop-2.7.7目錄下

[root@hadoop ~]# cd /usr/local/ hadoop-2.7.7

[root@hadoop hadoop-2.7.7]# java -version

[root@hadoop hadoop-2.7.7]# cd etc/hadoop

[root@hadoop hadoop]# vim hadoop-env.sh

按照如下配置，儲存退出。

14. 修改core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml配置檔案。

[root@hadoop hadoop]# vim core-site.xml

core-site.xml：

<configuration>
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop:9000</value>
  </property>

  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop-2.7.7/tmp</value>
  </property>
 </configuration>

[root@hadoop hadoop]# vim hdfs-site.xml

hdfs-site.xml：

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>

  <property>
    <name>dfs.name.dir</name>
    <value>/usr/local/hadoop-2.7.7/dfs/namenode_data</value>
  </property>

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/usr/local/hadoop-2.7.7/dfs/datanode_data</value>
  </property>

  <property>
    <name>dfs.permissions</name>
    <value>false</value>
  </property>
 </configuration>

我們這裡先複製一份mapred-site.xml.template並改名為mapred-site.xml

[root@hadoop hadoop]# cp mapred-site.xml.template mapred-site.xml

vim開啟

[root@hadoop hadoop]# vim mapred-site.xml

mapred-site.xml：

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

  <property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop:10020</value>
  </property>

  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop:19888</value>
  </property>
</configuration>

[root@hadoop hadoop]# vim yarn-site.xml

yarn-site.xml：

 <configuration>

  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop</value>
  </property>

  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>

  <property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
  </property>

  <property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
  </property>
</configuration>

15. 配置所有從屬節點的主機名或ip地址，由於是單機版，所以指定本機即可

[root@hadoop hadoop]# vim slaves

16. 切換到根目錄

[root@hadoop hadoop]# cd

[root@hadoop ~]# clear

格式化

[root@hadoop ~]# hdfs namenode -format

[root@hadoop ~]# start-dfs.sh

[root@hadoop ~]# start-yarn.sh

[root@hadoop ~]# mr-jobhistory-daemon.sh start historyserver

jps檢視，現在hadoop環境已經配置好了，瀏覽器訪問50070、19888埠可以看到hadoop介面

[root@hadoop ~]# jps

此時，我們的hadoop環境就已經搭建好了，下面在瀏覽器訪問試試。

http://ip:50070

http://ip:19888

Docker環境下部署單機偽分散式hadoop環境

準備工作：準備hadoop-2.7.7.tar.gz、jdk-8u191-linux-x64.tar.gz壓縮包，版本可以不同，我這裡用的是hadoop-2.7.7和jdk1.8。

Hadoop安裝教程_單機/偽分散式配置_Hadoop2.6.0(2.7.1)/Ubuntu14.04(16.04)

點選這裡觀看廈門大學林子雨老師主講《大資料技術原理與應用》授課視訊當開始著手實踐 Hadoop 時，安裝 Hadoop 往往會成為新手的一道門檻。儘管安裝其實很簡單，書上有寫到，官方網站也有 Hadoop 安裝配置教程，但由

linux環境下部署jmeter分散式（叢集）

安裝jdk和jmeter 一、安裝jdk，要用1.8及以上版本在control和agent機器上都要安裝，步驟： • 將jdk壓縮包上傳到伺服器，並使用命令： tar –zxvf jdk-8u11-linux-x64.tar.gz 將安裝包解壓 • 若是zip包

Hadoop單機/偽分散式配置安裝教程

Hadoop單機/偽分散式配置安裝教程 1、環境名稱物理IP 說明版本作業系統 hadoop 192.168.200.33

redis生產環境下部署lua指令碼

載入到redis redis-cli script load \"$(cat test.lua)\" 得到sha1值執行 redis-cli evalsha \"7a2054836e94e19da22c13f160bd987fbc9ef146\" 0

詳解Ubuntu環境下部署Django+uwsgi+nginx總結

前言這是我在搭建Django專案時候的過程，拿來總結記錄，以備不時之需。專案採用nginx+uwsgi的搭配方式。

Windows域環境下部署ISA Server 2006防火牆（四）

構建基於ISA Server 2006的遠端接入×××伺服器接上回，本次將會說到在ISA Server 2006上配置遠端接入×××服務。以此來解決公司員工出差之後訪問公司內部的問題。配置了

在Linux環境下部署springboot專案

眾所周知，springboot專案是將專案打包成一個jar包，通過Java命令直接執行jar即可啟動web專案，因為springboot使用了內嵌的Tomcat，所以就不用在打包成war包在放到Tomcat的webapps目錄下了。

[學習筆記]Linux環境下部署 .Net5 程式

公司的專案需要部署到一臺公網的linux伺服器，以便同事們測試小程式。目標伺服器是新搭建的CentOS 8虛擬機器，以非docker的方式部署。現記錄過程便於日後部署至專案甲方的伺服器上，因為甲方的伺服器可能未聯網，

spring boot專案在外部tomcat環境下部署

spring-boot預設提供內嵌的tomcat，所以打包直接生成jar包，用java -jar命令就可以啟動。但是，有時候我們更希望一個tomcat來管理多個專案，這種情況下就需要專案是war格式的包而不是jar格式的包。spring-boot同樣提

用PHPstudy工具在Windows環境下部署商城系統

前言：為了試驗測試專案，在網上找的PHP商城專案，在虛擬機器-win10上部署環境

內網代理上網環境下，搭建vue-element-admin環境

內網代理上網環境下，搭建vue-element-admin環境公司（外包）開發機器一直只能通過http代理上網，我覺得領導們給這個小水管只是為了方便查查資料。

在Centos7環境下進行搭建postgresql-xl叢集環境

技術標籤：資料庫linuxjava大資料hadoop 本次使用環境centos7，共3臺伺服器，基礎配置採用4核4G記憶體200G機械硬碟

配置不同環境下啟用swagger，在生產環境關閉swagger

前言 Swagger使用起來簡單方便，幾乎所有的API介面文件都採用swagger了。使用示例：http://www.cnblogs.com/woshimrf/p/swagger.html，現在開發中可以參考文件，但生產環境並不想暴露出去。

Hadoop單節點偽分散式環境部署

Hadoop單節點偽分佈環境部署 1、背景知識 2、使用軟體及其版本環境虛擬機器:VirtualBox 6.0.24 r139119

Window 10 WSL 下hadoop 偽分散式安裝

Window 10 下的WSL子系統的安裝可以參考之前的文章：window10 WSL子系統上設定redis開發環境

Hadoop框架：單服務下偽分散式叢集搭建

本文原始碼：GitHub·點這裡 ||GitEE·點這裡一、基礎環境 1、環境版本環境：centos7

最全面的CentOS下hadoop的偽分散式安裝

在開始之前請先確保你已經進行了CentOS的網路配置，詳情請見CentOS搭建！一、安裝java環境

centos7.7環境下使用docker-compose部署elasticsearch7.4叢集並設定密碼

centos7.7環境下使用docker-compose部署elasticsearch7.4叢集並設定密碼Elasticsearch從6.8開始，允許免費使用者使用X-Pack的安全功能，設定密碼了會讓系統安全很多因為es是有狀態的系統，生產環境中最好直接部署在宿

hadoop 偽分散式完全分散式及HA部署

https://www.jianshu.com/p/6dda4f79379e https://blog.csdn.net/qq_25542879/article/details/89554068 1、製作Hadoop偽叢集映象