1. 程式人生 > >hadoop docker安裝部署

hadoop docker安裝部署

前置條件

1.jdk映象
2.hadoop安裝包

解壓安裝包

tar -zxvf cenos-6.5-hadoop-2.6.4.tar.gz -C /usr/local
cd /usr/local
mv hadoop-2.6.4 hadoop

修改配置檔案:

cd hadoop/etc/hadoop
vim hadoop-env.sh

修改JAVA_HOME為配置好的java目錄。 這裡主要是因為需要指令碼都是ssh到其他slaves上啟動他們的程序,ssh + command的方式不是login shell。所以不會載入/etc/profile。如果無法讀取到JAVA_HOME,則啟動不成功,其實在容器中,如果都是自行啟動自己的程序,這個變數不配置應該是沒問題的。

2.修改core-site.xml

vim core-site.xml

修改成如下內容:

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoopMaster:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/hadoopData</value>
</property>
</configuration>

fs.defaultFS指定了hdfs的namenode地址
hadoop.tmp.dir指定了hdfs的工作目錄

3.修改hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

dfs.replication指定了資料的副本數目 這個檔案還可以指定namenode工作目錄和datanode工作目錄,還可以指定secondaryNamenode的地址
(secondaryNamenode在高版本中基本不會被使用了,主要是用來備份namenode資料的,當namenode掛了之後可以在secondNamenode中找到資料,恢復回來,secondaryNamenode並不能代替namenode的作用,在HA中,用兩個namenode的方式,secondaryNamenode基本沒有使用的必要了)

4.修改mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

mapreduce.framework.name指定了mapreduce使用的提交方式
hadoop的mapreduce方式其實相對來說已經用的不多了,後面我們採用spark來處理資料,而不使用hadoop mapreduce。所以其實這裡配不配關係不大,因為我們不會啟動yarn.

5.修改yarn-site.xml

<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop01</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

yarn.resourcemanager.hostname指定resourcemanager地址 yarn.nodemanager.aux-services指定了map和reduce之間使用shuffle的方式來協助。
同樣的,這個其實不配也可以。因為我們不啟動yarn

6.修改slaves 這個檔案用來指明工作節點。當呼叫start-dfs.sh的時候,會讀取slaves檔案,並ssh過去啟動上面的datanode。 如果需要的話。可以配置。 但是在我的想法裡,容器啟動自動啟動自己的namenode或datanode,所以可以不需要slaves檔案,也不需要呼叫start-dfs.sh

格式化namenode

啟動namenode之前一定要格式化namenode,生成對應的clusterId和blockpoolID。

hdfs namenode -format

啟動namenode/datanode

可以呼叫start-dfs.sh指令碼啟動整個叢集,也可以一個一個自己啟動。

hadoop-daemon.sh start namenode
或者
hadoop-daemon.sh start datanode

可以採用jps檢視是否啟動成功。 列印的日誌位於$HADOOP_HOME/logs。可以檢視對應的日誌。

最終commit得到映象之後
對於namenode節點,docke run增加hdfs namenode -format和hadoop-daemon.sh start namenode,並指定固定ip。

對於datanode節點,docker run增加hadoop-daemon.sh start datanode並echo "hadoopip hadoopMaster" >> /etc/hosts。

相關推薦

hadoop docker安裝部署

前置條件 1.jdk映象 2.hadoop安裝包 解壓安裝包 tar -zxvf cenos-6.5-hadoop-2.6.4.tar.gz -C /usr/local cd /usr/local mv hadoop-2.6.4 hadoop 修改配置檔案: cd

Centos7.3 Docker安裝部署學習記錄1

docker一、Docker基礎環境的安裝1. 環境說明本機采用操作系統如下: CentOS-7.3-X86-64,內核3.10 x64位,docker 1.12.x版本。 建議采用CentOS7版本或ubuntu版本,本文采用CentOS7即CentOS-7-x86_64-DVD-1611.iso版本最

docker 安裝部署 redis

red 51cto mage 如果 ffffff clas git use png 搜索redisdocker search redis下載最新的redis docker pull redis:latest下載redis配置文件wget https://raw.github

Centos7 Docker安裝部署Rancher

維護 官方 follow yum安裝 image 一鍵 基於 報錯 arm Rancher簡介 Rancher是一個開源的企業級容器管理平臺。通過Rancher,企業再也不必自己使用一系列的開源軟件去從頭搭建容器服務平臺。Rancher提供了在生產環境中使用的管理Dock

使用docker安裝部署redis

docker search  redis docker pull redis  docker images docker run -p 6379:6379 -v $PWD/data:/data &

使用Docker安裝部署RabbitMQ

docker search rabbitmq:management docker pull rabbitmq:management 注意:如果docker pull rabbitmq 後面不帶management,啟動rabbitmq後是無法開啟管理介面的,

hadoop--presto安裝部署

  系統環境:hadoop + hive已經配置完成 1、下載presto:https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.167/presto-server-0.167.tar.gz 2、解壓安裝 #&n

centos7 docker安裝部署ffmpeg——(持續更新中)

“持續跟新中” 搭建ffmpeg 視訊轉碼的工具可能有很多,但開源且使用人數最多的還是莫過於ffmpeg這個工具,具體功能筆者不在這裡詳細講解;安裝此工具的方式有很多,比如apt安裝、原始碼安裝、docker安裝等等,不過docker是跨平臺的,因此筆者這裡將以docker方式安裝為

Docker安裝部署RabbitMQ

  1. 安裝docker加速 https://blog.csdn.net/kq1983/article/details/83041322   2. 映象查詢 docker search rabbitmq:management 3.  下載映象

Docker安裝部署簡單記錄

http://elrepo.org/tiki/tiki-index.php 安裝ELERPO源(和docker沒關)https://www.cnblogs.com/stulzq/p/7743073.html#undefined參考https://docs.docker.com/install/linux/do

docker 安裝部署 redis(配置檔案啟動)

安裝 docker #安裝 docker yum install docker -y systemctl start docker.service 獲取 redis 映象 docker search redis docker pull redis:latest docker ima

1.Hadoop叢集安裝部署

Hadoop叢集安裝部署 1.介紹 (1)架構模型 (2)使用工具 VMWARE cenos7 Xshell Xftp jdk-8u91-linux-x64.rpm hadoop-2.7.3.tar.gz 2.安裝步驟 (1)部署master 建立一臺虛擬機器 Xftp傳輸jdk、hadhoop安裝

使用Docker安裝部署Redis Cluster叢集

本文主要展示Redis Cluster的部署步驟。1準備階段:Dockerfile檔案內容FROM alpine:3.7 # add our user and group first to make sure their IDs get assigned consisten

Docker——安裝部署(二)

一、測試是否已安裝docker [[email protected] ~]# docker -bash: docker: command not found [[email protected] ~]# docker version -bash: do

002.Docker安裝部署

一 docker安裝-CentOS系統 1.1 docker自動安裝指令碼 1 [email protected]:~# wget -qO- https://get.docker.com/ | sh 2 或—— 3 [email protected]:~# cu

使用docker安裝部署oracle12.2

1. 步驟 在Mac上安裝docker 使用oracle的dockerfile,構建image 在docker中執行oracle例項 啟動,停止oracle docker容器 連線資料庫 2. 在Mac上安裝docker 到docker sto

Zabbix在docker安裝部署

一、建立docker-compose.yml檔案 首先建立一份docker-compose.yml檔案,使用docker-compose進行容器的編排。 $ mkdri /zabbix #在根目錄建立zabbix檔案 $ cd /zabbix $

Docker實戰:Docker安裝部署RabbitMQ

使用Docker安裝部署RabbitMQ 1、docker search rabbitmq:management 2、docker pull rabbitmq:management 注意:如果docker pull rabbitmq 後面不帶management

docker安裝部署sentry

筆者曾經花了很長時間去一步步安裝sentry,成功過也失敗過,遇到各種各樣的問題,直到後來遇到了sentry,免去我安裝部署之苦現在說下步驟 安裝docker,使用命令 sudo yum -y install docker-io 啟動docker 使用

Docker實戰:使用Docker安裝部署Gitlab

配置Gitlab 剛剛啟動Gitlab的時候需要我們輸入一個密碼,這個密碼是管理員使用者的密碼。我們在登入那裡使用root作為使用者名稱,然後用剛剛設定的密碼,就可以以管理員身份登入Gitlab。 登入進去之後,點選右上角的齒輪圖示,即可進入到管理員頁面。在這裡我們可以設定很多東西。比如說,預設情況下每個使