Centos安裝Hadoop叢集

阿新 • • 發佈：2018-12-21

提示：

需要修改hosts檔案，文章中使用hostname代替ip地址

需要SSH無金鑰登入配置

需要配置rsync遠端同步工具

1）叢集部署規劃

centos01.bkm

centos02.bkm

centos03.bkm

HDFS

NameNode

DataNode

SecondaryNameNode

DataNode

YARN

NodeManager

ResourceManager

NodeManager

2）配置檔案

（1）core-site.xml

<!-- 指定HDFS中NameNode的地址 -->
	<property>
		<name>fs.defaultFS</name>
        <value>hdfs://centos01.bkm:9000</value>
	</property>
	<!-- 指定hadoop執行時產生檔案的儲存目錄 -->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/opt/hadoop/data/tmp</value>
	</property>

（2）hdfs

hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.7.0_79

hdfs-site.xml

<configuration>	
	<property>
		<name>dfs.replication</name>
		<value>3</value>
	</property>
	<property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>centos03.bkm:50090</value>
    </property>
</configuration>

slaves(注意，不能有空格空行和多餘字元)

centos01.bkm
centos02.bkm
centos03.bkm

（3）yarn

yarn-env.sh

export JAVA_HOME=/opt/module/jdk1.7.0_79

yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
<!-- reducer獲取資料的方式 -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

<!-- 指定YARN的ResourceManager的地址 -->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>centos02.bkm</value>
	</property>
</configuration>

（4）mapreduce

mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.7.0_79

mapred-site.xml

<configuration>
<!-- 指定mr執行在yarn上 -->
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

3）在叢集上分發以上所有檔案

cd /opt/hadoop/etc/hadoop
xsync /opt/hadoop/etc/hadoop

4）檢視檔案分發情況

xcall cat /opt/module/hadoop-2.7.2/etc/hadoop/slaves

5）叢集啟動及測試

如果叢集是第一次啟動，需要格式化namenode，如果重新格式化則需要先刪除data中資料
    bin/hdfs namenode -format
1）啟動/停止HDFS：啟動後使用jps命令看是否跟規劃節點一樣
sbin/start-dfs.sh/
sbin/stop-dfs.sh
2）啟動/停止yarn：啟動後使用jps命令看是否跟規劃節點一樣
sbin/start-yarn.sh
sbin/stop-yarn.sh
#注意：Namenode和ResourceManger如果不是同一臺機器，不能在NameNode上啟動 yarn，應該在ResouceManager所在的機器上啟動yarn。


上傳檔案
hadoop fs -put /home/centos/Downloads/hadoop-2.7.7.tar.gz /user/centos/input
如果上傳完檔案後沒有產生備份，則需要檢視對應埠是否開放

上傳檔案後進入data的最深層目錄
-rw-r--r--. 1 root root 134217728 Dec  3 21:25 blk_1073741830
-rw-r--r--. 1 root root   1048583 Dec  3 21:25 blk_1073741830_1006.meta
-rw-r--r--. 1 root root  84502793 Dec  3 21:25 blk_1073741831
-rw-r--r--. 1 root root    660187 Dec  3 21:25 blk_1073741831_1007.meta
touch tmp
cat blk_1073741830>>tmp
cat blk_1073741831>>tmp
tar -zxvf tmp 
可得到解壓後的hadoop-2.7.7.tar.gz

Centos安裝Hadoop叢集

提示：需要修改hosts檔案，文章中使用hostname代替ip地址需要SSH無金鑰登入配置需要配置rsync遠端同步工具 1）叢集部署規劃 centos01.bkm centos02.bkm

Centos 7 安裝Hadoop叢集

Hadoop學習筆記 1. 準備工作 1.1 虛擬機器安裝jdk 準備3臺centos7的虛擬機器配置jdk 按照連結裡安裝的虛擬機器為最小虛擬機器,裡面並未安裝jdk 安裝jdk yum install java-1.8.0-openjdk*

大資料環境基礎之Centos安裝Haoop叢集（5）安裝hadoop叢集

首先要去下載hadoop-2.5.2.tar.gz安裝包，將安裝包移動到當前使用者的根目錄解壓用命令ls檢視解壓後的hadoop 配置hadoop環境變數配置jdk路徑，終端輸入 vi hadoop-env.sh 配置yarn環境變數 yarn-env

CentOS 安裝 Hadoop

masters home min -a hdfs mirror format default amp 原文地址：http://www.cnblogs.com/caca/p/centos_hadoop_install.html 下載和安裝 download

cdh 安裝hadoop叢集

hadoop基礎----hadoop實戰(六)-----hadoop管理工具---Cloudera Manager---CDH介紹簡介我們在上篇文章中已經瞭解了CDH，為了後續的學習，我們本章就來安裝CDH5.8。CDH5.8是目前比較新的版本，自帶hadoop2.0以上的hadoop，

centos安裝hadoop超級詳細沒有之一

1、準備工作不知道怎麼回事圖片顯示不了：所以我把東西放在了我 1.1 建立hadoop使用者如果你安裝 CentOS 的時候不是用的 “hadoop” 使用者，那麼需要增加一個名為 hadoop 的使用者。首先點選左上角的 “應用程式” -> “系統工具”

Linux上安裝Hadoop叢集(CentOS7+hadoop-2.8.0)

關鍵字：Linux CentOS Hadoop Java 版本： CentOS7 Hadoop2.8.0 JDK1.8 說明：Hadoop從版本2開始加入了Yarn這個資源管理器，Yarn並不需要單獨安裝。只要在機器上安裝了

Centos安裝Hbase叢集

1、前提需要安裝Jdk、Zookeeper、Hadoop 2、上傳解壓 3、修改配置檔案 hbase-env.sh #JAVA_HOME地址 export JAVA_HOME=/opt/java/jdk1.8/ #是否是有預設zk export HBASE_MANAGES_ZK=fa

centos下hadoop叢集搭建詳細過程

Hadoop叢集搭建全過程參考操作：課本劉鵬《雲端計算》，劉鵬《實戰hadoop》，上網google 需要軟體：VMware-workstation-9.0.exe；CentOS-6.4-i386-bin-DVD1.iso（3.51G，裡面的外掛比較全，VMtools都

CentOS安裝HDP叢集-1 安裝mysql、Ambari

安裝HDP前，先要安裝Ambari，它提供了圖形化安裝和管理hadoop叢集。 CDH官網：https://docs.hortonworks.com/index.html 可以選擇版本下載：然後點安裝後面就到安裝文件頁面了,後面可以根據它來安裝了。本次安裝環境介紹下

安裝HADOOP叢集伺服器

1. 規劃功能 HOSTNAME IP 說明 Master HDM01 192.168.1.1 Namenode 兼datanode Slave HDS02 192.168.1.2 Datanode Slave HDS03 192.16

Hadoop學習之Centos安裝Hadoop和配置

一、確保Centos配置過JDK二、解壓Hadoop（我是使用的虛擬機器，在官網上下載好了linux版本的之後，通過FTP傳到Home資料夾下的）三、配置Hadoop進入hadoop資料夾中的etc下修改配置檔案1》先修改 hadoop-env.sh 檔案將 export

linux虛擬機器安裝hadoop叢集（hadoop-2.7.5）

<property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.name.di

CDH 安裝hadoop 叢集中的一些問題歸納--- 持續更新

最近自己在研究CDH 安裝Hadoop叢集，CDH 叢集的好處就是可以不用手工修改大量的配置檔案，然後去分發到所有的機器中，節省大量的人力和時間。效率比較高，一般配合CM 的圖形介面來完成所有操作，包

Linux虛擬機器上安裝Hadoop叢集（初學）

測試已成功完成安裝的版本 hbase-1.2.6-bin.tar.gz hadoop-2.7.5.tar.gz ubuntu-16.04.3-server-amd64.ios jdk-8u161-linux-x64.tar.gz zookeeper-3

Hadoop叢集的安裝二安裝hadoop叢集

1 解壓hadoop並配置相關環境變數以hadoop使用者名稱解壓hadoop壓縮檔案 JAVA_HOME=/usr/java/jdk1.8.0_144 JRE_HOME=/usr/java/jdk1.8.0_144/jre HADOOP_HOME=/home/ha

大資料環境基礎之Centos安裝Haoop叢集（4）ssh免密碼登入

ssh免密碼登入的配置需要在當前使用者下的根目錄下用命令ssh-keygen -t rsa生成公鑰和祕鑰用命令ls -a檢視.ssh檔案進入.ssh資料夾裡面，用命令ls檢視公鑰和祕鑰將公鑰儲存在authorized_keys檔案中修改authorized

HDP學習--Ambari安裝Hadoop叢集步驟

一、安裝前的準備軟硬體需求：專案指標 os red hat6.5.x86_64 java 1.8.0_101 ambari AMBARI-2.2.1.0 HDP HDP2.4.0.0

成功安裝hadoop叢集

之前學習了一段時間的hadoop，最近想總結一下自己的成果，便用寫部落格的方式去複習。hadoop入門難就難在搭建叢集。初學的開發人員大可不必去研究hadoop安裝，可以先往後面學習。所以這裡總結hadoop安裝步驟供初學者拷貝。 1：hadoop和jdk下載為了保證之後

docker安裝hadoop叢集

前置條件：首先確保系統已經正確安裝docker 驗證： sudo docker version or sudo docker -v 啟動docker sudo service

Centos安裝Hadoop叢集

相關推薦