Centos 7 安裝Hadoop叢集

阿新 • • 發佈：2018-12-15

Hadoop學習筆記

1. 準備工作

1.1 虛擬機器安裝jdk

準備3臺centos7的虛擬機器

配置jdk

按照連結裡安裝的虛擬機器為最小虛擬機器,裡面並未安裝jdk

安裝jdk

yum install java-1.8.0-openjdk* -y

檢視javaanz

[[email protected] hadoop]# which java

/usr/bin/java

[[email protected] hadoop]# ls -lrt /usr/bin/java

lrwxrwxrwx. 1 root root 22 10月 12 11:16 /usr/bin/java -> /etc/alternatives/java

[[email protected] hadoop]# ls -lrt /etc/alternatives/java

lrwxrwxrwx. 1 root root 73 10月 12 11:16 /etc/alternatives/java -> /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.181-3.b13.el7_5.x86_64/jre/bin/java

1.2 虛擬機器間建立信任關係-免密登入

1.2.1 修改hostname

以vm1為例,輸入命令

hostname

修改名稱

hostname 名稱

這裡ip和hostname對應為

vm1 192.168.191.133 hadoop-server1

vm2 192.168.191.135 hadoop-server2

vm3 192.168.191.134 hadoop-server3

1.2.2 修改hosts檔案

vi /etc/hosts

加入以下內容 (自己3臺虛擬機器的ip及對應的hostname)

192.168.191.133 hadoop-server1

192.168.191.135 hadoop-server2

192.168.191.134 hadoop-server3

1.2.3 檢查是否ping通

vm1輸入以下命令:

ping -c 3 hadoop-server2

ping -c 3 hadoop-server3

vm2 輸入以下命令:

ping -c 3 hadoop-server3

這樣的結果說明三個虛擬機器是互通的

1.2.4 虛擬機器生成祕鑰檔案

以vm1為例,3臺虛擬機器同樣操作

ssh-keygen -t rsa -P ''

檢視是否建立成功(當前賬戶為root賬戶)

1.2.5 建立並分享authorized_keys檔案

進入/root/.ssh目錄,執行命令建立authorized_keys檔案,此時為空白檔案

touch /root/.ssh/authorized_keys

執行命令,將本機公鑰複製到authorized_keys檔案:

cp /root/.ssh/id_rsa.pub /root/.ssh/authorized_keys

開啟另外兩臺虛擬機器上的公鑰檔案

vi /root/.ssh/id_rsa.pub

複製給vm1上的authorized_keys裡面,如下:

複製vm1上的authorized_keys檔案給另外兩臺虛擬機器的.shh檔案中

通過ftp工具將此檔案複製到另外兩臺虛擬機器上

測試ssh連線,以vm1為例

ssh hadoop-server2

ssh hadoop-server3

測試完成,exit退出,負責是在其他虛擬機器上進行操作了

到這步,三臺虛擬機器之間的信任關係已經建立

2 安裝hadoop

2.1 下載hadoop,連結為:

通過ftp上傳至3臺虛擬機器上新建的/opt/hadoop檔案裡,上傳完成後,進行以下操作

2.2 安裝配置hadoop

cd /opt/hadoop

執行解壓命令：

tar -xvf hadoop-2.8.0.tar.gz

說明：3臺機器都要進行上述操作，解壓縮後得到一個名為hadoop-2.8.0的目錄。

新建目錄

mkdir /root/hadoop

mkdir /root/hadoop/tmp

mkdir /root/hadoop/var

mkdir /root/hadoop/dfs

mkdir /root/hadoop/dfs/name

mkdir /root/hadoop/dfs/data

2.2.1 修改配置檔案core-site.xml

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/core-site.xml

在<configuration>節點內加入配置:

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/root/hadoop/tmp</value>

                <description>Abase for other temporary directories.</description>

        </property>

        <property>

                <name>fs.default.name</name>

                <value>hdfs://hadoop-server1:9000</value>

        </property>

2.2.2 修改配置檔案hdfs-site.xml

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/hdfs-site.xml

在<configuration>節點內加入配置:

        <property>

                <name>dfs.name.dir</name>

                <value>/root/hadoop/dfs/name</value>

                <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.</description>

        </property>

        <property>

                <name>dfs.data.dir</name>

                <value>/root/hadoop/dfs/data</value>

                <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.</description>

        </property>

        <property>

                <name>dfs.replication</name>

                <value>2</value>

        </property>

        <property>

                <name>dfs.permissions</name>

                <value>ture</value>

                <description>need not permissions</description>

        </property>

2.2.4 生成並修改配置檔案mapred-site.xml

在該版本中，有一個名為mapred-site.xml.template的檔案，複製該檔案,命令是：

cp /opt/hadoop/hadoop-2.8.0/etc/hadoop/mapred-site.xml.template /opt/hadoop/hadoop-2.8.0/etc/hadoop/mapred-site.xml

然後改名為mapred-site.xml

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/mapred-site.xml

在<configuration>節點內加入配置:

        <property>

                <name>mapred.job.tracker</name>

                <value>hadoop-server1:49001</value>

        </property>

        <property>

                <name>mapred.local.dir</name>

                <value>/root/hadoop/var</value>

        </property>

        <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

2.2.5 修改slaves檔案

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/slaves

將裡面的localhost刪除，新增如下內容：

hadoop-server2

hadoop-server3

2.2.6 修改yarn-site.xml

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/yarn-site.xml

在<configuration>節點內加入配置

        <property>

                <name>yarn.resourcemanager.hostname</name>

                <value>hadoop-server1</value>

        </property>

       <property>

                <description>The address of the applications manager interface in the RM.</description>

                <name>yarn.resourcemanager.address</name>

                <value>${yarn.resourcemanager.hostname}:8032</value>

        </property>

        <property>

                <description>The address of the scheduler interface.</description>

                <name>yarn.resourcemanager.scheduler.address</name>

                <value>${yarn.resourcemanager.hostname}:8030</value>

        </property>

        <property>

                <description>The http address of the RM web application.</description>

                <name>yarn.resourcemanager.webapp.address</name>

                <value>${yarn.resourcemanager.hostname}:8088</value>

        </property>

        <property>

                <description>The https adddress of the RM web application.</description>

                <name>yarn.resourcemanager.webapp.https.address</name>

                <value>${yarn.resourcemanager.hostname}:8090</value>

        </property>

        <property>

                <name>yarn.resourcemanager.resource-tracker.address</name>

                <value>${yarn.resourcemanager.hostname}:8031</value>

        </property>

        <property>

                <description>The address of the RM admin interface.</description>

                <name>yarn.resourcemanager.admin.address</name>

                <value>${yarn.resourcemanager.hostname}:8033</value>

        </property>

        <property>

                <name>yarn.nodemanager.aux-services</name>

                <value>mapreduce_shuffle</value>

        </property>

        <property>

                <name>yarn.scheduler.maximum-allocation-mb</name>

                <value>10240</value>

                <discription>每個節點可用記憶體,單位MB,預設8182MB</discription>

        </property>

        <property>

                <name>yarn.nodemanager.vmem-pmem-ratio</name>

                <value>2.1</value>

        </property>

        <property>

                <name>yarn.nodemanager.resource.memory-mb</name>

                <value>10240</value>

        </property>

        <property>

                <name>yarn.nodemanager.vmem-check-enabled</name>

                <value>false</value>

        </property>

注意:3臺虛擬機器安裝的hadoop的修改配置檔案都是一樣的,這些不需要根據不同的虛擬機器更改不同的名稱

2.2.7 修改hadoop-env.sh

vi /opt/hadoop/hadoop-2.8.0/etc/hadoop/hadoop-env.sh

將export JAVA_HOME=${JAVA_HOME}

修改為：

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.181-3.b13.el7_5.x86_64

說明：修改為自己的JDK路徑

3啟動hadoop

3.1 在namenode上執行初始化

因為hadoop-server1是namenode，hadoop-server2和hadoop-server3都是datanode，所以只需要對hadoop-server1進行初始化操作，也就是對hdfs進行格式化。

cd /opt/hadoop/hadoop-2.8.0/bin

執行初始化指令碼，也就是執行命令：

./hadoop namenode -format

格式化成功後，可以在看到在/root/hadoop/dfs/name/目錄多了一個current目錄，而且該目錄內有一系列檔案

3.2在namenode上執行啟動命令

因為hadoop-server1是namenode，hadoop-server2和hadoop-server3都是datanode，所以只需要再hadoop-server1上執行啟動命令即可。

進入到hadoop-server1這臺機器的/opt/hadoop/hadoop-2.8.0/sbin目錄，也就是執行命令：

cd /opt/hadoop/hadoop-2.8.0/sbin

執行初始化指令碼，也就是執行命令：

./start-all.sh

第一次執行上面的啟動命令，會需要我們進行互動操作，在問答介面上輸入yes回車

4 測試是否安裝成功

haddoop啟動了，需要測試一下hadoop是否正常。

執行命令，關閉防火牆，CentOS7下，3臺伺服器都要關閉防火牆,命令是：

systemctl stop firewalld.service

關機啟動後不開啟防火牆

systemctl disable firewalld.service

不關閉防火牆,後期安裝hive後,匯入資料時會報錯的

訪問路徑,ip為namenode虛擬的ip地址,埠號為:50070

如圖所示:

訪問路徑:

如上圖所示為安裝好的頁面

Centos 7 安裝Hadoop叢集

Hadoop學習筆記 1. 準備工作 1.1 虛擬機器安裝jdk 準備3臺centos7的虛擬機器配置jdk 按照連結裡安裝的虛擬機器為最小虛擬機器,裡面並未安裝jdk 安裝jdk yum install java-1.8.0-openjdk*

CentOS 7 搭建hadoop叢集（提供各種安裝包超值免費）

軟體VMware 點選下載提取碼：arqc 虛擬機器安裝教程點選 Xftp 5 提取碼：qqeb hadoop安裝教程人家寫的挺好我也就不重複了，安裝測試遇到的什麼問題都可以在下面留言，基本隨時回。 ---------------------

CentOS 7安裝Hadoop 3.0.0

new eno oot 更新 ron 去掉網上服務器 keyword 最近在學習大數據，需要安裝Hadoop，自己弄了好久，最後終於弄好了。網上也有很多文章關於安裝Hadoop的，但總會遇到一些問題，所以把在CentOS 7安裝Hadoop 3.0.0的整個過程記錄下來

CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境 Hadoop 組織框架 HDFS架構 YARN架構 HA叢集部署規劃自動故障轉移關於叢集主機時間 Linux環境搭建配置Java環境安裝單機版Hadoop Zookeeper叢集安裝配置環境變數關閉防火牆修

VirtualBox centos 7 安裝hadoop

首先確保ssh已安裝，如果沒有安裝執行yum install ssh 然後執行ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa生成祕鑰這裡用的hadoop2.8.5，下載.tar.gz檔案上傳到虛擬機器上，如何將主機檔案上傳到VritualBox已經有了充分的說

Hadoop部署（六）——CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境關閉防火牆測試環境 Linux系統版本：CentOS 7 64位 Hadoop 組織框架 Hadoop主要包括兩部分：一部分是HDFS（Hadoop Distr

Centos 7 安裝Hadoop 3.0.0-alpha1

簡介: 本文主要介紹如何安裝和配置單節點Hadoop，運用Hadoop MapReduce和Hadoop分散式檔案系統（HDFS）執行一些簡單的操作。算是一個入門級的文件吧。hadoop 安裝三種模式 1. 單機 2. 偽分散式 3. 分散式前提

CentOS 7 安裝Redis單機版和叢集

Redis下載 http://download.redis.io/releases/redis-4.0.11.tar.gz 一、單機版搭建 1.上傳壓縮包到 /usr/download (我自定義放安裝包的目錄) 2.安裝gcc編譯環境，命令 yum install gcc-c++

Centos 7下Hadoop分散式叢集搭建

一、關閉防火牆（直接用root使用者） #關閉防火牆 sudo systemctl stop firewalld.service #關閉開機啟動 sudo systemctl disable firewalld.service 二、修改每臺主機

Centos安裝Hadoop叢集

提示：需要修改hosts檔案，文章中使用hostname代替ip地址需要SSH無金鑰登入配置需要配置rsync遠端同步工具 1）叢集部署規劃 centos01.bkm centos02.bkm

linux虛擬機器安裝hadoop叢集（hadoop-2.7.5）

<property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.name.di

大資料環境基礎之Centos安裝Haoop叢集（5）安裝hadoop叢集

首先要去下載hadoop-2.5.2.tar.gz安裝包，將安裝包移動到當前使用者的根目錄解壓用命令ls檢視解壓後的hadoop 配置hadoop環境變數配置jdk路徑，終端輸入 vi hadoop-env.sh 配置yarn環境變數 yarn-env

解決CentOS 7安裝後沒有killall、ifconfig、命令補全

centos7從centos6 轉到centos7發現少了很多常用命令,下面就常見的幾個做一個說明解決辦法沒有killall命令：yum install -y psmisc沒有ifconfig命令：yum install -y net-tools沒有命令補全： yum install -y bash-com

centos 7 安裝安裝Java

linux jdk卸載系統自帶的open-jdk安裝JDK centos 7 安裝安裝Java

CentOS 7 安裝MySQL 5.6遇到問題及解決方案

linux localhost not ces name 解決 info target case centos下安裝mysql真的沒有想象中那麽容易，在這裏我總結一下遇到的問題 1. ERROR 2002 (HY000): Can’t connect to loca

CentOS-7 安裝KVM

kvmyum install qemu-kvm qemu-kvm-tools virt-manager libvirt virt-install -y[[email protected]/* */ ~]# grep -E ‘(vmx|svm)‘ /proc/cpuinfo flags

CentOs 7 安裝Spark

partition 1.7 test 末尾 nbsp cto url express object 環境： centos7 hadoop 2.7.3 java 1.8 scala 下載： http://spark.apache.org 解壓到安裝目錄

CentOS 7安裝SQL Server

linux sql centos 在我們的傳統理解中認為SQL是只能安裝在Windows系統中的，但如今微軟也開始擁抱Linux，出現了SQL For Linux的版本，雖然目前是技術預覽版，但在不久的將來會出現正式商用的正式版的。那今天我就帶著大家來安裝一次，在這裏我選擇的系統是CentOS 7

CentOS 7安裝Gnome GUI 圖形界面

http 安裝 centos 下載安裝分享 load 界面 level color yum命令當你安裝centos服務器版本的時候，系統默認是不會安裝 CentOS 的圖形界面程序的，比如：gnome或者kde, 那麽如果你想在圖形界面下工作的話，可以手動來安裝Cent

CentOS 7 安裝配置分布式文件系統 FastDFS 5.10

fastdfs下載目前作者最後一次releases的時間的17年4月6號，對應的最新版本是5.10，直接在余大的GitHub上下載就可以了： https://github.com/happyfish100/fastdfs/releases如上圖，由於FastDFS是純C語言實現，只支持Linux、FreeBS

Centos 7 安裝Hadoop叢集

Hadoop學習筆記

1. 準備工作

1.1 虛擬機器安裝jdk

1.2 虛擬機器間建立信任關係-免密登入

1.2.1 修改hostname

1.2.2 修改hosts檔案

1.2.3 檢查是否ping通

1.2.4 虛擬機器生成祕鑰檔案

1.2.5 建立並分享authorized_keys檔案

2 安裝hadoop

2.1 下載hadoop,連結為:

2.2 安裝配置hadoop

2.2.1 修改配置檔案core-site.xml

2.2.2 修改配置檔案hdfs-site.xml

2.2.4 生成並修改配置檔案mapred-site.xml

2.2.5 修改slaves檔案

2.2.6 修改yarn-site.xml

2.2.7 修改hadoop-env.sh

3啟動hadoop

3.1 在namenode上執行初始化

4 測試是否安裝成功

相關推薦