CentOS7 從零開始搭建 Hadoop2.7叢集

阿新 • • 發佈：2019-02-06

序言

準備四臺安裝好CentOS Minimal 的機器，且已經配置網路環境。（只需要記住四臺機器的IP地址，主機名後面設定）
- 機器1：主機名 node， IP: 192.168.169.131
- 機器1：主機名 node1， IP: 192.168.169.133
- 機器1：主機名 node2， IP: 192.168.169.132
- 機器1：主機名 node3， IP: 192.168.169.134

檔案準備

新增使用者組與使用者

groupadd hadoop
useradd -d /home/hadoop -g hadoop hadoop

複製本機檔案到目標機器

pscp.exe -pw 12345678 hadoop-2.7.3.tar.gz root@192.168.169.131:/usr/local 

pscp.exe -pw 12345678 spark-2.0.0-bin-hadoop2.7.tgz root@192.168.169.131:/usr/local

解壓並複製檔案

tar -zxvf  /usr/local/jdk-8u101-linux-x64.tar.gz


#重新命名

mv /usr/local/jdk1.8.0_101 /usr/local/jdk1.8

tar -zxvf /usr/local/hadoop-2.7.3.tar.gz

mv /usr/local 
/hadoop-2.7.3 /home/hadoop/hadoop2.7

許可權修改

修改夾所有者

chmod -R hadoop:hadoop /home/hadoop/hadoop2.7

修改組執行許可權
```
chmod -R g=rwx /home/hadoop/hadoop2.7
```

配置系統環境

配置系統變數

    echo 'export JAVA_HOME=/usr/local/jdk1.8' >> /etc/profile

    echo 'export JRE_HOME=$JAVA_HOME/jre' >> /etc/profile

    echo 'export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar' 
 >> /etc/profile

    echo 'export HADOOP_HOME=${hadoopFolder}' >> /etc/profile

    echo 'export PATH=$HADOOP_HOME/bin:$PATH' >> /etc/profile

    source /etc/profile

配置主機域名

hostname node #當前機器名稱
echo NETWORKING=yes >> /etc/sysconfig/network

echo HOSTNAME=node >> /etc/sysconfig/network #當前機器名稱，避免重啟主機名失效

echo '192.168.169.131 node' >> /etc/hosts
echo '192.168.169.133 node1' >> /etc/hosts
echo '192.168.169.132 node2' >> /etc/hosts
echo '192.168.169.134 node3' >> /etc/hosts

關閉防火牆

systemctl stop firewalld.service
systemctl disable firewalld.service

配置Hadoop叢集

修改配置檔案

sed -i 's/\${JAVA_HOME}/\/usr\/local\/jdk1.8\//' $HADOOP_HOME/etc/hadoop/hadoop-env.sh

sed -i 's/# export JAVA_HOME=\/home\/y\/libexec\/jdk1.6.0\//export JAVA_HOME=\/usr\/local\/jdk1.8\//'  $HADOOP_HOME/etc/hadoop/yarn-env.sh

sed -i 's/# export JAVA_HOME=\/home\/y\/libexec\/jdk1.6.0\//export JAVA_HOME=\/usr\/local\/jdk1.8\//'  $HADOOP_HOME/etc/hadoop/mapred-env.sh

配置從節點主機名

echo node1 > $HADOOP_HOME/etc/hadoop/slaves
echo node2 >> $HADOOP_HOME/etc/hadoop/slaves
echo node3 >> $HADOOP_HOME/etc/hadoop/slaves

拷貝檔案並覆蓋以下檔案

/home/hadoop/hadoop2.7/etc/hadoop/core-site.xml

<configuration>
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://node:9000/</value>
    <description>namenode settings</description>
</property>
<property>
    <name>hadoop.tmp.dir</name>
    <value>/home/hadoop/tmp/hadoop-${user.name}</value>
    <description> temp folder </description>
</property>  
<property>
    <name>hadoop.proxyuser.hadoop.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hadoop.groups</name>
    <value>*</value>
</property>
</configuration>

/home/hadoop/hadoop2.7/etc/hadoop/hdfs-site.xml

<configuration>  
    <property>  
        <name>dfs.namenode.http-address</name>  
        <value>node:50070</value>  
        <description> fetch NameNode images and edits.注意主機名稱 </description>  
    </property>
    <property>  
        <name>dfs.namenode.secondary.http-address</name>  
        <value>node1:50090</value>  
        <description> fetch SecondNameNode fsimage </description>  
    </property> 
    <property>
        <name>dfs.replication</name>
        <value>3</value>
        <description> replica count </description>
    </property>
    <property>  
        <name>dfs.namenode.name.dir</name>  
        <value>file:///home/hadoop/hadoop2.7/hdfs/name</value>  
        <description> namenode </description>  
    </property>  
    <property>  
        <name>dfs.datanode.data.dir</name>
        <value>file:///home/hadoop/hadoop2.7/hdfs/data</value>  
        <description> DataNode </description>  
    </property>  
    <property>  
        <name>dfs.namenode.checkpoint.dir</name>  
        <value>file:///home/hadoop/hadoop2.7/hdfs/namesecondary</value>  
        <description>  check point </description>  
    </property> 
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
    <property>
        <name>dfs.stream-buffer-size</name>
        <value>131072</value>
        <description> buffer </description>
    </property> 
    <property>  
        <name>dfs.namenode.checkpoint.period</name>  
        <value>3600</value>  
        <description> duration </description>  
    </property> 
</configuration>

/home/hadoop/hadoop2.7/etc/hadoop/mapred-site.xml

<configuration>  
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        </property>
    <property>
        <name>mapreduce.jobtracker.address</name>
        <value>hdfs://trucy:9001</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>node:10020</value>
        <description>MapReduce JobHistory Server host:port, default port is 10020.</description>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>node:19888</value>
        <description>MapReduce JobHistory Server Web UI host:port, default port is 19888.</description>
    </property>
</configuration>

/home/hadoop/hadoop2.7/etc/hadoop/yarn-site.xml

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>node</value>
    </property>

    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>

    <property>
        <name>yarn.resourcemanager.address</name>
        <value>node:8032</value>
    </property>

    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>node:8030</value>
    </property>

    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>node:8031</value>
    </property>

    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>node:8033</value>
    </property>

    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>node:8088</value>
    </property>
</configuration>

配置無密碼登入

在所有主機上建立目錄並賦予許可權

mkdir /home/hadoop/.ssh
chomod 700 /home/hadoop/.ssh

在node主機上生成RSA檔案

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

生成並拷貝 authorized_keys檔案

cp /home/hadoop/.ssh/id_rsa.pub authorized_keys

scp /home/hadoop/.ssh/authorized_keys node1:/home/hadoop/.ssh

scp /home/hadoop/.ssh/authorized_keys node2:/home/hadoop/.ssh

scp /home/hadoop/.ssh/authorized_keys node3:/home/hadoop/.ssh

在所有主機上修改擁有者和許可權

chmod 600 .ssh/authorized_keys
chown -R hadoop:hadoop .ssh

修改ssh 配置檔案

註釋掉

# AuthorizedKeysFile    .ssh/authorized_keys

重新啟動ssh
```
service sshd restart
```
Note: 第一次連線仍然需要輸入密碼。

啟動Hadoop

進入Node 主機，並切換到hadoop賬號
```
su hadoop
```

格式化 namenode

/home/hadoop/hadoop2.7/bin/hdfs namenode -format

啟動 hdfs

/home/hadoop/hadoop2.7/sbin/start-dfs.sh

驗證 hdfs 狀態

啟動 yarn

/home/hadoop/hadoop2.7/sbin/start-yarn.sh

驗證 yarn 狀態

預設舉例

建立資料夾

/home/hadoop/hadoop2.7/bin/hadoop fs -mkdir -p /data/wordcount

/home/hadoop/hadoop2.7/bin/hadoop fs -mkdir -p /output/

上傳檔案

hadoop fs -put /home/hadoop/hadoop2.2/etc/hadoop/*.xml /data/wordcount/

hadoop fs -ls /data/wordcount

執行Map-Reduce

hadoop  jar  /home/hadoop/hadoop2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount  /data/wordcount  /output/wordcount

檢視狀態
```
http://192.168.169.131:8088/cluster
```

瀏覽結果

hadoop fs -cat /output/wordcount/part-r-00000 | more

CentOS7 從零開始搭建 Hadoop2.7叢集

序言準備四臺安裝好CentOS Minimal 的機器，且已經配置網路環境。（只需要記住四臺機器的IP地址，主機名後面設定）機器1：主機名 node， IP: 192.168.

# 從零開始搭建Hadoop2.7.1的分散式叢集

Hadoop 2.7.1 (2015-7-6更新)，Hadoop的環境配置不是特別的複雜，但是確實有很多細節需要注意，不然會造成許多配置錯誤的情況。儘量保證一次配置正確防止反覆修改。網上教程有很多關於Hadoop配置的，但是每一個教程都對應了一個版本資訊，有

從零開始搭建hadoop分散式叢集環境：（一）新建hadoop使用者以及使用者組

搭建hadoop叢集環境不僅master和slaves安裝的hadoop路徑要完全一樣，也要求使用者和組也要完全一致。因此第一步就是新建使用者以及使用者組。對於新手來言，新建使用者使用者組，並賦予適當的許可權無疑是最大的問題。下面請跟隨我來新建使用者以及使用者組

從零開始搭建系統2.7——Quartz安裝及配置

get AR blank 安裝 pos html uart body cnblogs 從零開始搭建系統2.7——Quartz安裝及配置從零開始搭建系統2.7——Quartz安裝及配置

從零開始搭建系統1.7——FTP安裝及配置

從零開始 cnblogs ref tar pos div class blank com 從零開始搭建系統1.7——FTP安裝及配置從零開始搭建系統1.7——FTP安裝及配置

從零開始搭建hadoop叢集

創作不易，請勿抄襲，轉載請註明出處。如有疑問，請加微信 wx15151889890，謝謝。 [本文連結:]https://blog.csdn.net/wx740851326/article/details/https://blog.csdn.net/wx740851326/article

從零開始搭建物聯網平臺（7）：使用Vue編寫前端頁面

摘要： Vue我也是剛開始學的，看了兩天的文件就開始著手做這件事了，所以對vue瞭解不太深入，沒有能力說的的太詳細萬一是錯誤的不就誤導別人了，所以只對幾個相對來說比較主要的點說明一下。搭建開發環境：老生常談的話題！首先自然是要安裝nodejs，這個直接去官網下載安裝即可，再使用命令n

從零開始搭建Redis 叢集，三主三從模式

文章引用 https://www.cnblogs.com/mafly/p/redis_cluster.htmlRedis 叢集簡介Redis 是一個開源的 key-value 儲存系統，由於出眾的效能，大部分網際網路企業都用來做伺服器端快取。Redis 在3.0版本前只支援單

centos7 最小安裝從零開始搭建zabbix

01、最小化安裝作業系統02、升級系統元件到最新版本sudo yum -y update 03、關閉 SELinuxsudo sed -i "s/SELINUX=enforcing/SELINUX=disabled/g" /etc/selinux/config setenfo

騰訊雲centos7.0 從零開始搭建Java Web網站

本文的目的是記錄自己個人網站的搭建過程，同時達到知識共享的目的。其實自己動手做的時候會遇到很多問題，也是通過網站查詢資料來一步一步的完成自己的搭建工作的，重要的是自己能夠堅持的做下去，希望能夠在自

從零開始搭建K8S--如何監控K8S叢集日誌

開發十年，就只剩下這套架構體系了！ >>>

Redis詳解（十）------ 從零開始搭建叢集

　　在上一篇部落格我們介紹了------Redis哨兵(Sentinel)模式,哨兵模式主要是解決高可用問題,在master節點宕機時,slave節點能夠自動切換成為master節點　　本篇部落格我們來介紹Redis的另外一種模式------叢集模式. 　　PS：我這裡搭建演示的版本是redis-5.0.5

從零開始搭建android框架系列（轉）

bsp andro hup 開始 blank class and lan com 網址：從零開始搭建android框架系列 githup：https://github.com/CameloeAnthony/Ant從零開始搭建android框架系列（轉）

從零開始搭建框架SSM+Redis+Mysql（二）之MAVEN項目搭建

blog 目的定位 enc style log onf project 集成從零開始搭建框架SSM+Redis+Mysql（二）之MAVEN項目搭建廢話不說，直接擼步驟！！！ 1.創建主項目：ncc-parent 選擇maven創建項目，註意在創建項目中，packi

從零開始搭建VUE項目

vue-cli ffffff -s 內容 nbsp 部分腳本 ssr 項目配置前言：此樣板面向大型，嚴肅的項目，並假定您對Webpack和vue-loader有些熟悉。請務必閱讀vue-loader的常見工作流配方的文檔。如果您只想嘗試vue-load

從零開始搭建ELK+GPE監控預警系統

elasticsearch logstash kibana redis grafana prometheus exporter consul前言本文可能不會詳細記錄每一步實現的過程，但一定程度上可以引領小夥伴走向更開闊的視野，串聯每個環節，呈現予你不一樣的效果。業務規模8個平臺100+臺服務器10+個集群分

從零開始搭建輕量級個人XSS平臺

提示不可應用編輯狀態 red rip 權限以及 signature 一、前言決定搭建XSS平臺是因為自己想深入學習一下XSS相關的知識，多多進行實踐，上網搜索了一下XSS平臺有很多，但是總覺得不是很安全，這個畢竟敏感信息要傳輸到陌生人的服務器上，而且服務器端測試

從零開始搭建系統3.4——緩存組件開發

搭建 html OS get gpo target 開發 href 系統從零開始搭建系統3.4——緩存組件開發從零開始搭建系統3.4——緩存組件開發

從零開始搭建系統1.2——Nginx安裝及配置

clas target nginx 1.2 targe nginx安裝 ref href 從零開始從零開始搭建系統1.2——Nginx安裝及配置從零開始搭建系統1.2——Nginx安裝及配置

從零開始搭建系統2.3——Cat安裝及配置

AR lan tar gpo 從零開始系統 .com .html log 從零開始搭建系統2.3——Cat安裝及配置從零開始搭建系統2.3——Cat安裝及配置

CentOS7 從零開始搭建 Hadoop2.7叢集

序言

檔案準備

許可權修改

配置系統環境

配置Hadoop叢集

配置無密碼登入

啟動Hadoop

預設舉例

相關推薦