荷月科技加入新華三生態，H3C區塊鏈超融合一體機亮相數字峰會

阿新 • • 發佈：2020-10-21

Hadoop叢集搭建

1.建立三臺虛擬機器，本次使用的是centos7，關閉所有機器的防火牆。

關閉防火牆：

[hadoop@localhost ~]$ systemctl stop firewalld.service

修改主機名，方便對虛擬機器進行區分。

主節點名稱設為master，其他兩個節點名稱設定為slave1，slave2。

檢視主機名並修改：
```
[hadoop@localhost ~]$ hostname
localhost.localdomain
[hadoop@localhost ~]$ hostnamectl set-hostname master
[hadoop@localhost ~]$ hostname
master
 
```
修改完重啟機器：
```
[hadoop@localhost ~]$ reboot
```

2.編輯ip與hostname的對映表 /etc/hosts

將所有機器的ip與hostname的對應關係新增到hosts檔案中，所有的節點都要新增，相當於DNS

172.16.46.161	master
172.16.46.163	slave1
172.16.46.162	slave2

3.ssh免密登陸

請檢視ssh免密登陸

4.安裝jdk

請檢視jdk安裝

5.安裝hadoop

下載地址hadoop，下載.tar.gz格式的包

解壓

[hadoop@master ~]$ tar -zxvf hadoop-2.9.2.tar.gz

設定環境變數，在/etc/profile最下方新增

export HADOOP_HOME=/home/hadoop/hadoop-2.9.2
export PATH=.:$HADOOP_HOME/bin:$PATH

載入環境變數

source /etc/profile

驗證hadoop是否安裝成功

[hadoop@master ~]$ hadoop
Usage: hadoop [--config confdir] [COMMAND | CLASSNAME]
  CLASSNAME            run the class named CLASSNAME
 or
  where COMMAND is one of:
  fs                   run a generic filesystem user client
  version              print the version
  jar <jar>            run a jar file
                       note: please use "yarn jar" to launch
                             YARN applications, not this command.
  checknative [-a|-h]  check native hadoop and compression libraries availability
  distcp <srcurl> <desturl> copy file or directories recursively
  archive -archiveName NAME -p <parent path> <src>* <dest> create a hadoop archive
  classpath            prints the class path needed to get the
                       Hadoop jar and the required libraries
  credential           interact with credential providers
  daemonlog            get/set the log level for each daemon
  trace                view and modify Hadoop tracing settings

Most commands print help when invoked w/o parameters.

出現上述輸出，證明安裝成功。

如果未輸出，則可以嘗試重新啟動機器載入環境變數。

6.配置hadoop

進入hadoop安裝目錄

6.1配置etc/hadoop/hadoop-env.sh

修改JAVA_HOME為jdk安裝目錄的絕對路徑

6.2配置etc/hadoop/core-site.xml

設定hdfs的Namenode地址，設定hadoop執行時臨時檔案的儲存路徑

<configuration>
    <property>
        <name>fs.defaultFS</name>
       <value>hdfs://172.16.46.161:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
       <value>file:/home/hadoop/hadoop-2.9.2/tmp</value>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131702</value>
    </property>
</configuration>

如果沒有配置hadoop.tmp.dir，預設儲存在/tmp/hadoop-username目錄下

6.3配置etc/hadoop/hdfs-site.xml

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>4</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/home/hadoop/hadoop-2.9.2/hdfs/name</value>
    <final>true</final>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/home/hadoop/hadoop-2.9.2/hdfs/data</value>
    <final>true</final>
  </property>
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>172.16.46.161:9001</value>
  </property>
  <property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
  </property>
  <property>
    <name>dfs.permissions</name>
    <value>false</value>
  </property>
</configuration>

6.4配置etc/hadoop/mapred-site.xml

將mapper-site.xml.template重新命名為mapper-site.xml

[hadoop@master hadoop-2.9.2]$ mv etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

修改mapper-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

指定mr執行在yarn上

6.5配置etc/hadoop/slaves

刪除原有內容，寫入所有節點的ip地址

172.16.46.161
172.16.46.163
172.16.46.162

6.6配置etc/hadoop/yarn-env.sh和etc/hadoop/mapred-env.sh

將JAVA_HOME配置成jdk安裝目錄的絕對路徑

6.7配置etc/hadoop/yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
  <property>
    <name>yarn.resourcemanager.address</name>
    <value>172.16.46.161:18040</value>
  </property>
  <property>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>172.16.46.161:18030</value>
  </property>
  <property>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>172.16.46.161:18088</value>
  </property>
  <property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>172.16.46.161:18025</value>
  </property>
  <property>
    <name>yarn.resourcemanager.admin.address</name>
    <value>172.16.46.161:18141</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
</configuration>

7.將修改後的配置拷貝到其他節點

scp -r etc/ hadoop@slave1:~/hadoop-2.9.2/

8.啟動叢集

8.1格式化namenode

叢集搭建好了，將磁碟格式化一下，後面要存資料，避免有髒資料，同時建立一些東西。

只有第一次啟動需要格式化

namenode設定在哪個節點上就在哪個節點上執行下面的命令

bin/hdfs namenode -format

8.2啟動叢集前必須保證namenode和datanode已經啟動

單節點啟動namenode

[hadoop@master hadoop-2.9.2]# sbin/hadoop-daemon.sh start namenode
starting namenode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-master.out
[hadoop@master hadoop-2.9.2]# jps
3877 NameNode
3947 Jps

單節點啟動datanode

[hadoop@master hadoop-2.9.2]# sbin/hadoop-daemon.sh start datanode
starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-master.out
[hadoop@master hadoop-2.9.2]# jps
3877 NameNode
4060 Jps
3982 DataNode

在其他節點依次啟動 datanode

這樣啟動hdfs很麻煩，而且發現SecondaryNameNode並沒有啟動，素有hadoop提供了其他的啟動方式

一步啟動hdfs叢集：Namenode、Datanode、SecondaryNameNode

[hadoop@master hadoop-2.9.2]$ sbin/start-all.sh
This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh
Starting namenodes on [master]
master: starting namenode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-namenode-master.out
172.16.46.162: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-slave2.out
172.16.46.161: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-master.out
172.16.46.163: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-slave1.out
Starting secondary namenodes [master]
master: starting secondarynamenode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-secondarynamenode-master.out
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop-2.9.2/logs/yarn-hadoop-resourcemanager-master.out
172.16.46.163: starting nodemanager, logging to /home/hadoop/hadoop-2.9.2/logs/yarn-hadoop-nodemanager-slave1.out
172.16.46.162: starting nodemanager, logging to /home/hadoop/hadoop-2.9.2/logs/yarn-hadoop-nodemanager-slave2.out
172.16.46.161: starting nodemanager, logging to /home/hadoop/hadoop-2.9.2/logs/yarn-hadoop-nodemanager-master.out
[hadoop@master hadoop-2.9.2]$ jps
4192 Jps
3237 NameNode
3543 SecondaryNameNode
3374 DataNode

8.3啟動yarn

看yarn要設定在哪個節點，就在哪個節點執行下面的命令。

[hadoop@master hadoop-2.9.2]# sbin/start-yarn.sh 
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop-2.9.2/logs/yarn-root-resourcemanager-master.out
172.16.46.162: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-slave2.out
172.16.46.161: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-master.out
172.16.46.163: starting datanode, logging to /home/hadoop/hadoop-2.9.2/logs/hadoop-hadoop-datanode-slave1.out
[hadoop@master hadoop-2.9.2]$ jps
4192 Jps
3237 NameNode
3814 NodeManager
3543 SecondaryNameNode
3374 DataNode
3695 ResourceManager

ResourceManager和NodeManager都啟動了。

8.4hadoop叢集啟動成功，包括hdfs、yarn、mapreduce

上面這種啟動方式很麻煩，hadoop還提供了一鍵啟動和一鍵關閉。

sbin/start-all.sh 
sbin/stop-all.sh

9.遠端訪問hadoop叢集

訪問hdfs：http://172.16.46.161:50070/

10.簡單測試

在hdfs檔案系統中建立目錄，兩種方式。

bin/hdfs dfs -mkdir -p /usr/input
bin/hadoop fs -mkdir -p /usr/output

叢集部署規劃

上述步驟已經將hadoop叢集搭建完成，但是我們將Namenode、SecondaryNamenode、ResourceManager都部署到一臺機器上。

這樣會增大伺服器的壓力，而且元件的資源都被壓縮了。所以可以部署到三臺機器。

	hadoop11	hadoop12	hadoop13
HDFS	NameNode、DataNode	DataNode	SecondaryNameNode
YARN	NodeManager	ResourceManager、NodeManager	NodeManager

三個核心元件分佈到三臺機器。

異常記錄

找不到jps

jps是檢視java程序的，找不到說明java沒有裝好，需要設定java環境變數
重啟後無法啟動datanode

通常在第一次搭建時可以成功，但是重啟後不能成功，datanode 無法啟動，原因是 datanode 無法被 namenode 識別。

namenode 在 format 時會形成兩個標識，blockPoolId 和 clusterId；

當有 datanode 加入時，會獲取這兩個標識作為從屬這個 namenode 的標識，這樣才能組成叢集；

一旦 namenode 被重新 format，會更新這兩個標識；

然而 datanode 還拿原來的標識過來接頭，自然被拒之門外

解決方法：刪除所有節點的資料，即 tmp，包括 namenode 的資料，重新格式化，再啟動

各種操作都會有如下警告

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

無需理會，只是警告，確實想解決，參考解決辦法

荷月科技加入新華三生態，H3C區塊鏈超融合一體機亮相數字峰會

9月18日，紫光股份旗下新華三集團（以下簡稱"新華三"）"智行中國 2020-新華三生態峰會在昆明開幕，荷月科技CEO於瀟博士攜雲南團隊受邀參加。新華三集團副總裁、生態合作營銷部總經理黃輝華出

荷月科技加入PNP China 金融科技加速營第三期

9 月 22 日，Plug and Play china(即聯即用中國）中國金融科技第三期加速營甄選日在上海召開，PNP 與各界合作伙伴共同探索金融如何賦能技術、場景和產業，踐行“金融即服務”的理念。

華為、中興、新華三入圍，中國電信核心路由交換裝置集採中標候選人公佈

12 月 5 日訊息，據中國電信-陽光采購網釋出的公告，統談統籤類核心路由交換裝置（2021 年）集中採購專案-核心路由器 CR-A1、CR-A2 標包中標候選人公佈。瞭解到，中國電信擬採購17 臺核心路由器CR-A1，10 臺核心路由

火星 10 月 6 日距離地球最近，當晚可賞“超亮”火星

10 月 5 日訊息新華網報道，今年的 10 月 6 日 22 時 18 分，火星將執行至最接近地球的地點。天文專家表示，在天氣晴好的條件下，我國公眾可以欣賞到超級明亮的火星，其亮度甚至超過了當晚的木星，成為夜空中 “最

區塊鏈還可以這麼用，國際區塊鏈“新冠護照”將於第一季度開始試用，100% 安全確認

1 月 26 日訊息，據國外媒體報道，國際航空運輸協會將推出基於區塊鏈技術的護照，這種護照可以以數字化形式儲存個人的健康資訊，重點在於新冠疾病檢測和疫苗接種狀態。

比特幣價格飆升，中國區塊鏈公司掀融資熱潮

3 月 9 日，最近比特幣價格飆升，促使尋求擴大加密貨幣業務或進軍該行業的中國企業融資激增。

谷歌雲部門組建新團隊，圍繞區塊鏈打造業務

北京時間 1 月 27 日晚間訊息，據報道，在經歷了零售、醫療和其他行業的增長之後，谷歌的雲部門又成立了一個新團隊，圍繞區塊鏈應用打造業務。分析人士稱，此舉若獲得成功，將有助於谷歌進一步實現廣告業務之外的多元

印度公佈數字盧比計劃，應用區塊鏈技術

感謝網友天馬飛夜的線索投遞！

乘風破浪，遇見未來元宇宙(Metaverse)之3D虛擬世界平臺Decentraland，基於區塊鏈技術的虛擬房產交易平臺

什麼是Decentraland https://decentraland.org Decentraland是一個基於瀏覽器的3D虛擬世界平臺。使用者可以通過使用以太坊區塊鏈的MANA加密貨幣購買平臺中的虛擬地塊作為NFT。它於2020年2月向公眾開放，並由非營

華為雲NFT雲寶限量開搶，區塊鏈技術為你的數字資產保駕護航

摘要：正是有這些底層的區塊鏈技術支撐，才能讓我們真正的“擁有”獨屬於自己的NFT數字資產。

“挖礦”顯示卡三個月相當於自己使用三年，“挖礦”到底損耗了什麼

最近因為礦潮的興起，浩浩蕩蕩的”挖礦“大軍又出發了，他們的目的是大西北，是水電站。

Redmi K40 系列官方照公佈：後置矩陣三攝，2 月 25 日釋出 - IT之家

2 月 19 日訊息今日早上十點，Redmi 官方微博宣佈將會在 2 月 25 號 19 點 30 分通過視訊直播的形式釋出 Redmi K40 系列手機。值得注意的是，官微宣稱 “「雙旗艦」直播見”，因此可以確認本次釋出的是兩款 Redmi

艾琳4月3日開始返場，獲取方式三選一，人人都可免費得，女武神不返場

Hello大家晚上好，在下晨曦。王者榮耀在S22賽季的最後幾天又公佈了一條重磅訊息，曾經作為內測玩家的專屬英雄艾琳已經全部重做完成，艾琳4月3日開始返場，獲取方式三選一，人人都可免費得，女武神不返場。

TCL 加入造芯大軍，投資 10 億元成立 TCL 微芯科技

5 月 13 日訊息資訊顯示，TCL 科技對外投資新增一家企業 TCL 微芯科技（廣東）有限公司。

樂視宣佈 5 月 18 日舉行智慧生態釋出會，海報中出現疑似賈躍亭剪影

5 月 13 日訊息樂視官方今日突然發微博稱：我回來了！5 月 18 日舉辦樂視智慧生態釋出會，配文“帶著全新的自己，帶著驚喜和樂視智慧生態，帶著掀起科技風暴的能量，518 不負期待，大有看點！”

華為徐直軍：重點打造六大技術生態，HMS 生態要與谷歌和蘋果三分天下

5 月 17 日上午訊息，在今日舉行的華為中國生態大會上，華為輪值董事長徐直軍發表主題演講。

華為商城 6 月上線全新 HarmonyOS Connect 專區，扶持生態新品上市

5 月 18 日訊息在今天舉行的華為鴻蒙夥伴峰會上，華為宣佈鴻蒙系統硬體生態品牌升級為 HarmonyOS Connect。

微星將於 6 月 1 日舉辦“科技遇到美”線上釋出會，公佈 35 週年紀念顯示卡

5 月 31 日訊息微星國際官網上線新頁面，表示將於太平洋時間 6 月 1 日零點（北京時間 15:00）舉辦線上釋出會，主題為“科技遇到美”。在釋出會上，微星 GS76、GE76 等多款膝上型電腦將正式亮相。此外，根據外媒 Vi

新華三集團 H3C 正式加入華為 openEuler 開源社群

6 月 2 日訊息近日，H3C 簽署 CLA (Contributor License Agreement，貢獻者許可協議)，正式加入華為領導的 openEuler 社群。

1799 元起，榮耀 X20 SE 正式釋出：6400 萬高清三攝，7 月 9 日開售

6 月 30 日訊息猝不及防，榮耀官方剛剛正式釋出了榮耀 X20 SE 手機，售價 1799 元起，直接上架電商平臺。

荷月科技加入新華三生態，H3C區塊鏈超融合一體機亮相數字峰會

Hadoop叢集搭建

1.建立三臺虛擬機器，本次使用的是centos7，關閉所有機器的防火牆。

2.編輯ip與hostname的對映表 /etc/hosts

3.ssh免密登陸

4.安裝jdk

5.安裝hadoop

6.配置hadoop

6.1配置etc/hadoop/hadoop-env.sh

6.2配置etc/hadoop/core-site.xml

6.3配置etc/hadoop/hdfs-site.xml

6.4配置etc/hadoop/mapred-site.xml

6.5配置etc/hadoop/slaves

6.6配置etc/hadoop/yarn-env.sh和etc/hadoop/mapred-env.sh

6.7配置etc/hadoop/yarn-site.xml

7.將修改後的配置拷貝到其他節點

8.啟動叢集

8.1格式化namenode

8.2啟動叢集前必須保證namenode和datanode已經啟動

8.3啟動yarn

8.4hadoop叢集啟動成功，包括hdfs、yarn、mapreduce

9.遠端訪問hadoop叢集

10.簡單測試

叢集部署規劃

異常記錄

相關推薦