職場知識思維導圖

阿新 • • 發佈：2020-10-11

0. 搭建前準備

(1) Linux環境，本文以Ubuntu16.04為例（VMware中虛擬出的環境），並且以及做了ssh免密登入、主機名-ip對映以及固定ip操作

(2) Hadoop 2.9.2程式包

(3) JDK1.8+（Linux版）

1. 搭建前相關約束

(1) 所有的安裝包以及第三方軟體包都置於/opt/softwares

(2) 所有的軟體的軟連結都置於/opt/links

(3) 當前使用者對/opt下的所有目錄都有最高的許可權，以防止出現許可權不足的問題

(4) hostname為hadoop

2. 叢集的搭建

(1) 解壓jdk以及hadoop

tar -zxvfjdk-8u201-linux-x64.tar.gz -C /opt/softwares/

tar -zxvf hadoop-2.9.2.tar.gz -C /opt/softwares/

(2) 建立軟連結

ln -sf /opt/softwares/jdk1.8.0_201 /opt/links/jdk

ln -sf /opt/softwares/hadoop-2.9.2 /opt/links/hadoop

(3) 配置環境變數 vi ~/.bashrc或者其他的三個配置檔案，此步驟亦可不做，只是為了在任意路徑下都可以執行環境變數中的可執行指令碼，不過在執行時需要加上指令碼的路徑

###_JDK_CONF_###

export JAVA_HOME=/opt/links/jdk

export JRE_HOME=$JAVA_HOME/jre

export CLASS_PATH=$JAVA_HOME/lib:$JRE_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

###_HADOOP_CONF_###

export HADOOP_HOME=/opt/links/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

# 用於提交mr任務時以及訪問hdfs叢集時所用身份

export HADOOP_USER_NAME=yu

(4) 生效~/.bashrc檔案

source ~/.bashrc

(5) 測試是否安裝成功，若顯示版本號則表示成功

java -version

hadoop version

(6) 配置hadoop環境

0) 建立存放hadoop hdfs資料目錄

a. 存放hadoop hdfs資料目錄

mkdir -p ~/bigdata/hadoop/data

b. 存放hadoop、yarn的pid（程序號）目錄

mkdir -p ~/bigdata/hadoop/pid/hadoop

mkdir -p ~/bigdata/hadoop/pid/yarn

1) 單機（不做任何hadoop環境配置）

2) 偽分佈

a. 修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh

第25行：export JAVA_HOME=/opt/links/jdk

第113行：exportHADOOP_PID_DIR=/home/yu/bigdata/hadoop/pids/hadoop

(113行影響namenode、datanode以及secondarynamenode的pid檔案儲存位置)

b. 修改$HADOOP_HOME/etc/hadoop/core-site.xml(hostname為自己主節點的主機名，需修改)

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://hostname:9000</value>

</property>





<property>

<name>hadoop.tmp.dir</name>

<value>file:///home/yu/bigdata/hadoop/temp</value>

</property>



<property>

<name>io.file.buffer.size</name>

<value>4096</value>

</property>



<property>

<name>hadoop.proxyuser.yu.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.yu.groups</name>

<value>*</value>

</property>

<property>

<name>hadoop.http.staticuser.user</name>

<value>yu</value>

</property>

</configuration>

c. 修改$HADOOP_HOME/etc/hadoop/hdfs-site.xml，新增配置可以不配

<configuration>



<property>

<name>dfs.nameservices</name>

<value>ns1</value>

</property>



<property>

<name>dfs.replication</name>

<value>3</value>

</property>



<property>

<name>dfs.blocksize</name>

<value>64M</value>

</property>



<property>

<name>dfs.namenode.name.dir</name>

<value>file:///home/使用者名稱/bigdata/hadoop/data/nn</value>

</property>



<property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/使用者名稱/bigdata/hadoop/data/dn</value>

</property>



<property>

<name>dfs.namenode.checkpoint.dir</name>

<value>file:///home/使用者名稱/bigdata/hadoop/data/snn</value>

</property>



<property>

<name>dfs.namenode.checkpoint.edits.dir</name>

<value>file:///home/使用者名稱/bigdata/hadoop/data/snn</value>

</property>





<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>



<property>

<name>dfs.web.ugi</name>

<value>yu,yu</value>

</property>



<property>

<name>fs.permissions.umask-mode</name>

<value>000</value>

</property>



<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>



<property>

<name>dfs.permissions.superusergroup</name>

<value>yu</value>

</property>



<property>

<name>dfs.namenode.safemode.threshold-pct</name>

<value>0f</value>

</property>



<property>

<name>dfs.namenode.name.dir.restore</name>

<value>true</value>

</property>



<property>

<name>dfs.cluster.administrators</name>

<value>*</value>

</property>



<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hostname:9001</value>

</property>

</configuration>

d.複製$HADOOP_HOME/etc/hadoop/mapred-site.xml.template並改檔名為mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

e. 修改$HADOOP_HOME/etc/hadoop/mapred-site.xml

<configuration>



<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>





<property>

<name>mapreduce.jobhistory.address</name>

<value>hostname:10020</value>

</property>



<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hostname:19888</value>

</property>



<property>

<name>mapreduce.jobhistory.joblist.cache.size</name>

<value>20000</value>

</property>



<property>

<name>yarn.app.mapreduce.am.staging-dir</name>

<value>/jobhistory/hadoop-yarn/staging</value>

</property>

<property>

<name>mapreduce.jobhistory.intermediate-done-dir</name>

<value>${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate</value>

</property>

<property>

<name>mapreduce.jobhistory.done-dir</name>

<value>${yarn.app.mapreduce.am.staging-dir}/history/done</value>

</property>



<property>

<name>mapreduce.job.ubertask.enable</name>

<value>true</value>

</property>

</configuration>

f.修改$HADOOP_HOME/etc/hadoop/yarn-site.xml

<configuration>



<property>

<name>yarn.resourcemanager.hostname</name>

<value>hostname</value>

</property>



<property>

<name>yarn.resourcemanager.address</name>

<value>hostname:18040</value>

</property>



<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>hostname:18030</value>

</property>



<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>hostname:18025</value>

</property>



<property>

<name>yarn.resourcemanager.admin.address</name>

<value>hostname:18141</value>

</property>



<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>



<property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>



<property>

<name>yarn.nodemanager.local-dirs</name>

<value>file:///home/使用者名稱/bigdata/hadoop/data/nm</value>

</property>





<property>

<name>yarn.log.server.url</name>

<value>http://hostname:19888/jobhistory/logs/</value>

</property>



<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>



<property>

<name>yarn.web-proxy.address</name>

<value>hostname:20000</value>

</property>



<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>-1</value>

</property>



<property>

<name>yarn.nodemanager.remote-app-log-dir</name>

<value>/logs</value>

</property>



<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>



<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

</configuration>

g. 修改$HADOOP_HOME/etc/hadoop/yarn-env.sh，新增如下配置

# 設定yarn PID檔案儲存位置，影響NodeManager、ResourceManager PID檔案儲存

export YARN_PID_DIR=/home/yu/bigdata/hadoop/pids/yarn

h. 修改$HADOOP_HOME/etc/hadoop/mapred-env.sh

# 設定mapred PID PID檔案儲存位置，影響JobHistoryServer PID檔案儲存

第28行：export HADOOP_MAPRED_PID_DIR=/home/yu/bigdata/hadoop/pids/mr

3) 全分佈

a. 將一個節點上的java、hadoop環境以及配置檔案傳送至其他機器

scp 原始檔目錄使用者名稱@hostname：目標目錄

b. 步驟同偽分佈

c. 修改$HADOOP_HOME/etc/hadoop/slaves檔案，加入從節點的hostname，注意需要一行一個ip或者是hostname

hadoop02

hadoop03

hadoop04

(6) 格式化HDFS檔案系統，若出現has been successfully formatted字樣則說明格式化成功

hdfs namenode -format

(7) 啟動叢集

1) 啟動/停止hdfs叢集 (8/9一起啟動命令：start-all.sh/stop-all.sh)

start-dfs.sh/stop-dfs.sh

2) 啟動/停止snn(secondarynamenode)

hadoop-daemon.sh start/stop secondarynamenode

3) 啟動/停止yarn叢集

start-yarn.sh/stop-yarn.sh

4) 啟動/停止jobhistory伺服器

mr-jobhistory-daemon.sh start/stop historyserver

yarn-daemon.sh start/stop historyserver

5) 啟動/停止WEB代理伺服器

a. 作為守護程序啟動（一般使用這種）

yarn-daemon.sh start proxyserver

b. 獨立啟動

yarn proxyserver

(8) 測試MR(計算圓周率pi)

hadoop jar /opt/hadoop-2.3.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar pi 20 10

(9) WEB訪問

1) hdfs叢集訪問埠 50070

2) yarn叢集訪問埠 8088

(10) 所遇到的問題

1) namenode可以正常啟動，datanode無法啟動

a. 重新格式化

刪除所有節點~/bigdata/hadoop/data目錄下的所有檔案

-> 重新執行 hadoop namenode -format

原因：namenode的VERSION中的clusterID與datanode中中的VERSION的clusterID不一致導致

職場知識思維導圖

思維導圖 Caption 對應文字關係處理與直屬老闆信任你信任=帶來的價值*給老闆的安全感不信任你

14 張思維導圖構建 Python 核心知識體系

ZOE是一名醫學生，在自己部落格分享了很多高質量的思維導圖。本文中所列的 14 張思維導圖（高清圖見文末），是 17 年作者開始學習 Python 時所記錄的，希望對大家有所幫助。原文：https://woaielf.github.io/2017/0

【軟體工具篇01】如何用思維導圖構建自己的知識體系

如何用思維導圖構建自己的知識體系思維導圖是什麼百度百科上說思維導圖，英文是The Mind Map，又叫心智導圖，是表達發散性思維的有效圖形思維工具，它簡單卻又很有效，是一種實用性的思維工具

概率論、隨機過程知識梳理——思維導圖

之前上的隨機過程課，老師要求整理概率論基本知識、隨機過程各章節的思維導圖，這裡貼出來供大家參考~

JAVA基礎知識彙總（思維導圖）

1.Java基礎知識 Java知識點彙總，從基礎到常用的API、還有常用的集合類，總結的很詳細。圖片是從論壇裡面找到的，整理下來以便常複習。這是目前看到的比較詳細完整的思維導圖，非常適合剛入坑的。

30 張Java 的思維導圖，全面梳理構建 Java 的知識體系

小編這幾天在網上收集了 30 張大佬製作的 Java 知識點總結的思維導圖，整理成了這篇文章分享給大家，幫助大家梳理構建 Java 的知識體系。

Vue基礎開發入門之簡單語法知識梳理（思維導圖詳解）

前言：經過一段時間對Vue框架的學習後，特此繪製了一個思維導圖來檢驗和鞏固自己學習的Vue基礎知識和心得體會。

【xmind】使用 Java 生成思維導圖

前言在日常的工作與學習中，我們經常會使用思維導圖這個工具，來把抽象而又無形的思考轉換成有形並且具體的影象，是理清思路，梳理邏輯的一大神器。

2019年Java併發精選面試題，哪些你還不會？（含答案和思維導圖）

Java 併發程式設計 1、併發程式設計三要素？ 2、實現可見性的方法有哪些？ 3、多執行緒的價值？

收藏 | 14張思維導圖-構建Python核心體系！Python語法總結！

今天在看Python時，ZOE的Python思維導圖總結的很好，分享一下連結: https://pan.baidu.com/s/1s6Gtptp-pJS0UliNeRIvjg 提取碼: mrfz

.NET WEB API關鍵過程思維導圖

背景說明近期在去面試的過程中，被問及有關WEB API的一些特性，一時竟不知該如何回答，故根據自己已知的知識，加上網上搜索的，詳細列舉了一下，期望對WEB API有一個比較開闊和全面的認知。

崩潰中！我終於看明白了，什麼是財富自由的底層邏輯！思維導圖+筆記精華

周未，本想不驚擾大家休息，但在群裡看到上面這張圖片！沒忍住，將一份讀書筆記提前分享出來！

面試BAT問的最多的27道MyBatis 面試題（含答案和思維導圖總結）

前言關於MyBatis總結了一個思維導圖希望對大家有幫助什麼是 Mybatis？ Mybatis 是一個半 ORM（物件關係對映）框架，它內部封裝了 JDBC，開發時只需要關注 SQL 語句本身，不需要花費精力去處理載入驅動、建立連線

MindMaster思維導圖及億圖圖示會員官方渠道低價購買方法

MindMaster思維導圖及億圖圖示會員官方渠道低價購買方法最近需要重度使用思維導圖，正好朋友提供了兩個優惠券（兌換次數不限），入了MindMaster會員，使用體驗超棒！這裡也分享給大家，好東西不能一個人

福利-MindMaster思維導圖及億圖圖示會員獲取方法

MindMaster思維導圖及億圖圖示會員超值獲取方法最近需要重度使用思維導圖，正好朋友提供了兩個優惠券（兌換次數不限），入了MindMaster會員，使用體驗超棒！這裡也分享給大家，好東西不能一個人獨享！

網路安全思維導圖（全套11張）

本文包含以下思維導圖： ● 網路安全緒論 ● 掃描與防禦技術 ● 網路監聽及防禦技術

專案計劃太複雜？試試思維導圖

思維導圖作為一個工具，應用於各行各業中，就以網際網路和軟體工程來說，思維導圖就常出現在：需求訪談，需求分析，概要和詳細設計等環節，作為設計輔助手段使用。它也經常出現在各類會議，演講過程中，作

MindManager2021 Win/Mac v2020.19.思維導圖軟體安裝下載啟用教程

Mindjet MindManager2021 Mac/win可以讓使用者通過創作思維導圖的方式，以促進團隊的溝通協作和專案管理資訊的視覺化工具。使用者可以將腦中的各種想法和靈感記錄下來進行知識管理，並進行發散性思維和頭腦

最實用的免費思維導圖軟體哪個最好用、使用者最多

現在的思維導圖其實都還蠻適合程式設計師的，今天給大家介紹幾個我用過並且還覺得使用挺好的思維導圖。

【神經網路學習筆記】所有神經網路的關係和分類－附思維導圖

本人沒有找到相關的文獻詳細介紹各個網路的關係的，就自己總結了一下，如果有不對的地方，請指出。

職場知識思維導圖

0. 搭建前準備

1. 搭建前相關約束

2. 叢集的搭建

相關推薦