SSH、Hadoop、Yarn體系

阿新 • • 發佈：2018-12-09

SSH免密登陸

1、生成金鑰對

#rsa 是加密演算法
ssh-keygen -t rsa

然後一路回車 2、檢視生成的金鑰對id_rsa.pub是公鑰，id_rsa是私鑰

輸入
ls .ssh
輸出
id_rsa  id_rsa.pub  known_hosts

2、將公鑰傳送到需要免密登陸的機器

ssh-copy-id -i .ssh/id_rsa.pub [email protected]

3、根據提示輸入密碼 4、完成SSH免密登陸

SSH免密登陸原理(11條)

登陸機器A,目標登陸機器B

1、A生成金鑰對  
2、A把自己的公鑰，傳送給需要免密登陸的機器B  
3、B接受A的公鑰,儲存在本地資料夾下
4、B隨機生成字串Str1
5、B利用A的公鑰加密生成的字串Str2
6、B將Str2傳送給A  
7、A接收B傳送的加密Str2
8、A通過自己的私鑰，將Str2解碼為Str3
9、A將解碼後的Str3，傳送給B
10、B接收A傳送的字串Str3
11、對比Str1是否等於Str3,相同則通過驗證，不同則不能免密登陸

SSH免密

Apache Hadoop的體系結構（重要）

(一)HDFS的體系結構1主從結構

主節點：NameNode
從節點：DataNode
負責日誌元資訊合併: SecondaryNode

2、NameNode

(1)職責
·管理HDFS
·接收客戶端請求
·維護檔案元資訊(fsimage)，日誌檔案(edits)
fsimage：
檔名：a.avi
路徑：/movie
大小：150M
資料塊：2
第一個資料塊{DN1:5}{DN2:8}{DN1:10}
第二個資料塊{DN3:8}{DN1:10}{DN3:9}

(2)元檔案位置
    (*)位置：/root/training/hadoop-2.7.3/tmp/dfs/name/current/fsimage_000000000000000024
    (*)內容：是一個亂碼的二進位制檔案,資料塊的目錄資訊
    (*)檔案轉換：
    hdfs oiv -i fsimage_0000000000000000243 -o ~/a.xml -p XML
(3)日誌檔案
    (*)位置：/root/training/hadoop-2.7.3/tmp/dfs/name/current/edits_inprogress_0000000000000000244
    inprogress代表當前的操作日誌
    (*)二進位制
    (*)格式轉換
    hdfs oev -i edits_inprogress_0000000000000000244 -o ~/b.xml
    b.xml
    <RECORD>
    	<OPCODE>OP_MKDIR</OPCODE>
    	<DATA>
    	  <TXID>7</TXID>
    	  <LENGTH>0</LENGTH>
    	  <INODEID>16386</INODEID>
    	  <PATH>/input</PATH>
    	  <TIMESTAMP>1504876545684</TIMESTAMP>
    	  <PERMISSION_STATUS>
    		<USERNAME>root</USERNAME>
    		<GROUPNAME>supergroup</GROUPNAME>
    		<MODE>493</MODE>
    	  </PERMISSION_STATUS>
    	</DATA>
      </RECORD>
(4)edit檔案記錄檔案記錄了最新的狀態而且會定期將edits中的日誌合併到fsimage中
(5)NameNode為了提高查詢fsimage效能，快取1000M的元資訊
(*)位置
/root/training/hadoop-2.7.3/etc/hadoop/hadoop-env.sh
(*)內容
 44 # The maximum amount of heap to use, in MB. Default is 1000.
 45 #export HADOOP_HEAPSIZE=
 46 #export HADOOP_NAMENODE_INIT_HEAPSIZE=""

首先在記憶體中查詢元資訊，找到返回給客戶端，如果記憶體找不到就IO操作到fsimage資訊，到客戶端，消耗效能

DataNode

(1)資料節點，偽分佈1，全分佈環境2
(2)資料塊
    Hadoop1.x 64M Hadoop2.x 128M
舉例： 
# hadoop-2.7.3.tar.gz(204M)
hdfs dfs -mkdir /tools
hdfs dfs -put hadoop-2.7.3.tar.gz /tools

(3)位置:
    /root/training/hadoop-2.7.3/tmp/dfs/data/current/BP-1969327642-192.168.142.129-1504748687001/current/finalized/subdir0/subdir0
(4)內容
-rw-r--r--. 1 root root 134217728 Sep 11 10:20 blk_1073741850
-rw-r--r--. 1 root root   1048583 Sep 11 10:20 blk_1073741850_1026.meta
-rw-r--r--. 1 root root  79874467 Sep 11 10:20 blk_1073741851
-rw-r--r--. 1 root root    624027 Sep 11 10:20 blk_1073741851_1027.meta
.meta記錄了 資料塊檔案是哪個檔案的資料塊
134217728+79874467=204M
(134217728=128M，剩餘的為原來大小)
(4)設定資料冗餘
偽分佈設定為1  檔案為1分
資料塊冗餘度  和 資料節點的個數一致 最大不超過3

4、SecondaryNameNode

定期將edits中的日誌檔案合併到元檔案資訊中

(1)edit 體現了HDFS的最新狀態

SNN日誌合併

Oracle產生了檢查點checkpoint時，Oracle會以最高優先順序，喚醒資料庫的寫程序(DBWn),來寫髒資料

Yarn體系機構

1.是一個容器，裝MapReduce程式 2.資源排程平臺 3.主從結構

主節點：ResourceManage
從節點：NodeManage 4.執行MapReduce程式

hadoop jar ****

日誌：
7/09/08 22:17:14 INFO client.RMProxy: Connecting to ResourceManager at /192.168.157.111:8032
17/09/08 22:17:34 INFO mapreduce.Job:  map 0% reduce 0%
17/09/08 22:17:43 INFO mapreduce.Job:  map 100% reduce 0%
17/09/08 22:17:55 INFO mapreduce.Job:  map 100% reduce 100%

5.一個MR任務在Yarn中排程的過程 MRinYarn

SSH、Hadoop、Yarn體系

SSH免密登陸 1、生成金鑰對 #rsa 是加密演算法 ssh-keygen -t rsa 然後一路回車 2、檢視生成的金鑰對id_rsa.pub是公鑰，id_rsa是私鑰輸入 ls .ssh 輸出 id_rsa id_rsa.pub known_hosts

谷歌基情錄：TensorFlow、Hadoop、MapReduce 都靠他們誕生！

【CSDN編者按】迄今為止，Google帝國已創立二十載。在這背後，離不開一眾“開國元勳”的豐功偉績，譬如聲名遠揚的MapReduce、TensorFlow、乃至於Hadoop——這些都和Jeff Dean、Sanjay Ghemawat兩個人有著千絲萬縷的聯絡。作為最早的一批

Hive、Hadoop、HBase

1、Hive、Hadoop、Hbase 1）Hive是為了簡化使用者編寫MapReduce程式而生成的一種框架，使用MapReduce做過資料分析的人都知道，很多分析程式除業務邏輯不同外，程式流程基

springcloud、dubbo、hadoop、zookeeper等概念的區別

hadoop是一個分散式的計算框架，主要用於分散式的儲存（HDFS）和計算（MapReduce，可以被Spark替代），其機器間的協議使用的RPC。其通俗的解釋是將一個計算同時分派到很多機器一起算，每個機器算一部分。 springcloud和dubbo都是分散式的服務框架，

【stark_summer的專欄】專注於開發分散式任務排程框架、分散式同步RPC、非同步MQ訊息佇列、分散式日誌檢索框架、hadoop、spark、scala等技術如果我的寫的文章能對您有幫助，請您能給點捐助,請看首頁置頂

專注於開發分散式任務排程框架、分散式同步RPC、非同步MQ訊息佇列、分散式日誌檢索框架、hadoop、spark、scala等技術如果我的寫的文章能對您有幫助，請您能給點捐助,請看首頁置頂...

hadoop叢集搭建HDFS、HA、 YARN

hadoop2.0已經發布了很多穩定版本，增加了很多特性，比如HDFS HA、YARN等。最新的hadoop-2.7.2又增加了YARN HA 1、環境準備修改主機名、IP地址。這些在之前部落格有提過就不再寫了。配置IP地址和主機名對映關係。 sud

Hadoop、MapReduce、YARN和Spark的區別與聯絡

（1） Hadoop 1.0 第一代Hadoop，由分散式儲存系統HDFS和分散式計算框架MapReduce組成，其中，HDFS由一個NameNode和多個DataNode組成，MapReduce由一個JobTracker和多個TaskTracker組成，對應Hadoop版

Hadoop（HDFS、YARN、HBase、Hive和Spark等）預設埠表

埠作用 9000 fs.defaultFS，如：hdfs://172.25.40.171:9000 9001 dfs.namenode.rpc-address，DataNode會連線這個

Hadoop實戰-MapReduce之max、min、avg統計(六)

next combine output fileinput private pub eof pri use 1、數據準備： Mike,35 Steven,40 Ken,28 Cindy,32 2、預期結果 Max　　40 Min　　 28 Avg 33 3、M

ssh key密鑰認證實現批量分發、管理、部署

ssh免密認證、批量分發在實際生產環境中，如果需要批量管理和部署服務器，可以采用ssh+key秘鑰認證，然後可以免密碼進行數據分發，服務部署及管理。 SSH服務（TCP端口號22）：安全的命令解釋器為客戶機提供安全的Shell 環境，用於遠程管理SSH基於公鑰加密（非對稱加密）技術：數據加密傳輸；客戶端

無密鑰登錄的自動腳本實現（ssh-copy-id、expect免交互輸入腳本）

無密鑰登錄的自動腳本實現（ssh-copy-id、expect免交互輸入腳本）無密鑰登錄的自動腳本實現：vim auto_ssh.sh#!/usr/bin/expect set timeout 10 set username [lindex $argv 0] set password [linde

spark、hadoop動態增減節點

hadoop 動態節點之前在搭建實驗環境的時候按部就班的配置好，然後就啟動了。後來再一琢磨，有點不對勁。分布式系統的一個優勢就是動態可伸縮性，如果增刪節點需要重啟那肯定是不行的。後來研究了一下，發現的確是不需要重啟的。仍以Spark和Hadoop為例：對於spark來說很簡單，增加一個節點就是

各種概念POJO、JAVABEAN、DAO、DTO、PO、VO、BO、SSH、EJB

簡單 cts 取數據 bean strong 方式不同的應用 enter 合規轉自：https://my.oschina.net/pacoyang/blog/151695 POJO（pure old java object）是普通java類，有一些private的參數作

linux使用public key方式ssh鄧肯、

開啟 pass centos 客戶端 -s none emctl root rsa 一、前言： ssh遠程登錄密碼認證的方式有三種，password、Keyboard Interactive、Public Key前面兩種方式就是密碼認證，含義都是一樣大同小異。

【SSH】---【Struts2、Hibernate5、Spring4】【散點知識】

作用域才會進行 namespace sci 3.2 對象關系映射工作 XML 一、Struts21.1、Struts2的概念Struts2是一個用來開發MVC應用程序的框架，它提供了Web應用程序開發過程中的一些常見問題的解決方案： ->對來自用戶的輸入數

Hadoop介紹-4.Hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker

參數最大的分布式文件配置參數 alt https 編輯進程通信技術 Hadoop是一個能夠對大量數據進行分布式處理的軟體框架，實現了Google的MapReduce編程模型和框架，能夠把應用程式分割成許多的小的工作單元，並把這些單元放到任何集群節點上執行。在Ma

Saltstack （modules、返回值cache、syndic、salt-ssh、API）

saltstack modules、返回值cache、syndic\salt-ssh、api接上篇內容redhat6.5server1 172.25.29.1 salt-master server2 172.25.29.2 salt-minion server3 172.25.29.3 salt-mini

七、Hadoop學習筆記————調優之Hadoop參數調優

node 參數受限 .com 資源 mage 預留空間嘗試 nod dfs.datanode.handler.count默認為3，大集群可以調整為10 傳統MapReduce和yarn對比如果服務器物理內存128G，則容器內存建議為100比較合理配置總

八、Hadoop學習筆記————調優之Hive調優

需要 cnblogs log logs nbsp .cn 集中 bsp 9.png 表1表2的join和表3表4的join同時運行此法需要關註是否有數據傾斜（大量數據集中在某一區間段）八、Hadoop學習筆記————調優之Hive調優

十二、Hadoop學習筆記————Hive的基本原理

中介優化 prop 指示使用計劃分解分享 ges 歷史數據一般用戶用CLI（命令行界面）接口，元數據庫含有表結構單用戶、多用戶、遠程服務生成db文件，只能單客戶端使用數據庫多用戶是最常用的使用模式配置與多用戶一致數據格式用戶自定義

SSH、Hadoop、Yarn體系

SSH免密登陸

Apache Hadoop的體系結構（重要）

Yarn體系機構

相關推薦