1. 程式人生 > >20180521早課記錄14-Hadoop

20180521早課記錄14-Hadoop

Hadoop

1.hadoop是什麽

狹義: Hadoop軟件(HDFS、MapReduce、Yarn)
廣義: 以hadoop為主的生態圈

2.hadoop三大組件是什麽?分別做什麽

HDFS: 分布式文件管理系統 存儲
MapReduce: 執行引擎 計算
Yarn: 資源(memory cpu)和作業調度平臺 資源

3.hdfs在部署時,要配置信任關系,請問root和hadoop用戶部署時,區別是什麽

註意authorized_keys權限 要改為600

4.hdfs三個進程是什麽

NameNode,DataNode,SecondaryNameNode

5.一個文件500M,請問多少個塊

128m一個塊,就是4個塊

6.假如副本數為3,上題中的實際存儲為多少

1500M

7.談談你們對hdfs讀和寫流程的理解 有什麽不一樣

讀是inputStream
寫是outputStream

8.nn是做什麽的

管理文件系統的命名空間

9.dn是做什麽的

讀寫文件的數據塊

10.snn是做什麽的

定期合並fsimage+editlog文件為新的fsimage 推送給namenode 俗稱檢查點動作

11.談談副本放置策略,客戶端假如為DN節點,那麽第一個副本在哪

就近原則,放當前節點

12.談談對jps命令的理解

jps就是把/tmp下對應用戶的進程信息顯示出來,並不代表實際的進程信息

13.談談對pid文件的理解

保存進程號

14.shell腳本編寫第一行是什麽

#!/bin/bash

15.怎樣動態變量

b=`date`

16.if判斷要註意什麽

if判斷裏的條件開頭和結尾都要空格

17.調試哪兩種

腳本內 #!/bin/bash -x
執行參數 sh -x xxx.sh

18.root用戶想要使用hadoop執行 date命令,請問命令和參數是什麽

su - hadoop -c date

20180521早課記錄14-Hadoop