20180521早課記錄14-Hadoop
阿新 • • 發佈:2018-05-21
Hadoop1.hadoop是什麽
狹義: Hadoop軟件(HDFS、MapReduce、Yarn)
廣義: 以hadoop為主的生態圈
2.hadoop三大組件是什麽?分別做什麽
HDFS: 分布式文件管理系統 存儲
MapReduce: 執行引擎 計算
Yarn: 資源(memory cpu)和作業調度平臺 資源
3.hdfs在部署時,要配置信任關系,請問root和hadoop用戶部署時,區別是什麽
註意authorized_keys權限 要改為600
4.hdfs三個進程是什麽
NameNode,DataNode,SecondaryNameNode
5.一個文件500M,請問多少個塊
128m一個塊,就是4個塊
6.假如副本數為3,上題中的實際存儲為多少
1500M
7.談談你們對hdfs讀和寫流程的理解 有什麽不一樣
讀是inputStream
寫是outputStream
8.nn是做什麽的
管理文件系統的命名空間
9.dn是做什麽的
讀寫文件的數據塊
10.snn是做什麽的
定期合並fsimage+editlog文件為新的fsimage 推送給namenode 俗稱檢查點動作
11.談談副本放置策略,客戶端假如為DN節點,那麽第一個副本在哪
就近原則,放當前節點
12.談談對jps命令的理解
jps就是把/tmp下對應用戶的進程信息顯示出來,並不代表實際的進程信息
13.談談對pid文件的理解
保存進程號
14.shell腳本編寫第一行是什麽
#!/bin/bash
15.怎樣動態變量
b=`date`
16.if判斷要註意什麽
if判斷裏的條件開頭和結尾都要空格
17.調試哪兩種
腳本內 #!/bin/bash -x
執行參數 sh -x xxx.sh
18.root用戶想要使用hadoop執行 date命令,請問命令和參數是什麽
su - hadoop -c date
20180521早課記錄14-Hadoop