<!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</ 
name>
    <value>hdfs://hadoop101:9000</value>
</property>

<!-- 指定Hadoop執行時產生檔案的儲存目錄 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/opt/module/hadoop-2.7.2/data/tmp</value>
</property>

1.1.3 配置hdfs-site.xml

執行命令：vim hdfs-site.xml

<!-- 指定HDFS副本的數量 -->
<property>
	<name>dfs.replication</name>
	<value>1</value>
</property>

1.2啟動叢集

1.2.1切換到當前目錄

在這裡插入圖片描述

1.2.2格式化NameNode

執行命令：bin/hdfs namenode -format
在這裡插入圖片描述

1.2.3啟動NameNode（執行成功後可執行JPS看是否啟動成功）

執行命令：sbin/hadoop-daemon.sh start namenode
在這裡插入圖片描述

1.2.4啟動DataNode

執行命令：sbin/hadoop-daemon.sh start datanode
在這裡插入圖片描述

1.2.5注意的一些事項

1.格式化NameNode，會產生新的叢集id,導致NameNode和DataNode的叢集id不一致，叢集找不到已往資料，而導致叢集啟動異常。
所以，再次格式NameNode時，一定要先刪除data資料和log日誌，然後再格式化NameNode。（當然也還有其他辦法，但是這個是最直接了當的！！！）
2.JPS執行無效
原因：全域性變數hadoop、java沒有生效，需要source /etc/profile檔案。

1.3檢視叢集

1.3.1web端檢視HDFS檔案系統

瀏覽器中檢視：http://Linux ip地址:50070/dfshealth.html#tab-overview
在這裡插入圖片描述
如果不能檢視，看如下帖子處理：http://www.cnblogs.com/zlslch/p/6604189.html

1.4操作叢集

1.4.1切換到當前目錄

在這裡插入圖片描述

1.4.2在HDFS檔案系統上建立一個input資料夾

執行命令：bin/hdfs dfs -mkdir -p /user/lsl/input
在這裡插入圖片描述

1.4.3將測試檔案內容上傳到檔案系統上

執行命令：bin/hdfs dfs -put wcinput/wc.input /user/lsl/input/

1.4.4檢視上傳的檔案是否正確

1.執行命令：bin/hdfs dfs -ls /user/lsl/input/
在這裡插入圖片描述
2.執行命令：bin/hdfs dfs -cat /user/lsl/input/wc.input

3.也可在瀏覽器上檢視

1.4.5執行MapReduce程式

執行命令：bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/lsl/input/ /user/lsl/output

1.4.6檢視輸出結果

1.執行命令：bin/hdfs dfs -cat /user/lsl/output/*
在這裡插入圖片描述
2.在瀏覽器上檢視

1.4.7 將測試檔案內容下載到本地

執行命令：hdfs dfs -get /user/lsl/output/part-r-00000 ./wcoutput/
在這裡插入圖片描述

1.4.8刪除輸出結果

1.執行命令：hdfs dfs -rm -r /user/lsl/output
在這裡插入圖片描述
2.檢視：

版權宣告：本部落格為記錄本人自學感悟，轉載需註明出處！
https://me.csdn.net/qq_39657909

偽分散式的搭建（啟動HDFS並執行MapReduce程式）