1. 程式人生 > >執行MapReduce任務

執行MapReduce任務

1:執行MapReduce任務

1:原始資料準備

統計使用者的登入次數:

源資料login_log.txt如下:

[email protected]

[email protected]

[email protected]

[email protected]

[email protected]

[email protected]

[email protected]  

[email protected]

[email protected]

2:應用程式準備

叢集目錄:

$HADOOP_HOME/share/hadoop/mapreduce/中找到程式包:

hadoop-mapreduce-examples-2.6.4.jar

該程式包提供了一些測試模組:

wordcount   //對輸入檔案中的單詞進行詞頻統計

pi   //估算圓周率pi的值

wordmean  //計算輸入檔案中單詞的平均長度

 

3:提交任務指令解析

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar

wordcount  /user/root/login_log.txt  /user/root/output

說明:

wordcount  //指定程式包的主類

/user/root/login_log.txt   //hdfs上需要計算的原始檔

/user/root/output   //hdfs上輸出檔案的目錄

 

4:檢視輸出結果

在/user/root/output目錄下有兩個檔案:

_SUCCESS  //這是標識檔案,表示這個任務執行完成

part-r-00000   //完成任務後產生的結果檔案

 

輸出前5行:

hadoop fs -cat /user/root/output/part-r-00000 | head -n 5

5:檢視叢集的資源管理情況

https://master:18088

檢視計算資源的使用情況

檢視mapreduce的任務列表

檢視具體作業的詳細資訊

&n