第2章 Hadoop快速入門

2.5 WordContent簡單應用

Hadoop的HelloWorld程式

2.5.1 建立HDFS目錄

hdfs命令位於bin目錄下，通過hdfs dfs -mkdir命令可以建立一個目錄。

[root@node1 hadoop-2.7.3]# bin/hdfs dfs -mkdir -p input
      
       1

hdfs建立的目錄預設會放到/user/{username}/目錄下面，其中{username}是當前使用者名稱。所以input目錄應該在/user/root/下面。
下面通過｀hdfs dfs -ls｀命令可以檢視HDFS目錄檔案

[root@node1 hadoop-2.7.3]# bin/hdfs dfs -ls /
      
       1

這裡寫圖片描述

2.5.2 上傳檔案到HDFS

在本地新建一個文字檔案
vi /root/words.txt

[root@node1 hadoop-2.7.3]# vi /root/words.txt
      
       1

隨便輸入幾個單詞，儲存退出。
這裡寫圖片描述

將本地檔案/root/words.txt上傳到HDFS
bin/hdfs dfs -put /root/words.txt input

bin/hdfs dfs -ls input

這裡寫圖片描述

2.5.3 執行WordContent

執行下面命令：
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount input output


      
       
        
         
        
        
         
          [[email protected] hadoop-
          2.7
          .3 
]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-
          2.7
          .3.jar wordcount input output
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          39 INFO client.RMProxy: Connecting 
          to ResourceManager at /
          0.0
          .0
          .0:
          8032
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          41 INFO input.FileInputFormat: Total input paths 
          to 
          process : 
          1
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          41 INFO mapreduce.JobSubmitter: number 
          of splits:
          1
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          42 INFO mapreduce.JobSubmitter: Submitting tokens 
          for job: job_1494590593576_0001
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          43 INFO impl.YarnClientImpl: Submitted application application_1494590593576_0001
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          43 INFO mapreduce.Job: The url 
          to track the job: http:
          //node1:
          8088
          /proxy/application_1494590593576_0001/
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          04:
          43 INFO mapreduce.Job: Running job: job_1494590593576_0001
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          08 INFO mapreduce.Job: Job job_1494590593576_0001 running 
          in uber mode : false
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          08 INFO mapreduce.Job:  
          map 
          0% reduce 
          0%
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          19 INFO mapreduce.Job:  
          map 
          100% reduce 
          0%
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          31 INFO mapreduce.Job:  
          map 
          100% reduce 
          100%
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          32 INFO mapreduce.Job: Job job_1494590593576_0001 completed successfully
         
        
       
        
         
        
        
         
          17/
          05/
          12 
          09:
          05:
          32 INFO mapreduce.Job: Counters: 
          49
         
        
       
        
         
        
        
             
          File System Counters
         
        
       
        
         
        
        
                 
          FILE: Number 
          of bytes 
          read=
          54
         
        
       
        
         
        
        
                 
          FILE: Number 
          of bytes written=
          237325
         
        
       
        
         
        
        
                 
          FILE: Number 
          of 
          read operations=
          0
         
        
       
        
         
        
        
                 
          FILE: Number 
          of large 
          read operations=
          0
         
        
       
        
         
        
        
                 
          FILE: Number 
          of 
          write operations=
          0
         
        
       
        
         
        
        
         
                  HDFS: Number 
          of bytes 
          read=
          163
         
        
       
        
         
        
        
         
                  HDFS: Number 
          of bytes written=
          32
         
        
       
        
         
        
        
         
                  HDFS: Number 
          of 
          read operations=
          6
         
        
       
        
         
        
        
         
                  HDFS: Number 
          of large 
          read operations=
          0
         
        
       
        
         
        
        
         
                  HDFS: Number 
          of 
          write operations=
          2
         
        
       
        
         
        
        
         
              Job Counters 
         
        
       
        
         
        
        
         
                  Launched 
          map tasks=
          1
         
        
       
        
         
        
        
         
                  Launched reduce tasks=
          1
         
        
       
        
         
        
        
         
                  Data-
          local 
          map tasks=
          1
         
        
       
        
         
        
        
         
                  Total 
          time spent by 
          all maps 
          in occupied slots (ms)=
          8861
         
        
       
        
         
        
        
         
                  Total 
          time spent by 
          all reduces 
          in occupied slots (ms)=
          8430
         
        
       
        
         
        
        
         
                  Total 
          time spent by 
          all 
          map tasks (ms)=
          8861
         
        
       
        
         
        
        
         
                  Total 
          time spent by 
          all reduce tasks (ms)=
          8430
         
        
       
        
         
        
        
         
                  Total vcore-milliseconds taken by 
          all 
          map tasks=
          8861
         
        
       
        
         
        
        
         
                  Total vcore-milliseconds taken by 
          all reduce tasks=
          8430
         
        
       
        
         
        
        
         
                  Total megabyte-milliseconds taken by 
          all 
          map tasks=
          9073664
         
        
       
        
         
        
        
         
                  Total megabyte-milliseconds taken by 
          all reduce tasks=
          8632320
         
        
       
        
         
        
        
             
          Map-Reduce Framework
         
        
       
        
         
        
        
                 
          Map input records=
          3
         
        
       
        
         
        
        
                 
          Map output records=
          9
         
        
       
        
         
        
        
                 
          Map output bytes=
          91
         
        
       
        
         
        
        
                 
          Map output materialized bytes=
          54
         
        
       
        
         
        
        
         
                  Input split bytes=
          108
         
        
       
        
         
        
        
         
                  Combine input records=
          9
         
        
       
        
         
        
        
         
                  Combine output records=
          4
         
        
       
        
         
        
        
         
                  Reduce input groups=
          4
         
        
       
        
         
        
        
         
                  Reduce shuffle bytes=
          54
         
        
       
        
         
        
        
         
                  Reduce input records=
          4
         
        
       
        
         
        
        
         
                  Reduce output records=
          4
         
        
       
        
         
        
        
         
                  Spilled Records=
          8
         
        
       
        
         
        
        
         
                  Shuffled Maps =
          1
         
        
       
        
         
        
        
         
                  Failed Shuffles=
          0
         
        
       
        
         
        
        
         
                  Merged 
          Map outputs=
          1
         
        
       
        
         
        
        
         
                  GC 
          time elapsed (ms)=
          249
         
        
       
        
         
        
        
         
                  CPU 
          time spent (ms)=
          2950
         
        
       
        
         
        
        
         
                  Physical memory (bytes) snapshot=
          303017984
         
        
       
        
         
        
        
                 
          Virtual memory (bytes) snapshot=
          4157116416
         
        
       
        
         
        
        
         
                  Total committed heap usage (bytes)=
          165810176
         
        
       
        
         
        
        
         
              Shuffle Errors
         
        
       
        
         
        
        
         
                  BAD_ID=
          0
         
        
       
        
         
        
        
         
                  CONNECTION=
          0
         
        
       
        
         
        
        
         
                  IO_ERROR=
          0
         
        
       
        
         
        
        
         
                  WRONG_LENGTH=
          0
         
        
       
        
         
        
        
         
                  WRONG_MAP=
          0
         
        
       
        
         
        
        
         
                  WRONG_REDUCE=
          0
         
        
       
        
         
        
        
             
          File Input Format Counters 
         
        
       
        
         
        
        
         
                  Bytes 
          Read=
          55
         
        
       
        
         
        
        
             
          File Output Format Counters 
         
        
       
        
         
        
        
         
                  Bytes Written=
          32
         
        
      
      
       1
       2
       3
       4
       5
       6
       7
       8
       9
       10
       11
       12
       13
       14
       15
       16
       17
       18
       19
       20
       21
       22
       23
       24
       25
       26
       27
       28
       29
       30
       31
       32
       33
       34
       35
       36
       37
       38
       39
       40
       41
       42
       43
       44
       45
       46
       47
       48
       49
       50
       51
       52
       53
       54
       55
       56
       57
       58
       59
       60
       61
       62
       63
       64
       65
       66
       67
       68
       69

2.5.4 檢視結果

bin/hdfs dfs -ls output
bin/hdfs dfs -cat output/part-r-00000


      
       
        
         
        
        
         
          [root
          @node1 hadoop-
          2.7.
          3]
          # bin/hdfs dfs -ls output/
         
        
       
        
         
        
        
         
          Found 
          2 items
         
        
       
        
         
        
        
         
          -rw-r--r--   
          1 root supergroup          
          0 
          2017-
          05-
          12 09
          :
          05 output/_SUCCESS
         
        
       
        
         
        
        
         
          -rw-r--r--   
          1 root supergroup         
          32 
          2017-
          05-
          12 09
          :
          05 output/part-r-
          00000
         
        
       
        
         
        
        
         
          [root
          @node1 hadoop-
          2.7.
          3]
          # bin/hdfs dfs -cat output/part-r-00000
         
        
       
        
         
        
        
         
          Hadoop  
          3
         
        
       
        
         
        
        
         
          Hello   
          2
         
        
       
        
         
        
        
         
          Java    
          2
         
        
       
        
         
        
        
         
          World   
          2
         
        
       
        
         
        
        
         
          [root
          @node1 hadoop-
          2.7.
          3]
          # 
         
        
      
      
       1
       2
       3
       4
       5
       6
       7
       8
       9
       10

第2章 Hadoop快速入門

2.5 WordContent簡單應用

Hadoop的HelloWorld程式

2.5.1 建立HDFS目錄

hdfs命令位於bin目錄下，通過hdfs dfs -mkdir命令可以建立一個目錄。

[root@node1 hadoop-2.7.3]# bin/hdfs dfs -mkdir -p input
    
     1

[root@node1 hadoop-2.7.3]# bin/hdfs dfs -ls /
    
     1

這裡寫圖片描述

2.5.2 上傳檔案到HDFS

在本地新建一個文字檔案
vi /root/words.txt

[root@node1 hadoop-2.7.3]# vi /root/words.txt
    
     1

隨便輸入幾個單詞，儲存退出。
這裡寫圖片描述

將本地檔案/root/words.txt上傳到HDFS
bin/hdfs dfs -put /root/words.txt input
bin/hdfs dfs -ls input

這裡寫圖片描述

2.5.3 執行WordContent

執行下面命令：
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount input output


    
     
      
       
      
      
       
        [[email protected] hadoop-
        2.7
        .3]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-
        2.7
        .3.jar wordcount input output
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        39 INFO client.RMProxy: Connecting 
        to ResourceManager at /
        0.0
        .0
        .0:
        8032
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        41 INFO input.FileInputFormat: Total input paths 
        to 
        process : 
        1
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        41 INFO mapreduce.JobSubmitter: number 
        of splits:
        1
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        42 INFO mapreduce.JobSubmitter: Submitting tokens 
        for job: job_1494590593576_0001
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        43 INFO impl.YarnClientImpl: Submitted application application_1494590593576_0001
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        43 INFO mapreduce.Job: The url 
        to track the job: http:
        //node1:
        8088
        /proxy/application_1494590593576_0001/
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        04:
        43 INFO mapreduce.Job: Running job: job_1494590593576_0001
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        08 INFO mapreduce.Job: Job job_1494590593576_0001 running 
        in uber mode : false
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        08 INFO mapreduce.Job:  
        map 
        0% reduce 
        0%
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        19 INFO mapreduce.Job:  
        map 
        100% reduce 
        0%
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        31 INFO mapreduce.Job:  
        map 
        100% reduce 
        100%
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        32 INFO mapreduce.Job: Job job_1494590593576_0001 completed successfully
       
      
     
      
       
      
      
       
        17/
        05/
        12 
        09:
        05:
        32 INFO mapreduce.Job: Counters: 
        49
       
      
     
      
       
      
      
           
        File System Counters
       
      
     
      
       
      
      
               
        FILE: Number 
        of bytes 
        read=
        54
       
      
     
      
       
      
      
               
        FILE: Number 
        of bytes written=
        237325
       
      
     
      
       
      
      
               
        FILE: Number 
        of 
        read operations=
        0
       
      
     
      
       
      
      
               
        FILE: Number 
        of large 
        read operations=
        0
       
      
     
      
       
      
      
               
        FILE: Number 
        of 
        write operations=
        0
       
      
     
      
       
      
      
       
                HDFS: Number 
        of bytes 
        read=
        163
       
      
     
      
       
      
      
       
                HDFS: Number 
        of bytes written=
        32
       
      
     
      
       
      
      
       
                HDFS: Number 
        of 
        read operations=
        6
       
      
     
       
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    2.5 WordContent簡單應用
       
  
  
  
   
   
    
     第2章 Hadoop快速入門
     2.5 WordContent簡單應用
     Hadoop的HelloWorld程式
     2.5.1 建立HDFS目錄
     hdfs命令位於bin目錄下，通過hdfs dfs -mkdir命令可以 

  
 

    

    
    Hadoop快速入門（WordContent簡單應用）
      Hadoop快速入門 
 WordContent簡單應用 
Hadoop的HelloWorld程式 
建立HDFS目錄 
hdfs命令位於bin目錄下，通過hdfs dfs -mkdir命令可以建立一個目錄。 
 
 [[email protected] hadoop-2.7.3]# bi 

  
 

    

    
    WebSphere(was8.5)安裝簡單應用程式部署安裝
      
                背景：在was8.5中安裝web應用程式準備：was伺服器一臺，並建立好server，專案打成的war包步驟：1.根據was控制檯地址在瀏覽器中輸入控制檯地址進行訪問，輸入使用者名稱密碼進行登入(此處登入的使用者需要有部署應用程式的許可權)，登入後看到was主頁資訊2.點選作 

  
 

    

    
    WebKit.NET-0.5簡單應用(2)——音量解決方案
      word   entry   imp   ssi   rsh   turn   ati   window   bject   查找WebKit.NET相關文檔，沒有找到音量控制解決方法。換思路進行解決，嘗試用Win32 API進行解決

[DllImport("winmm.dll")]
public stat 

  
 

    

    
    實驗六：排序演算法應用    1.錄入學生基本資訊 	2、直接插入排序 	3、氣泡排序 	4、快速排序 	5、簡單選擇排序 	6、堆排序
      
                
/*實驗六：排序演算法應用
內容：
給出n個學生的考試成績表，每條記錄由學號、姓名和分數和名次組成，設計演算法完成下列操作：
（1）設計一個顯示對學生資訊操作的選單函式如下所示：
*************************1、錄入學生基本資訊2、直接插入排序3、氣泡 

  
 

    

    
    循環簡單應用(2)
      content   win   set   document   element   tel   cli   html   function   <!DOCTYPE HTML><html><head><meta http-equiv="Content-Type" co 

  
 

    

    
    C#基礎視頻教程5.2 如何編寫簡單的超級熱鍵
      用戶   之前   需要   設置   http   ams   直接   定義   分享   我們前面已經理解了如何使用官方的代碼實現鼠標鍵盤的監控，其實還差一點，因為他的代碼只能捕捉單個的按鍵，而其實我們要的是組合鍵。什麽是組合鍵呢？比如我想定義同時按下WIN+C是去執行屏幕截圖。這只要理解為WIN鍵按下 

  
 

    

    
    Spring4 In Action-5.2.3-Spring Web應用程序-向頁面輸出列表、接收參數、接收表單
      pla   data   prot   template   ack   bin   通過   final   span   
源代碼鏈接：http://download.csdn.net/download/poiuy1991719/10117665

本代碼是基於數據庫表的操作，所以請先建立數據庫表
 
1 

  
 

    

    
    WebKit.NET-0.5簡單應用
      修改   解壓   ext   示例   封裝   cairo   result   簡單應用   不用           最近想用c#做個簡單的瀏覽器工具，但是網站一些內容不支持c#內置的WebBowser控件，於是只能改用其他內核瀏覽器進行開發，搜索到WebKit.NET這個封裝好的瀏覽器引擎，需求的功 

  
 

    

    
    Hadoop 2.5.2 HDFS HA+YARN HA 應用配置
      大數據   hadoop   

一：所需安裝配置包
二：CentOS6.4x64 主機名配置
三：journalnode 配置zookeeper 安裝
四：在namenode節點上部署hadoop 2.5.2
五：hadoop 集群的測試：



一：所需安裝配置包
系統：CentOS 6.4 X64
軟件 

  
 

    

    
    2017-2018-2 《網絡對抗技術》 20155322 Exp 5 MSF基礎應用
      load   tab   其他   obj   lis   測試   可能   cte   信息   
[-= 博客目錄 =-]

1-實踐目標

1.1-實踐介紹
1.2-實踐內容
1.3-實踐要求

2-實踐過程

2.1-情報收集
2.2-主動攻擊實踐-ms08_067
2.3-瀏覽器攻擊實踐-many 

  
 

    

    
    5.2.3.最簡單的模塊源碼分析2
      信息   內容   ini   print   return   ID   模塊   內存   函數   本節主要講解了模塊的卸載過程、MODULE_LICENSE等信息添加宏和__init、__exit宏。

static

聲明函數，全局變量，則它們不能被其它文件函數調用
聲明靜態局部變量，具有記憶功能。 

  
 

    

    
    Python 教程2 編輯器及編寫簡單應用
       
 
 
 本文介紹簡單的Python的開發編輯器及簡單應用，程式碼部分可以直接複製執行即可 
 Pycharm使用方法 
 下載pycharm：http://www.jetbrains.com/pycharm/ 
  
  
 破解Professional請自行百度，初學者學習使用Community即可  

  
 

    

    
    java多執行緒入門案例(2)之多執行緒簡單應用
       
 
   
 上一篇文章：java多執行緒案例(1)之簡單銀行取款問題及其優化 
 我大概介紹了一下Java程式碼優化的問題，主要針對出學者而言，這一次我要介紹多執行緒應用的簡單案例 。網上有許多多執行緒的案例，但大多都挺複雜的，今天我主要目的也是介紹一下多執行緒應用的簡單案例，讓初學 

  
 

    

    
    Python之2維list轉置、旋轉及其簡單應用
       
 
 Python之2維list轉置、旋轉及其簡單應用 
  給一個矩陣，順時針旋轉順序輸出其元素，例如： 
 對於矩陣： 
 [ 1, 2, 3 ] 
 [ 4, 5, 6 ] 
 [ 7, 8, 9 ] 
  輸出為： 
 1,2,3,6,9,8,7,4,5 
   
  

  
 

    

    
    Wireshark 2.6.5 釋出，應用廣泛的網路協議分析器
       
 
Wireshark 2.6.5 已釋出，Wireshark 是世界上最流行的開源、免費跨平臺網路協議分析軟體，它經常被網路專家使用者排錯、部署、分析和教育活動中。
更新亮點：

 Windows 安裝包現在內建 Qt 5.9.7（之前使用的是 Qt 5.9.5）
 漏洞修復：wnpa-sec 

  
 

    

    
    TP3.2中PHPExcel獲取指定單元格內容的簡單應用
      
							
							
							 public function excel($x = '1',$y = 'C',$sheet = '1')
 //輸出表格指定位置資訊  $X 行 $y 列  $sheet 表格頁數(0開始)
{
        date_default_timezone_s 

  
 

    

    
    idea用Git如何拉取、更新、上傳提交專案（最新版idea2018.2.5版）超詳細超簡單版
      
                這個idea啊~哎，

我是萬花叢中獨愛一支啊，雖然用的不順手，但是就是愛使。。。

這不，這兩天就遇見了個麻煩事，不會用Git拉專案、以及更新、還有提交專案。

注：本人使用的是最新版，要是其他的版本的不要驚慌~，基本上都一樣，沒有什麼太大的差別的，不要關頁面那麼快，親~
 

  
 

    

    
    Jetson TX2 學習筆記(6) —— ROS下Kinect 2.0實現三位座標輸出的簡單應用
       
 
 參照的是這篇部落格：https://blog.csdn.net/sunbibei/article/details/51594824 
 我使用的平臺是Jetson TX2，在~/JetsonROS/src/iai_kinect2/kinect2_viewer/src中複製 viewer.c 

  
 

    

    
    計算機作業系統 2.5對經典程序的同步問題 的簡單解釋
       
 
  
  
 首先簡單說明以下P.V.操作的作用 
 P操作：訊號量– –；  V操作：訊號量++； 
 生產者—消費者問題： 
 empty：表示空緩衝區的數目，其初值為緩衝池的大小n，表示消費者已把緩衝池中全部產品取走，有n個空緩衝區可用。  
 full：表示滿緩衝區的數目（即產品數目），其初