1. 程式人生 > >用mapreduce 處理氣象數據集

用mapreduce 處理氣象數據集

提交 文件中 同學 mapreduce Go 代碼 解壓 apr 氣象

編寫程序求每日最高最低氣溫,區間最高最低氣溫

  1. 氣象數據集下載地址為:ftp://ftp.ncdc.noaa.gov/pub/data/noaa

2.按學號後三位下載不同年份月份的數據(例如201506110136號同學,就下載2013年以6開頭的數據,看具體數據情況稍有變通)

技術分享圖片

  1. 解壓數據集,並保存在文本文件中
  2. 對氣象數據格式進行解析

技術分享圖片

  1. 編寫map函數,reduce函數

技術分享圖片

技術分享圖片

  1. 將其權限作出相應修改
  2. 本機上測試運行代碼

技術分享圖片

技術分享圖片

  1. 放到HDFS上運行
    1. 將之前爬取的文本文件上傳到hdfs上

技術分享圖片

  1. 用Hadoop Streaming命令提交任務

技術分享圖片

  1. 查看運行結果

用mapreduce 處理氣象數據集