訊息稱寧德時代已在韓國設立分部，向現代汽車供貨提供支援

阿新 • • 發佈：2021-11-16

一、MapReduce概念知識

1、MapReduce概述

MapReduce是一種分散式計算模型，由Google提出，主要用於搜尋領域，解決海量資料的計算問題.
MapReduce是分散式執行的，由兩個階段組成：Map和Reduce，

Map階段：一個獨立的程式，有很多個節點同時執行，每個節點處理一部分資料。Reduce階段是一個獨立的程式，有很多個節點同時執行，每個節點處理一部分資料

Reduce階段：【在這先把reduce理解為一個單獨的聚合程式即可】。
MapReduce框架都有預設實現，使用者只需要覆蓋map()和reduce()兩個函式，即可實現分散式計算，非常簡單。
這兩個函式的形參和返回值都是<key、value>

，使用的時候一定要注意構造<k,v>。

2、MapReduce原理

MapReduce分為三個階段Map階段，Suffer階段，Reduce階段

map階段

map任務處理
1.1 框架使用InputFormat類的子類把輸入檔案(夾)劃分為很多InputSplit，預設，每個HDFS的block對應一個InputSplit。通過RecordReader類，把每個InputSplit解析成一個個<k1,v1>。預設，框架對每個InputSplit中的每一行，解析成一個<k1,v1>。
1.2 框架呼叫Mapper類中的map(...)函式，map函式的形參是<k1,v1>對，輸出是<k2,v2>對

。一個InputSplit對應一個map task。程式設計師可以覆蓋map函式，實現自己的邏輯。
1.3
(假設reduce存在)框架對map輸出的<k2,v2>進行分割槽。不同的分割槽中的<k2,v2>由不同的reduce task處理。預設只有1個分割槽。
(假設reduce不存在)框架對map結果直接輸出到HDFS中。
1.4 (假設reduce存在)框架對每個分割槽中的資料，按照k2進行排序、分組。分組指的是相同k2的v2分成一個組。注意：分組不會減少<k2,v2>數量。
1.5 (假設reduce存在，可選)在map節點，框架可以執行reduce歸約。
1.6 (假設reduce存在)框架會對map task輸出的<k2,v2>寫入到linux 的磁碟檔案中。

至此，整個map階段結束

shuffle過程

1.每個map有一個環形記憶體緩衝區，用於儲存map的輸出。預設大小100MB（io.sort.mb屬性），一旦達到閥值0.8（io.sort.spill.percent）,一個後臺執行緒把內容溢寫到(spilt)磁碟的指定目錄（mapred.local.dir）下的一個新建檔案中。
2.寫磁碟前，要partition,sort。如果有combiner，combine排序後資料。
3.等最後記錄寫完，合併全部檔案為一個分割槽且排序的檔案。

1.Reducer通過Http方式得到輸出檔案的特定分割槽的資料。
2.排序階段合併map輸出。然後走Reduce階段。
3.reduce執行完之後，寫入到HDFS中。

reduce階段

reduce任務處理
2.1 框架對多個map任務的輸出，按照不同的分割槽，通過網路copy到不同的reduce節點。這個過程稱作shuffle。
2.2 框架對reduce端接收的[map任務輸出的]相同分割槽的<k2,v2>資料進行合併、排序、分組。
2.3 框架呼叫Reducer類中的reduce方法，reduce方法的形參是<k2,{v2...}>，輸出是<k3,v3>。一個<k2,{v2...}>呼叫一次reduce函式。程式設計師可以覆蓋reduce函式，實現自己的邏輯。
2.4 框架把reduce的輸出儲存到HDFS中。
至此，整個reduce階段結束。
例子：實現WordCountApp

二、MapReduce程式碼實現

1、使用Hadoop自帶的mapreduce實現wordcount

　　在Linux隨便目錄編輯檔案，寫入單行單詞若干隨機，然後上傳到hdfs上

　　使用Hadoop自帶的mapreduce執行wordcount

　　執行成功，在Hadoop客戶端檢視結果

訊息稱寧德時代已在韓國設立分部，向現代汽車供貨提供支援

訊息稱寧德時代已在韓國設立分部，向現代汽車供貨提供支援

訊息稱寧德時代等將向印尼電動汽車電池廠投資 50 億美元

爭奪鋰資源，訊息稱寧德時代 3 億美元競購加拿大鋰業公司 Millennial

訊息稱寧德時代上海工廠產能恢復至疫情前水平，返崗率達 90%

數字貨幣平臺 OKEx 暫停提幣，訊息稱徐明星已被警方帶走， OK 集團迴應

訊息稱賈躍亭 FF 即將上市，其去年已在珠海成立新公司“法法汽車”

訊息稱華為已收購持牌支付機構訊聯智付，進軍支付領域大勢所趨

訊息稱京東方已獲得蘋果 “iPhone 13”訂單

訊息稱 LG V70 已開始適配韌體，預計上半年釋出

訊息稱貨拉拉啟動造車專案，已開始招募新能源貨車製造人才

涉嫌侵權全系產品，寧德時代已正式起訴中航鋰電

寧德時代釋出鈉離子電池，董事長曾毓群：電化學世界的未知遠大於已知

臺積電之後，訊息稱聯電已通知客戶 11 月起再漲價

訊息稱華為已拿到驍龍 888/778G 供貨，明年還能使用驍龍 898 4G 晶片

訊息稱華碩 PC 訂單排滿，已到今年年底

訊息稱螞蟻集團已賣出持有財新傳媒全部股份

訊息稱 LG InnoTek 已向蘋果新品供應 3D ToF 模組

特斯拉上海工廠 Model Y 日產量大幅提升，訊息稱 9 月已達到 1600 輛

訊息稱紅魔 7 遊戲手機入網，黑鯊 5 已備案，均搭載驍龍 898

訊息稱任天堂已為2022年安排大量獨佔大作

訊息稱寧德時代已在韓國設立分部，向現代汽車供貨提供支援

相關推薦