MapReduce簡述、工作流程

阿新 • • 發佈：2020-10-12

MapReduce簡述、工作流程

MR程式設計模型之執行步驟：

　　1、準備map處理的輸入資料

　　2、mapper處理

　　3、Shuffle

　　4、Reduce處理

　　5、結果輸出

(input)<k1,v1> -> map -><k2,v2> -> combine -> <k2,v2> ->reduce -> <k3,v3>(output)

處理流程：

流程：

　　1、輸入文字資訊，由InputFormat->FileInputFormat ->TextInputFormat，通過getSplits方法獲得Split陣列，然後在用getRecordReader 方法對Split做處理，每讀一行交給一個map處理

　　2、每個節點上的所有map，交由該節點上的Partitioner處理（Shuffling的過程），按key將map放在其他節點上去還是繼續在該節點下處理

　　3、排序

　　4、結果交由reduce處理

　　5、處理完成後由OutputFormat ->FileOutputFormat ->TextOutputFormat 寫到本地或Hadoop上

Split：MR處理的的資料塊，MR中最小的計算單元，預設是與HDFS中的Block（HDFS中的最小儲存單元，預設128M）是一一對應的，也可以手工設定（不建議修改）

InputFormat：將輸入的資料進行分片（Split）InputSplit[] getSplits(JobConf var1, int var2)

　　TextInputFormat：用來處理文字格式的資料

OutputFormat：輸出

上圖圖解：

　　一般來說，一個Split對應一個Block，但上圖是一個設定過後的。

　　一個file檔案被分成了n個Block，對應著就是2n個Split，經過InputFormat處理後，每個Split交由一個Mapper處理，通過Shuffling的分組和排序後產生多個Reducer，每個Reducer就會產生一個檔案

MapReduce 1.x的架構：一個JobTracker+多個taskTracker

　　　　JobTracker:負責資源管理和作業排程

　　　　TrakTracker：定期向JobTracker彙報節點的健康、資源、作業情況，接收JT的命令，比如啟動/殺死任務

MapReduce 2.x：

轉載於:https://www.cnblogs.com/onone/articles/8483689.html

MapReduce簡述、工作流程

MapReduce簡述、工作流程 MR程式設計模型之執行步驟：　　1、準備map處理的輸入資料

SpringMVC學習[01]：【介紹、工作流程、搭建、值傳遞】

內容 1.SpringMVC的介紹 2.SpringMVC的工作流程 3.SpringMVC的搭建以及配置檔案說明 4.SpringMVC值傳遞的方式

Kafka整體架構、工作流程與檔案儲存機制

Kafka架構圖總結：訊息是分主題的，然後為了擴充套件性，每個主題又有許多分割槽(分片和索引機制)，這些分片可以跨機存在

新版本Capture One Pro 22 mac破解版著重在圖層、工作流程及處理效能三方面作出改進，帶來了全新且高度靈敏的工具。

Capture One 22 Pro 破解版 https://www.macw.com/mac/3755.html?id=MzAyODU5Jl8mMjcuMTg2LjExLjIwMg%3D%3D

MapReduce 工作流程

MapReduce 工作流程以示例程式 wordcount為例 Map InputFormat InputFormat會將我們指定的輸入路徑中的檔案按照block（預設 128M）邏輯切分成若干切片（split，如果檔案不足 128M 則單獨為一個切片，如果滿了12

MapReduce工作流程

MapReduce工作流程圖流程詳解（重點） MapTask 待處理的文字通過submit()方法，獲取待處理的資料資訊，然後根據InputFormat切片方法機制，生成切片方法檔案。把切片方法檔案和資源配置檔案全部提交在資源路徑。提

003、svn_git簡介、 git工作流程介紹

一、版本控制器的方式 a、集中式版本控制工具　　集中式版本控制工具，版本庫是集中存放在中央伺服器的，team裡每個人work時從中央伺服器下載程式碼，是必須聯網才能工作，區域網或網際網路。個人修改後然後提交到

Android 12(S) 圖形顯示系統 - 解讀Gralloc架構及GraphicBuffer建立/傳遞/釋放（十四） Android 12(S) 圖形顯示系統 - 開篇Android 12(S) 圖形顯示系統 - 簡述Allocator/Mapper HAL服務的獲取過程（十五）Android 12(S) 圖形顯示系統 - BufferQueue的工作流程（九）

必讀： Android 12(S) 圖形顯示系統 - 開篇一、前言在前面的文章中，已經出現過 GraphicBuffer 的身影，GraphicBuffer 是Android圖形顯示系統中的一個重要概念和元件，顧名思義，它就是用來儲存和傳遞需要繪製

MapReduce簡述、工作流程

MapReduce簡述、工作流程

MapReduce簡述、工作流程

SpringMVC學習[01]：【介紹、工作流程、搭建、值傳遞】

Kafka整體架構、工作流程與檔案儲存機制

新版本Capture One Pro 22 mac破解版著重在圖層、工作流程及處理效能三方面作出改進，帶來了全新且高度靈敏的工具。

MapReduce 工作流程

MapReduce工作流程

003、svn_git簡介、 git工作流程介紹

深入瞭解Kafka【二】工作流程及檔案儲存機制

Spring cloud gateway工作流程原理解析

redis原始碼學習之工作流程初探

http協議工作原理及工作流程

4、工作區和暫存區

MapReduce之MapTask工作機制

kafka工作流程及檔案儲存機制

測試平臺開發（四）Vue工作流程詳解

Tomcat工作流程

帳號登入、登出流程

Servlet 生命週期、工作原理

03.AOF持久化機制配置與工作流程

MapReduce簡述、工作流程

MapReduce簡述、工作流程

相關推薦