shuffle(partitioner+combiner+sort)

阿新 • • 發佈：2018-12-20

shuffle(partitioner+combiner+sort)

每一個map有一個環形記憶體緩衝區，用於儲存任務的輸出。預設大小100MB（io.sort.mb屬性），一旦達到閥值0.8（io.sort.spill.percent），一個後臺執行緒把內容寫到（spill）磁碟的指定目錄（mapred.local.dir）下的新建的一個溢位寫檔案
寫磁碟前，要partition，sort。如果有combiner，combiner排序後資料。
等最後距離寫完，合併全部溢位寫檔案為一個分割槽且排序的檔案。
reducer通過http方式得到輸出檔案的分割槽。
TaskTracker為分割槽檔案執行Reduce任務。複製階段把Map輸出複製到Reducer的記憶體或磁碟。一個Map任務完畢，Reduce就開始複製輸出。

排序階段合併map輸出。然後走Reduce階段。

MR過程各個角色的作用

jobClient：提交作業
JobTracker：初始化作業，分配作業，TaskTracker與其進行通訊，協調監控整個作業
TaskTracker：定期與JobTracker通訊，執行Map和Reduce任務
HDFS：保留作業的資料、配置、jar包、結果

作業提交

提交作業之前，需要對作業進行配置編寫自己的MR程式配置作業，包括輸入輸出路徑等。。。
提交作業配置完畢後，通過JobClient提交

具體功能：
與JobTracker通訊得到一個jar的儲存路徑和Jobld
輸入輸出路徑檢查
將jobjar拷貝到HDFS
計算輸入分片，將分片資訊寫到job.split中
寫job.xml
真正提交作業

作業初始化

客戶端提交作業後，JobTracker會將作業加入到佇列，然後進行排程，預設是FIFO方式
具體功能：
作業初始化只要是值JobInProgress中完成的
讀取分片資訊
任務建立task包扣Map和reduce任務
建立TaskInProgress執行task

任務分配

tasktracker與jobtracker之間的通訊和任務分配是通過心跳機制實現的

tasktracker會主動定期向jobtracker傳送心跳資訊，詢問是否有任務要做，如果有，就會申請到任務
心跳定期任務完成--領

任務執行

如果tasktracker拿到任務，會將所有的資訊拷貝到本地，包扣程式碼、配置、分片資訊等
tasktracker中的localizeJob()方法會被條用進行本地化，拷貝job .jar,jobconf,job.xml到本地
tasktracker呼叫launchTaskForJob()方法載入啟動任務
MapTaskRunner和ReduceTaskRunner分別啟動javachild程序來執行相應的任務

狀態更新

Task會定期向TaskTraker回報執行情況
TaskTracker會定期收集所在叢集上的所有Task的資訊，並向JobTracker回報
JobTracker會根據所有TaskTracker回報上來的資訊進行彙總

作業完成

JobTracker是在接收到最後一個任務完成後，才將任務標記為成功
將紓解寫入到HDFS中

錯誤處理

JobTracker失敗存在單點故障，hadoop2.0解決了這個問題
TaskTracker失敗 tasktracker崩潰了會停止向Jobtracker傳送心跳資訊，jobtracker會將tasktracker從等待的任務池中移除，並將該任務轉移到其他的地方執行，jobtracker將tasktracker加入到黑名單中
Task失敗任務失敗，會向TaskTracker丟擲異常任務掛起

JobTracker

負責接收使用者提交的作業，負責啟動、跟蹤任務執行
JobSubmissionProtocol是JobClient與JobTracker通訊的介面
InterTrackerProtocol是TaskTracker與JobTracker通訊的介面

TaskTracker

負責執行任務

JobClient

是使用者作業與JobTracker互動的主要介面
負責提交作業的，負責啟動、跟蹤任務執行、訪問任務狀態和日誌等。

Partitioner程式設計

partitioner是partitioner的基類，如果需要定製partitioner也需要繼承該類
HashPartitioner是mapreduce的預設partitioner。計算方法是which reduce=(key.hashCode()&Integer.MAX_VALUE)%numReduceTasks,得到當前的目的reducer
mapper ----獲取資料
partitioner ----分割槽屬於shuffle
reduce ---計算

public class TCPartitioner extends Partitioner<Text, TelBean>{
    
    @Override
    public int getPartition(Text key, TelBean bean, int arg2) {
        // TODO Auto-generated method stub
    
    }
}

把partitioner加入到job裡面

把partitioner新增到job裡面
job.setPartitionerClass(TCPartitioner.class);
設定reduceTasks的數量有幾個分割槽設定幾個任務
job.setNumReduceTasks(2);

sort程式設計

繼承WritableComparable<> -序列化並且排序

public class Bean implements WritableComparable<Bean>{
   
 //反序列化
    @Override
    public void readFields(DataInput in) throws IOException {
        // TODO Auto-generated method stub
    }
   
 //序列化
    @Override
    public void write(DataOutput out) throws IOException {
        // TODO Auto-generated method stub
    }
   
 @Override
    public int compareTo(Bean bean) {
        // TODO Auto-generated method stub
    }
}

combiner程式設計

每一個map可能會產生大量的輸出，combiner的作用就是在map端對輸出先做一次合併，以減少傳輸到reducer的資料量
combiner最基本是實現本地key的歸併，combiner具有類似本地的reduce功能
如果不用combiner，那麼，所有的結果都是reduce完成，效率會相對低下。使用combiner，先完成的map會在本地聚合，提升速度
注意：combiner的輸出是reduce的輸入，如果combiner是可插拔的，新增combiner絕對不能改變最終的計算結果。所以combiner只應該用於那種reduce的輸入kry/value型別完全一致，且不影響最終結果的場景。比如累加，最大值等。。。
combiner就是map端的educer
job.setCombinerClass();

shuffle(partitioner+combiner+sort)

shuffle(partitioner+combiner+sort) 每一個map有一個環形記憶體緩衝區，用於儲存任務的輸出。預設大小100MB（io.sort.mb屬性），一旦達到閥值0.8（io.sort.spill.percent），一個後臺執行緒把內容寫到（spill）磁碟的指

map/reduce之間的shuffle,partition,combiner過程的詳解

用戶這也阻止每一個 ner bsp job ack 網絡資源　　Shuffle的本意是洗牌、混亂的意思，類似於java中的Collections.shuffle(List)方法，它會隨機地打亂參數list裏的元素順序。MapReduce中的Shuffle過程。所謂S

[spark] Shuffle Read解析 (Sort Based Shuffle)

本文將講解shuffle Reduce部分，shuffle的下游Stage的第一個rdd是ShuffleRDD，通過其compute方法來獲取上游Stage Shuffle Write溢寫到磁碟檔案資料的一個迭代器： override def com

[spark] Shuffle Write解析 (Sort Based Shuffle)

本文基於 Spark 2.1 進行解析前言從 Spark 2.0 開始移除了Hash Based Shuffle，想要了解可參考Shuffle 過程，本文將講解 Sort Based Shuffle。 ShuffleMapTask的結果（S

MapReduce核心map reduce shuffle （spill sort partition merge）詳解

上圖可能是某個map task的執行情況。拿它與官方圖的左半邊比較，會發現很多不一致。官方圖沒有清楚地說明partition， sort與combiner到底作用在哪個階段。我畫了這張圖，希望讓大家清晰地瞭解從map資料輸入到map端所有資料準備好的全過程。整個流程我分了四

大數據學習之九——Combiner,Partitioner,shuffle和MapReduce排序分組

pareto 聚合文件 ner 數據傳輸定義排序 str ack 獲取數據 1.Combiner Combiner是MapReduce的一種優化手段。每一個map都可能會產生大量的本地輸出，Combiner的作用就是對map端的輸出先做一次合並，以減少map和reduc

Hadoop詳解 ----------- shuffle原理、partitioner分割槽原理、Combiner程式設計、常見的MR演算法

Partitioner程式設計Partition簡介shuffle是通過分割槽partitioner 分配給Reduce的一個Reducer對應一個記錄檔案Partitioner是shuffle的一部

Hadoop詳解(四)——Shuffle原理，Partitioner分割槽原理，Combiner程式設計，常見的MR演算法

package liuxun.hadoop.mr.dc; import java.io.IOException; import java.util.HashMap; import java.util.Map; import org.apache.hadoop.conf.Configuration; imp

mapreduce shuffle 和sort 詳解

改變 struct 堆內存傳輸工具默認臨時 arc 快速排序 MapReduce 框架的核心步驟主要分兩部分：Map 和Reduce。當你向MapReduce 框架提交一個計算作業時，它會首先把計算作業拆分成若幹個Map 任務，然後分配到不同的節點上去執

shuffle和sort分析

理解不同 http 寫入 mapr 中一重復進入 ons MapReduce中的Shuffle和Sort分析 MapReduce 是現今一個非常流行的分布式計算框架，它被設計用於並行計算海量數據。第一個提出該技術框架的是Google 公司，而Google 的靈感則來自

MapReduce內部shuffle過程詳解（Combiner的使用）

Maptask呼叫一個元件FileInputFormat FileInputFormat有一個最高層的介面 --> InputFormat 我們不需要去寫自己的實現類，使用的就是內部預設的元件：TextInputFormat maptask先呼叫TextInputFormat,

大資料教程（8.8）MR內部的shuffle過程詳解&combiner的執行機制及程式碼實現

之前的文章已經簡單介紹過mapreduce的運作流程，不過其內部的shuffle過程並未深入講解；本篇部落格將分享shuffle的全過程。

大資料教程（8.8）MR內部的shuffle過程詳解&combiner的執行機制及程式碼實現

之前的文章已經簡單介紹過mapreduce的運作流程，不過其內部的shuffle過程並未深入講解；本篇部落格將分享shuffle的全過程。

SparkSQL中的三種Join及其實現（broadcast join、shuffle hash join和sort merge join）

1.小表對大表（broadcast join）將小表的資料分發到每個節點上，供大表使用。executor儲存小表的全部資料，一定程度上犧牲了空間，換取shuffle操作大量的耗時，這在SparkSQL中稱作Broadcast Join Broadcast Jo

Spark Join——Broadcast Join、Shuffle Hash Join、Sort Merge Join

1. Broadcast Join 在資料庫的常見模型中（比如星型模型或者雪花模型），表一般分為兩種：事實表和維度表。維度表一般指固定的、變動較少的表，例如聯絡人、物品種類等，一般資料有限。而事實表一般記錄流水，比如銷售清單等，通常隨著時間的增長不斷膨脹。因為

shuffle的關鍵階段sort(Map端和Reduce端)原始碼分析

原始碼中有這樣一段程式碼 1. Map端排序獲取的比較器 public RawComparator getOutputKeyComparator() { // 獲取mapreduce.job.output.key.comparator.class，必須是RawComparator型別

54：Spark中的Tungsten-sort Based Shuffle內幕

本期內容： 1. Tungsten-sort Based Shuffle原理 2. Tungsten-sort Based Shuffle原始碼 ShortShuffleManager Memory

MapReduce優化——Combiner與Partitioner

Combiner和Partitioner是用來優化MapReduce的。可以提高MapReduce的執行效率。 Combiner 叢集上的可用頻寬限制了MapReduce作業的數量，因此儘量避免map和reduce任務之間的資料傳輸是有利的。Hadoop

大資料（十）：MapTask工作機制與Shuffle機制（partitioner輸出分割槽、WritableComparable排序）

一、MapTask工作機制 Read階段：MapTask通過使用者編寫的RecordReader，從輸入InputSplit中解析出一個個key/value Map階段：該節點主要是將解析出的key/value交給使用者編寫map()函式處理，併產生一系列

Spark原始碼分析之Sort-Based Shuffle讀寫流程

override def read(): Iterator[Product2[K, C]] = { // 構造ShuffleBlockFetcherIterator，一個迭代器，它獲取多個塊，對於本地塊，從本地讀取 // 對於遠端塊，通過遠端方法讀取val blockFetcherItr = new

shuffle(partitioner+combiner+sort)

shuffle(partitioner+combiner+sort)

MR過程各個角色的作用

作業提交

作業初始化

任務分配

任務執行

狀態更新

作業完成

錯誤處理

JobTracker

TaskTracker

JobClient

Partitioner程式設計

sort程式設計

combiner程式設計

相關推薦