1. 程式人生 > >MapReduce中的map個數

MapReduce中的map個數

在map階段讀取資料前,FileInputFormat會將輸入檔案分割成split。split的個數決定了map的個數。

公式:InputSplit=Math.max(minSize, Math.min(maxSize, blockSize)

影響map個數(split個數)的主要因素有:

mapreduce.input.fileinputformat.split.minsize 預設值 0

mapreduce.input.fileinputformat.split.maxsize 預設值 Integer.MAX_VALUE

dfs.blockSize 預設值 128M

所以在預設情況下 map的數量=block數