1. 程式人生 > >hadoop大致的工作流程

hadoop大致的工作流程

                  hadoop過程中最重要的是MapReduce框架,可是處於叢集的考慮,網路頻寬的限制,其中還有很多優化。

                  這是本人畫的,希望不要出錯....

                

一個job分塊,進行map操作,hadoop使用資料本地優化,所以在叢集中的節點機子上進行map操作,資料最好是一個HDFS的塊資料大小既64M,閒話不多說了,看圖就知道了