Google MapReduce到底解決什麼問題？

阿新 • • 發佈：2018-12-12

很多時候，定義清楚問題比解決問題更難。

什麼是MapReduce？

它不是一個產品，而是一種解決問題的思路，它有多個工程實現，Google在論文中也給出了它自己的工程架構實現。

MapReduce這個程式設計模型解決什麼問題？

能夠用分治法解決的問題，例如：

網頁抓取
日誌處理
索引倒排
查詢請求彙總
…

畫外音：能夠發現，現實中有許多基於分治的應用需求。

為什麼是Google，發明了這個模型？

Google網頁抓取，分析，倒排的多個應用場景，當時的技術體系，解決不了Google大資料量高併發量的需求，Google被迫進行技術創新，思考出了這個模型。

畫外音：誰痛誰想辦法。

為什麼MapReduce對“能夠用分治法解決的問題”特別有效？

分治法，是將一個大規模的問題，分解成多個小規模的問題(分)，多個小規模問題解決，再統籌小問題的解(合)，就能夠解決大規模的問題。

分治法詳見《分治法與減治法》

Google MapReduce為什麼能夠成功？

Google為了方便使用者使用系統，提供給了使用者很少的介面，去解決複雜的問題。
(1) Map函式介面：處理一個基於key/value(後簡稱kv)的成對(pair)資料集合，同時也輸出基於kv的資料集合；
(2) Reduce函式介面：用來合併Map輸出的kv資料集合；

畫外音：MapReduce系統架構，能在大規模普通PC叢集上實現並行處理，和GFS等典型的網際網路架構類似。

使用者僅僅關注少量介面，不用關心並行、容錯、資料分佈、負載均衡等細節，又能夠解決很多實際的問題，還有這等好事！

能不能舉一個例子，說明下MapReduce的Map函式與Reduce函式是如何解決實際問題的？

舉例：假設要統計大量文件中單詞出現的個數。

Map

輸入KV：pair(文件名稱，文件內容)

輸出KV：pair(單詞，1)

畫外音：一個單詞出現一次，就輸出一個1。

Reduce

輸入KV：pair(單詞，1)

輸入KV：pair(單詞，總計數)

以下是一段虛擬碼，
Map

(list<pair($doc_name, $doc_content)>){

foreach(pair in list)

foreach($word in $doc_content)

echo pair($word, 1); // 輸出list<k,v>

}

畫外音：如果有多個Map程序，輸入可以是一個pair，不是一個list。

Reduce(list<pair($word, $count)>){// 大量(單詞,1)

map<string,int> result;

foreach(pair in list)

result[$word] += $count;

foreach($keyin result)

echo pair($key, result[$key]); // 輸出list<k,v>

}

畫外音：即使有多個Reduce程序，輸入也是list<pair>，因為它的輸入是Map的輸出。

最早在單機的體系下計算，輸入資料量巨大的時候，處理很慢。如何能夠在短時間內完成處理，很容易想到的思路是，將這些計算分佈在成百上千的主機上，但此時，會遇到各種複雜的問題，例如：

平行計算
資料分發
錯誤處理
叢集通訊
…

這些綜合到一起，就成為了一個困難的問題，這也是Google MapReduce工程架構要解決的問題

內容來源： 58沈劍架構師之路

Google MapReduce到底解決什麽問題？

輸入 copyright 日誌綜合 class 系統數據這也 target 很多時候，定義清楚問題比解決問題更難。什麽是MapReduce？它不是一個產品，而是一種解決問題的思路，它有多個工程實現，Google在論文中也給出了它自己的工程架構實現。 MapR

Google MapReduce到底解決什麼問題？

很多時候，定義清楚問題比解決問題更難。什麼是MapReduce？它不是一個產品，而是一種解決問題的思路，它有多個工程實現，Google在論文中也給出了它自己的工程架構實現。 MapReduce這個程式設計模型解決什麼問題？能夠用分治法解決的問題，例如：網頁抓取日誌處理

Google MapReduce 論文

man 訪問 derived mat close check 機器學習 them 文件 1. MapReduce: Simplified Data Processing on Large Clusters 1.1. Abstract 1.2. 1 Introduc

Google Chrome瀏覽器解決崩潰啦的方法

dbo 重新 data logs http blog appdata ges google "C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" --no-sandbox 添加--no-sandbox

deploy遇到問題，查了google也沒解決

程式碼如下： pragma solidity ^0.4.18; contract Voting { //xiaop 14 //lih 10 //luoh 13

Google MapReduce 的讀後感

----- 簡單介紹本人雖然不是計算機專業的學生，但是有一點程式設計基礎，目前正在學習計算機知識，對大資料和人工智慧還是比較感興趣。馬雲在卸任時講到：“很多人還沒搞清楚什麼是PC網際網路，移動網際網路來了，我們還沒搞清楚移動互聯的時候，大資料時代又來了。”可見，正處於大資料時代的我們很有必要了解一下

Android SDK更新 Connection to http://dl-ssl.google.com refused 解決方法

問題描述使用SDK Manager更新時出現問題 Failed to fetch URL https://dl-ssl.google.com/android/repository/repository-6.xml, reason: Connection to https://dl-ss

IE6圖片有白底解決辦法

由於IE6瀏覽器不支援PNG格式圖片背景透明，所以有時候如果有PNG圖片背景又想它透明怎麼辦呢？有幾個做法： 1.直接轉換圖片格式：將PNG格式轉成其他格式，或者重新制作其他格式圖片，比如GIF圖片格式圖片，那麼IE6是可以支援的。（PNG轉換GIF可能會有鋸齒） 2.給

Google MapReduce作業

本篇部落格為一位大學生公選課作業,第一次用部落格,如果有用的不對的地方請多多諒解瞭解一下mapreduce必知概念使用者程式首先呼叫的 MapReduce 庫將輸入檔案分成 M 個數據片度，每個資料片段的大小一般從16MB 到 64MB(可以通過可選的引

谷歌三大核心技術（二）Google MapReduce中文版

Google MapReduce中文版譯者: alex 摘要 MapReduce是一個程式設計模型，也是一個處理和生成超大資料集的演算法模型的相關實現。使用者首先建立一個Map函式處理一個基於key/value pair的資料集合，輸出中間的基於key/val

Android程式依賴庫引用Gson 報java.lang.NoClassDefFoundError: com/google/gson/Gson 解決方法

Android 程式所依賴一個Library程式B ， B 程式中用到格式化json串，轉換成標準json串的要求 public static String jsonFormatter(String uglyJSONString) { Gson gson = new

Chrome右鍵/位址列搜尋自動跳轉到google.com.hk解決辦法

（1）關閉Chrome瀏覽器；（2）進入Chrome的User Data目錄，預設為:“系統碟符:\使用者\系統使用者名稱\AppData\Local\Google\Chrome\User Data\Default” （3）在“Default”資料夾中找到“Pref

MapReduce：超大機群上的簡單資料處理- [Google MapReduce]·中譯本

摘要 MapReduce是一個程式設計模型,和處理,產生大資料集的相關實現.使用者指定一個map函式處理一個key/value對,從而產生中間的key/value對集.然後再指定一個reduce函式合併所有的具有相同中間key的中間value.下面將列舉許多可以用這個模型來表示的現實世界的工作.

Win10本地MapReduce問題解決org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z 問題解決修改原始碼NativeIO.java，找到hadoop-common-2.7.3-sources.jar檔

Google MapReduce/GFS/BigTable三大技術的論文中譯版

Google的三大核心技術MapReduce、GFS和BigTable的論文都已經被翻譯成高質量的中文，更巧的是，這三篇中譯版的原發地都是CSDN的Blog。其中最新的一篇是張凌雲在一個月之前發表的MapReduce論文，最早的一篇是Xu Lei發表於2005年

搭建環境過google檢測，解決卡在google“正在檢查網路連線”問題

原料：Windows，wifi分享工具（我用的wifi分享大師），shadowsocks 1.先用shadowsocks連線，測試google是否可以訪問 2.shadowsocks勾選允許來自區域網的連線和系統代理 3.開啟wifi共享，手機連線此熱點，保證電腦和手

Google chrome,完美解決adobe flash player外掛過期

> adobe flash player外掛過期 adobe flash player外掛過期- https://www.zhihu.com/question/32223811 Google chrome更新到最新後，提示adobe flash player外掛過期

CMaps-國行安卓手機使用Google地圖服務解決方案

前言Demo和原始碼請移步點選開啟連結簡介相信很多Android開發人員都有這樣的痛點，當國內Android使用者在國外要使用地圖時，好像十分尷尬，沒有非常成熟的地圖解決方案。由於眾所周知的原因，谷歌的很多優秀服務在國內無法使用，其中國行手機由於閹割無法使用谷歌地圖服務是一個非常讓人頭痛的問題。主要問題有：一

關於榮耀V9裝完Google Play Store後白屏的解決方案

指南一個現在榮耀多人都是找到 1-1 pla 拿到機器，我也是第一時間安裝谷歌框架，但是按照論壇裏邊的各種指南我裝上後都無法正常載入Play商店，查看帖子很多人和我一樣都有安裝完框架所需內容以後白屏的問題，而且商店搜不到GMS安裝器，都是用GO安裝器，試過各大

運行Chromium瀏覽器缺少google api密鑰無法登錄谷歌賬號的解決辦法

谷歌 pan pps 無法缺少 edit 賬號 bsp vcl 管理員身份運行CMD，然後依次輸入以下三行內容： setx GOOGLE_API_KEY "AIzaSyAUoSnO_8k-3D4-fOp-CFopA_NQAkoVCLw"setx GOOGLE_DEFAUL

Google MapReduce到底解決什麼問題？

相關推薦