認識的誤區 Hadoop 雲端計算
阿新 • • 發佈:2018-11-13
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow
也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!
認識的誤區:Hadoop=雲端計算
作者:chszs,轉載需註明。
作者部落格主頁:http://blog.csdn.net/chszs
時間:2012-12-9
最近看到清華大學出版社發行的一本新書,《深入淺出雲端計算》出版時間是2012-10-01日,如圖1所示。我以為這是一本科普型讀物,是加深讀者對雲端計算的認識的書籍,畢竟雲端計算覆蓋的領域太廣了。
泛讀後發現完全不是這麼回事。全書基本上都是在講Hadoop以及Hadoop生態圈裡面的相關工具和技術。如圖2所示:
我由此聯想到前段時間和一些業內人士進行技術交流,一談到雲端計算,就說Hadoop怎麼樣?MapReduce怎麼樣?而在我看來,這裡存在一個認識的誤區。
這裡我要強調一點:Hadoop≠雲端計算
雲端計算目前沒有公認的定義,而NIST(美國國家標準與技術研究院)對雲端計算下的定義相對能得到廣泛認可,NIST是這麼定義雲端計算的。
雲端計算是一種按使用量進行付費的模式,這種模式提供可用的、便捷的、按需的網路訪問,使用可配置的計算資源共享池,共享池的資源包括網路、伺服器、儲存、應用軟體、服務等,這些資源能夠通過雲端計算平臺快速提供給客戶,只需投入很少的管理工作,或與服務供應商進行很少的互動。
雲端計算是分散式計算、平行計算、網格計算、多核計算、網路儲存、虛擬化、負載均衡等傳統計算機技術和網際網路技術融合發展的產物。藉助IaaS、PaaS、SaaS等業務模式,把強大的計算能力提供給終端使用者。
雲端計算被稱為是繼大型計算機、個人計算機、網際網路之後的第四次IT產業革命,它將成為帶動IT、物聯網、電子商務等諸多產業強勁增長、推動資訊產業整體升級的基礎。
而Hadoop是Apache基金會下的一款開源軟體,它實現了包括分散式檔案系統和MapReduce框架在內的雲端計算軟體平臺的基礎架構,並且在其上整合了包括資料庫、雲端計算管理、資料倉儲等一系列平臺,其已成為工業界和學術界進行雲計算應用和研究的標準平臺。
如果對Hadoop進行嚴格定義,那麼Hadoop是一種針對大資料處理和分析的開源分散式計算平臺,是一個基於Java的開源軟體架構,執行分佈的、資料密集型應用。
所以,Hadoop只是雲端計算的PaaS層的解決方案之一,並不等同於PaaS,更不用說等同於雲端計算本身了。圖3把雲端計算的交付模式層次做了一個清晰的劃分,如下所示:
所以,《深入淺出雲端計算》犯了一個概念性的錯誤,把Hadoop等同於雲端計算,或者說把Hadoop與雲端計算相提並論,這是不對的。如果把書名改成《深入淺出大資料處理》或者《深入淺出海量書籍處理》,那倒是比較貼切。