1. 程式人生 > >作業系統系統概述——雲端計算

作業系統系統概述——雲端計算

看了寫論文整理出的概述報告

雲端計算體系結構

摘要:系統地分析和總結雲端計算的研究現狀,劃分雲端計算體系架構為核心服務、服務管理、使用者訪問介面等3個層次。圍繞低成本、高可靠、高可用、規模可伸縮性等研究目標,深入全面地介紹了雲端計算的關鍵技術及最新研究進展。在雲端計算基礎設施方面,介紹了雲端計算資料中心設計與管理及資源虛擬化技術;在大規模資料處理方面,分析了海量資料處理平臺及其資源管理與排程技術;在雲端計算服務保障方面,討論了服務質量保證和安全與隱私保護技術,針對新型的雲端計算應用和雲端計算存在的侷限性,有探討並展望了今後的研究方向。

關鍵詞:雲端計算;虛擬化;資料中心;海量資料處理;服務質量;安全與隱私

CloudComputing

Abstract:Basedon the analysis and summary of the previous work,the cloud computing frameworkcan be divided into three layers:core cloud services,cloud service managementand user access interface.To realize low-cost,reliable,available and scalablecloud services,the up-to-date key technologies and research progress of thethree layers within the cloud framework are reviewed intensively and extensively.Regardingcloud infrasture,the strategies for data center design and management areintroduce together with the vitualization technology.In respect of large-scaledata processing,serveral platforms and their resource management and taskscheduling mechanisms are investigated extensively.with regard to cloud servicequality.both Qos guarantee and security/privacy protection are discussed indepth.The prospects for future research are futher explord based on the newapplication models and limitations of cloud computing

Key words:cloud computing,virtualization;data center;large-scaledata processing;quality of service;security and privacy

雲端計算背景:

         隨著科學技術進步,近年來,網際網路地發展日新月異,尤其在社交網站、電子商務、數字城市、線上視訊等領域發展迅猛,從我們生活中來看,就可以隨便舉出例子,比如阿里巴巴、愛奇藝、智慧家居等等,這些應用具有資料儲存量大、業務增長速度快等特點。在企業的IT資金投入中,往往只有20%的投入用於軟硬體更新和商業價值的提升,而另外的80%則被用於了系統維護,而這些都是在於資料量海量增長的背景下,舉個例子,據統計至2010年,社交網站Facebook已儲存了15PB的資料,並且每天新增60TB資料[1]

       鑑於以上情況,2006年Google、Amazon等公司提出了“雲端計算”的構想。根據美國國家標準與技術研究院的定義,雲端計算是一種利用網際網路實現隨時隨地、按需、便捷地訪問共享資源池(如計算設施、儲存裝置、應用程式等)的計算模式,它為使用者遮蔽了資料中心管理、大規模資料處理、應用程式部署等問題。通過雲端計算,使用者可以根據其業務負載快速申請或釋放資源,並以按需支付的方式對所使用的資源付費,在提高服務質量的同時降低運維成本。

       實際上,雲端計算本質上並非一個全新的概念,最早可以追溯到1961年,計算機先驅John MoCarthy就預言:“未來的計算資源能像公共設施(如水、電)一樣被使用。”不過限於當時的技術限制未能付諸實現罷了,而如今各種技術的成熟正好為雲端計算鋪好了道路,也正因為其美好的構想,所以雲端計算模式一經提出便得到了工業界、學術界的廣泛關注。比如Amazon等公司的雲端計算平臺提供了可快速部署的虛擬伺服器,能夠實現基礎設施的按需分配。Google公司的App Engine雲端計算開發平臺能夠為應用服務提供商開發和部署雲端計算服務提供介面。同時,各國學者對雲端計算也開展了大量研究工作,比如2007年,斯坦福大學等美國眾多高校便廣泛與Google、IBM合作,研究雲端計算關鍵技術,近年來,隨著雲端計算研究的深入,眾多國際會議(如SIGCOMM、OSDI、SIGMOD、CCS等)上陸續發表了雲端計算相關研究成果。而在發展戰略上,各國政府也紛紛將雲端計算列為國家戰略,投入了相當大的財力和物力用於雲端計算的部署。其中,美國政府利用雲端計算技術建立聯邦政府網站,以降低政府資訊化執行成本。英國政府建立國家級雲端計算平臺(G-Cloud),超過2/3的英國企業開始使用雲端計算服務。在我國,北京、上海、深圳、杭州、無錫等城市開展了雲端計算服務創新發展試點示範工作:電信、石油石化、交通運輸等行業也啟動了相應的雲計算髮展計劃,以促進產業資訊化。

雲端計算基本原理:

         雲端計算雖然是一種創新的計算模式,不過了解其原理將可以更好地瞭解它,雲端計算是對分散式處理(Distributed Computing)、並行處理(Parallel Computing)和網格計算(Grid Computing)及分散式資料庫的改進處理,其前身是利用平行計算解決大型問題的網格計算和將計算資源作為可計量的服務提供的公用計算,在網際網路寬頻技術和虛擬化技術高速發展後萌生出的雲端計算。在傳統的技術中,叢集計算將大量獨立的計算機通過高速區域網相連,從而提供高效能運算能力。效用計算為使用者提供按需租用計算機資源的途徑。網格計算整合大量異構計算機的閒置資源(如計算資源和磁碟儲存等),組成虛擬組織,以解決大規模計算問題,服務計算作為連線資訊科技和商業服務的橋樑,研究如何用資訊科技對商業服務建模、操作和管理。雲端計算實在傳統的技術上發展創新而來的。

       對雲端計算而言,其借鑑了傳統分散式計算的思想。通常情況下,雲端計算採用計算機叢集構成資料中心,並以服務的形式交付給使用者,使得使用者可以像使用水、電一樣按需購買雲端計算資源。從這個角度看,雲端計算與網格計算的目標非常類似。但是雲端計算和網格計算等傳統的分散式計算也有著較明顯的區別:首先雲端計算是彈性的,即雲端計算能夠根據工作負載大小動態分配資源,而部署與雲端計算平臺上的應用需要適應資源地變化,並能根據變化做出響應;其次,相對於強調異構資源共享的網格計算,雲端計算更強調大規模資源池的分享,通過分享提高資源複用率,並利用規模經濟降低執行成本;最後雲端計算需要考慮經濟成本,因此硬體裝置、軟體平臺的設計不再一味追求高效能,而要綜合考慮成本、可用性、可靠性等因素[2]

       許多雲計算公司和研究人員對雲端計算採用了各種方式進行描述和定義,基於雲端計算的發展和我們對雲端計算的理解,概括性給出雲端計算的基本原理為:利用非本地或遠端伺服器(叢集)的分散式計算機為網際網路使用者提供服務(計算、儲存、軟硬體等服務)。這使得使用者可以將資源切換到需要的應用上,更具需求訪問計算機和儲存池。雲端計算可以把普通的伺服器或者PC連線起來以後得到超級計算機和儲存的功能,但是成本更低。雲端計算真正實現了按需計算,從而有效地提高了對軟硬體資源的利用效率。雲端計算的出現使高效能平行計算不再是科學家和專業人士的專利,普通的使用者也能通過雲端計算享受高效能平行計算所帶來的便利,使人人都有機會可以使用並行機,從而大大提高了工作效率和計算資源的利用率。雲端計算模式中使用者不需要了解伺服器在哪裡,不用關心內部如何運作,通過高速網際網路就可以透明地使用各種資源[3]

       同時,基於上述比較並結合雲端計算的應用背景,雲端計算的特點可以歸納如下:首先就是彈性服務,其好處在於服務的規模可快速伸縮,從而能夠自動適應業務負載的動態變化。使用者使用的資源與業務的需求相一致,避免了因為伺服器效能過載或者冗餘而導致服務質量下降或資源浪費;其次就是資源池化,在這裡資源將以共享的資源池的方式統一管理。利用虛擬化技術,將資源分享給不同使用者,資源的放置、管理與分配策略對於使用者而言是透明的;再者服務做到按需分配,以服務的形式為使用者提供應用程式、資料儲存、基礎設施等資源,並可以更具使用者需求,自動分配資源,而不需要系統管理員干預;最後,泛在接入,使用者可以利用各種終端裝置(如PC電腦、膝上型電腦、智慧手機等)隨時隨地通過網際網路訪問雲端計算服務。以上特性,使得使用者只需連上網際網路就可以源源不斷地使用計算機資源,實現了“網際網路即計算機”的構想。

       綜上所述,雲端計算是分散式計算、網際網路技術、大規模資源管理等技術的融合與發展,其研究和應用是一個系統工程,涵蓋了資料中心管理、資源虛擬化、海量資料處理、電腦保安等重要問題。

雲端計算服務層次:

         雲端計算可以按需提供彈性資源,它的表現形式是一系列服務的集合。結合當前雲端計算的應用與研究來看,雲端計算還處於萌芽階段,有龐雜的各類廠商在開發不同的雲端計算服務。雲端計算的表現形式多種多樣,簡單的雲端計算在人們日常網路應用中隨處可見,比如騰訊QQ空間提供的線上製作Flash圖片,Google的搜尋服務,GoogleDoc,Google Apps等。目前雲端計算的主要服務形式有:SaaS(Software as a service),PaaS(Platform as aService),IaaS(Infrastucture as a Service)。下面我們將分別講述每個模組。

(1)軟體即服務(SaaS)

       SaaS服務提供商將應用軟體統一部署在自己的伺服器上,使用者根據需求通過網際網路向廠商訂購應用軟體服務,服務提供商根據客戶所定軟體的數量、時間的長短等因素收費,並且通過瀏覽器向客戶提供軟體的模式。這種服務模式的優勢是,由服務提供商維護和管理軟體、提供軟體執行的硬體設施,使用者只需擁有能夠接入網際網路的終端,即可隨時隨地使用軟體[4]。這種模式下,客戶不再像傳統模式那樣花費大量資金在硬體、軟體、維護人員,只需要支出一定的租賃服務費用,通過網際網路就可以享受到相應的硬體、軟體和維護服務,這是網路應用最具效益的營運模式。對於小型企業來說,SaaS是採用先進技術的最好途徑。

  以企業管理軟體來說,SaaS模式的雲端計算ERP可以讓客戶根據併發使用者數量、所用功能多少、資料儲存容量、使用時間長短等因素不同組合按需支付服務費用,既不用支付軟體許可費用,也不需要支付採購伺服器等硬體裝置費用,也不需要支付購買作業系統、資料庫等平臺軟體費用,也不用承擔軟體專案定製、開發、實施費用,也不需要承擔IT維護部門開支費用,實際上雲端計算ERP正是繼承了開源ERP免許可費用只收服務費用的最重要特徵,是突出了服務的ERP產品。

Saas是基於雲端計算基礎平臺所開發的應用程式。企業可以通過租用SaaS層服務解決企業資訊化問題,如企業通過Gmail建立屬於該企業的電子郵件服務。該服務託管於Google的資料中心,企業不必考慮伺服器的管理、維護問題。對於普通使用者來講,SaaS層服務將桌面應用程式遷移到網際網路,可實現應用程式的泛在訪問。

(2)平臺即服務(PaaS)

PaaS是雲端計算應用程式執行環境,提供應用程式部署與管理服務。通過PaaS層的軟體工具和開發語言,應用程式開發者只需上傳程式程式碼和資料即可使用服務,而不必關注底層的網路、儲存、作業系統的管理問題,由於目前網際網路應用平臺(如Facebook、Google、淘寶等)的資料量日趨龐大,PaaS層應當充分考慮對海量資料的儲存與處理能力,並利用有效的資源管理與排程策略提高處理效率[5]

簡而言之,PaaS能夠把開發環境做為一種服務來提供,這是一種分散式平臺服務,PaaS能夠給企業或個人提供研發的中介軟體平臺,提供應用程式開發、資料庫、應用伺服器、實驗、託管及應用服務。

Google App Engine,Salesforce的force.com平臺,八百客的800APP是PaaS的代表產品。以Google App Engine為例,它是一個由python應用伺服器群、BigTable資料庫及GFS組成的平臺,為開發者提供一體化主機伺服器及可自動升級的線上應用服務。使用者編寫應用程式並在Google的基礎架構上執行就可以為網際網路使用者提供服務,Google提供應用執行及維護所需要的平臺資源。

(3)基礎設施服務(IaaS)

IaaS提供硬體基礎設施部署服務,為使用者按需提供實體或虛擬的計算、儲存和網路等資源。在使用IaaS層服務的過程中,使用者需要向IaaS層服務提供商提供基礎設施的配置資訊,運行於基礎設施的程式程式碼以及相關的使用者資料。由於資料中心是IaaS層的基礎,因此資料中心的管理和優化問題近年來成為研究熱點。樑歪,為了優化硬體資源的分配,IaaS層引入了虛擬化技術[6]。藉助於Xen、KVM、VMware等虛擬化工具,可以提供可靠性高、可定製性強、規模可擴充套件的IaaS層服務。

IaaS的優點是使用者只需低成本硬體,按需租用相應計算能力和儲存能力,大大降低了使用者在硬體上的開銷。

  目前,以Google雲應用最具代表性,例如GoogleDocs、GoogleApps、Googlesites,雲端計算應用平臺GoogleApp Engine。

  GoogleDocs是最早推出的雲端計算應用,是軟體即服務思想的典型應用。它是類似於微軟的Office的線上辦公軟體。它可以處理和搜尋文件、表格、幻燈片,並可以通過網路和他人分享並設定共享許可權。Google檔案是基於網路的文書處理和電子表格程式,可提高協作效率,多名使用者可同時線上更改檔案,並可以實時看到其他成員所作的編輯。使用者只需一臺接入網際網路的計算機和可以使用Google檔案的標準瀏覽器即可線上建立和管理、實時協作、許可權管理、共享、搜尋能力、修訂歷史記錄功能,以及隨時隨地訪問的特性,大大提高了檔案操作的共享和協同能力。

雲端計算技術層次

    雲端計算系統運用了許多技術,其中以程式設計模型、資料管理技術、資料儲存技術、虛擬化技術、雲端計算平臺管理技術最為關鍵。

(1)程式設計模型

  MapReduce是Google開發的java、Python、C++程式設計模型,它是一種簡化的分散式程式設計模型和高效的任務排程模型,用於大規模資料集(大於1TB)的並行運算。嚴格的程式設計模型使雲端計算環境下的程式設計十分簡單。MapReduce模式的思想是將要執行的問題分解成Map(對映)和Reduce(化簡)的方式,先通過Map程式將資料切割成不相關的區塊,分配(排程)給大量計算機處理,達到分散式運算的效果,再通過Reduce程式將結果彙整輸出。

(2) 海量資料分佈儲存技術

  雲端計算系統由大量伺服器組成,同時為大量使用者服務,因此雲端計算系統採用分散式儲存的方式儲存資料,用冗餘儲存的方式保證資料的可靠性。雲端計算系統中廣泛使用的資料儲存系統是Google的GFS和Hadoop團隊開發的GFS的開源實現HDFS。

  GFS即Google檔案系統(Google File System),是一個可擴充套件的分散式檔案系統,用於大型的、分散式的、對大量資料進行訪問的應用。GFS的設計思想不同於傳統的檔案系統,是針對大規模資料處理和Google應用特性而設計的。它運行於廉價的普通硬體上,但可以提供容錯功能。它可以給大量的使用者提供總體效能較高的服務。

  一個GFS叢集由一個主伺服器(master)和大量的塊伺服器(chunkserver)構成,並被許多客戶(Client)訪問。主伺服器儲存檔案系統所以的元資料,包括名字空間、訪問控制資訊、從檔案到塊的對映以及塊的當前位置[7]。它也控制系統範圍的活動,如塊租約(lease)管理,孤兒塊的垃圾收集,塊伺服器間的塊遷移。主伺服器定期通過HeartBeat訊息與每一個塊伺服器通訊,給塊伺服器傳遞指令並收集它的狀態。GFS中的檔案被切分為64MB的塊並以冗餘儲存,每份資料在系統中儲存3個以上備份。

  客戶與主伺服器的交換隻限於對元資料的操作,所有資料方面的通訊都直接和塊伺服器聯絡,這大大提高了系統的效率,防止主伺服器負載過重。

  (3) 海量資料管理技術

  雲端計算需要對分佈的、海量的資料進行處理、分析,因此,資料管理技術必需能夠高效的管理大量的資料。雲端計算系統中的資料管理技術主要是Google的BT(BigTable)資料管理技術和Hadoop團隊開發的開源資料管理模組HBase。

  BT是建立在GFS,Scheduler, Lock Service和MapReduce之上的一個大型的分散式資料庫,與傳統的關係資料庫不同,它把所有資料都作為物件來處理,形成一個巨大的表格,用來分佈儲存大規模結構化資料。

Google的很多專案使用BT來儲存資料,包括網頁查詢,Google earth和Google金融。這些應用程式對BT的要求各不相同:資料大小(從URL到網頁到衛星圖象)不同,反應速度不同(從後端的大批處理到實時資料服務)。對於不同的要求,BT都成功的提供了靈活高效的服務。

(4)虛擬化技術

    資料中心為雲端計算提供了大規模資源,為了實現基礎設施服務的按需分配,需要研究虛擬化技術,虛擬化是IaaS層重要的組成部分,也是雲端計算的最重要特點,虛擬化技術可以提供如下特點。

【2】  資源定製。使用者利用虛擬化技術,配置私有的伺服器,指定所需的CPU數目、記憶體容量、磁碟空間,實現資源的按需分配。

【3】  細粒度資源管理。將物理伺服器拆分成若干虛擬機器,可以提高伺服器的資源利用率,減少浪費,而且有助於伺服器的負載均衡和節能,

基於以上特點,虛擬化技術成為了實現雲端計算資源池化和按需服務的基礎,通過虛擬化技術可實現軟體應用與底層硬體相隔離,它包括將單個資源劃分成多個虛擬資源的裂分模式,也包括將多個資源整合成一個虛擬資源的聚合模式。虛擬化技術根據物件可分成儲存虛擬化、計算虛擬化、網路虛擬化等,計算虛擬化又分為系統級虛擬化、應用級虛擬化和桌面虛擬化。

(5)雲端計算平臺管理技術

  雲端計算資源規模龐大,伺服器數量眾多並分佈在不同的地點,同時執行著數百種應用,如何有效的管理這些伺服器,保證整個系統提供不間斷的服務是巨大的挑戰。

  雲端計算系統的平臺管理技術能夠使大量的伺服器協同工作,方便的進行業務部署和開通,快速發現和恢復系統故障,通過自動化、智慧化的手段實現大規模系統的可靠運營。

雲端計算安全

雲端計算技術正在全面發展,應用越來越廣泛,所以其安全問題不容忽視,特別是雲體系結構的內部和雲端計算外部環境安全,儘管雲端計算使用者希望他們的資料能夠保持為機密,但是當前的雲端計算是建立在一種傳統的層級安全模式上的,但是這種機制只是能夠保證雲服務商提供的專有程式碼不被非信任程式碼的不壞,而對於使用者的資料被專有程式碼訪問卻是沒有任何防衛機制的,因此,除了執行應用程式的硬體外,雲使用者必須確信如下幾點:

(1)    使用者必須相信服務廠商提供的軟體,這其中包含作為超級使用者和韌體的特權程式碼,還有提供商的管理軟體協議棧

(2)    使用者必須相信服務商的工作人員,包括系統管理員以及任何能夠接近硬體的員工,如清潔工和保安等

(3)    在任何資料可能重複的地方加強法律,而從這條出發,這就是一項巨大與神祕化的基礎專案,將會導致各方面的牽涉,將會限制雲端計算的應用

當前最好的用於保護隱私的機制使用了一種叫做硬體安全模型機制,而這些具體應用將依賴於防干擾的硬體來保護重要的祕密,比如金鑰,同時支援一系列的暗語功能,但是都需要較大的代價,同時不能普遍適用,典型的佈置使用硬體安全用來保護金鑰等資料,而在不受信任的計算節點上只短暫的解析資料,從而仍然有使得資料受到威脅的可能,早期的研究依賴受信任的管理程式來保護應用程式執行在有惡意的作業系統上,但是一旦管理程式本身被惡意的雲服務商控制,則後果仍不可估量,最後,儘管一些應用程式能夠運行於加密的資料上,而這些暗號模型對於一般的計算還是有著效能限制。

       所以目前實現高安全性的雲端計算環境仍面臨諸多挑戰,一方面,雲平臺上的應用程式同底層硬體環境撿拾鬆耦合的,沒有固定不變的安全邊界,大大增加了資料安全與隱私保護的難度[8]。另一方面,雲端計算環境中資料量十分巨大(通常都是TB甚至PB級),傳統安全機制在可擴充套件性及效能方面難以有效滿足需求,隨著雲端計算的安全問題日益突出,近年來研究者針對雲端計算的模型和應用,討論了雲端計算安全隱患,研究了雲端計算環境下的資料安全和隱私保護技術,下面我們將結合雲端計算核心服務的層次模型與雲端計算部署模式兩個方面來介紹雲端計算環境下的資料安全與隱私保護技術[9]

       雲端計算核心服務層次

【1】    IaaS層的安全

虛擬化是雲端計算IaaS層普遍採用的技術。該技術佈景可以實現資源可定製,而且能夠有效隔離使用者的資源,然而虛擬化平臺並不是完美的,仍然存在安全漏洞,比如基於Amazon EC2上的實驗,Ristenpart等人發現Xen虛擬化平臺存在被旁路攻擊的危險,為了避免基於Cache快取的旁路攻擊,Raj等人提出了Cache層次銘感的核心分配方法和基於頁染色的Cache劃分2種資源管理方法,以實現效能與安全隔離。

【2】    PaaS層的安全

PaaS層的海量資料儲存和處理需要防止隱私洩露問題,Roy等人提出了一種基於MapReduce平臺的隱私保護系統Airavat,整合強訪問控制和區分隱私,為處理關鍵資料提供安全和隱私保護。在加密資料的文字搜尋方面,傳統的方法需要對關鍵詞進行完全匹配,但是雲端計算資料量非常大,在使用者頻繁訪問的情況下,精確匹配返回的結果會非常少,使得系統的可用性大幅降低[10],Li等人提出了基於模糊關鍵詞的搜尋方法,在精確匹配失敗後,還將採取與關鍵詞近似語義的關鍵詞集的匹配,達到在隱私保護的前提下為使用者檢索更多匹配檔案的效果。

【3】    SaaS層的安全

SaaS層提供了基於網際網路地應用程式服務,並會儲存敏感資料(如企業商業資訊)。因為雲伺服器由許多使用者共享,且雲伺服器和使用者不在同一個信任域裡,所以需要對敏感資料建立訪問控制機制,由於傳統的加密控制方式需要花費很大的計算開銷,而且金鑰釋出和細粒度的訪問控制都不適合大規模的資料管理,Yu等人討論了基於檔案屬性的訪問控制策略,在不洩露資料內容的前提下將與訪問控制相關的複雜計算工作交給不可信的雲伺服器完成,從而達到訪問控制的目的。

       雲端計算的部署模式

【1】    私有云

私有云是一個企業或者組織內部構建的雲端計算系統。部署私有云需要企業新建私有的資料中心或者改造原有資料中心,雲基礎設施運營的全權負責組織,這可能是由該組織或者第三方管理上可能存在的前提或關閉的前提,由於服務提供商和使用者同屬於一個信任域,所有資料隱私可以得到保護。

【2】    公有云

公有云是以按需付費方式向公眾提供的雲端計算服務,雲基礎設施提供廣大市民或一個大產業集團,是由銷售雲服務的組織所擁有的,雖然公有云提供了便利的服務方式,但是由於使用者資料儲存在服務提供商,存在使用者隱私洩露、資料安全得不到保證等問題。

【3】    社群雲

雲基礎設施共享的一些組織和支援一個特定的社會共同關心的問題(例如,使命,安全要求,政策和法規)。這可能是由組織或第三方管理上存在的前提或關閉的前提

【4】    混合雲

混合雲混合了公有云和私有云的特點,使用者的關鍵資料存放在私有云,以保護資料隱私,當私有云工作負載過重時,可臨時購買公有云資源以保證服務質量,部署混合雲需要公有云和私有云具有統一的介面標準,以保證服務無縫遷移,

除了以上方面,工業界對雲端計算的安全問題非常重視,併為雲端計算服務和平臺開發了若干安全機制,其中那個Sun公司釋出開源的雲端計算安全工具可為Amazon EC2提供安全保護。微軟公司釋出基於雲端計算平臺Azure的安全方案,以解決虛擬化及底層硬體環境中的安全性問題,另外,Yahoo!為hadoop集成了Kerberos驗證,Kerberos驗證有助於資料隔離,使對敏感資料的訪問與操作更為安全[11]

雲端計算與大資料結合    

         如今,社會的愈發機械化與智慧化,結果各種組織或機構正在以不可想象的速度產生和儲存大量的資料,管理這些資料就已經是一項棘手工作,而從這些資料中發現有益的資訊則更是一項極為有競爭力的關鍵,各種分析工具用於從這些有結構或者無結構的私有資料資訊中發掘出知識變得尤為重要,同時大量的資料廣泛存在於各種網站中,這些資訊如果能夠被利用,將帶來不可估量的收益。 比如通過對使用者的推特、微博或者產品估計中我們尅得到使用者的一系列需求信心,那麼我們便可以對此分析預估他們所需,從而能偶最優化資源配置,這些範例被廣泛稱之為大資料。

       儘管對分析大資料已經步上正軌,但是把它們投入實際應用卻仍舊是一項複雜而且耗時耗力的工作,有人指出,大資料能夠給公司帶來實質的物質價值,而這些公司們也樂於去採用這項技術,但是仍舊在這些實現領域中充滿了一系列的挑戰,一個公司願意去使用這些分析技術往往需要高額的軟體使用權費用,配置大型的計算機裝置,同時對這些幫助企業更好掌握這項技術的專家支付高昂費用,專家們組織資料,並整合分析,幫助企業掌握顧客對產品和市場的需求,舉止,未來趨勢。然而這些工作往往開銷極大同時缺乏彈性。儘管如此對於大資料的使用和研究卻仍然沒有停止,又因為是新一輪技術制高點,比如美國和英國政府方面在這方面投入了大量的資金,同時在學術上麻省理工學院也與英特爾公司開展了學術會議。

       雲端計算通過對IT行業增加了極大的彈性從而在IT行業中引發一陣浪潮,使得企業只需要支付他們的資源和服務的費用,從而減少IT的執行成本,企業只需要提供必要的雲技術所需的成本資源便可以執行他們的應用,使用雲技術能夠使它們在特定領域的技術和完成大幅度減少成本,卻能夠做到使設施、平臺和軟體資源如同服務一般。

       基於以上各自特點,雲端計算與大資料之間是相輔相成,相得益彰的關係。大資料探勘處理需要雲端計算作為平臺,而大資料涵蓋的價值和規律則能夠使雲端計算更好的與行業應用結合併發揮更大的作用。雲端計算將計算資源作為服務支撐大資料的挖掘,而大資料的發展趨勢是對實時互動的海量資料查詢、分析提供了各自需要的價值資訊。
  其次,雲端計算與大資料的結合將可能成為人類認識事物的新的工具。實踐證明人類對客觀世界的認識是隨著技術的進步以及認識世界的工具更新而逐步深入。過去人類首先認識的是事物的表面,通過因果關係由表及裡,由對個體認識進而找到共性規律[12]。現在將雲端計算和大資料的結合,人們就可以利用高效、低成本的計算資源分析海量資料的相關性,快速找到共性規律,加速人們對於客觀世界有關規律的認識。

雲端計算的機遇與挑戰

雖然我們看到雲端計算在國內的廣闊前景,但也不得不面對一個現實,雲端計算需要應對眾多的客觀挑戰,才能夠逐漸發展成為一個主流的架構。雲端計算所面臨的挑戰包括: 

  使用者認識不足 

儘管雲端計算在國內已經得到了廣泛的宣傳,並且已經出現了若干典型的使用者和案例。但是企業和終端使用者對雲端計算仍然缺乏瞭解和認識,特別是在具體的業務和應用上,雲端計算可以帶來怎樣的變革和收益,仍然是不夠清晰的。在這種情況下,雲端計算真正落地成為成功應用,會遇到很多困難。因此,重中之重是拋開大量的理論和概念,在應用和業務角度進行市場推廣和使用者教育,使雲端計算具有可操作性。 

  硬體遷移風險 

雲端計算的一個重要特徵就是會改變傳統的應用交付方式,也改變傳統的資料中心運營模式。這種變革,勢必會帶來一定程度的風險。這種風險包括硬體遷移風險和應用移植風險。硬體遷移風險指的是,在傳統資料中心中,硬體都相對獨立,但是在雲端計算中心中,基於虛擬化的模式會導致硬體界限不再那麼明顯,而是以虛擬機器的形式在硬體裝置間按照負載均衡和提高利用率的原則進行靈活遷移。這就對傳統硬體的部署方式提出了挑戰,如果缺乏系統的評估和科學的分析,就會導致硬體平臺無法發揮出應有的效能,甚至導致應用系統的崩潰。 

  應用移植風險 

應用遷移風險指的是原有應用,如財務應用、ERP應用、CRM應用等,在傳統資料中心中是部署在相對獨立的硬體系統中的,包括儲存也會存在一定的應用獨立性。在新的雲端計算平臺中,應用會部署到不同的硬體,甚至是作業系統上,能否實現應用的無縫遷移,是保證計算成功的重要內容。如果在雲端計算平臺上廣泛採用虛擬化技術,又會涉及到虛擬機器遷移和作業系統的相容性,這一方面的因素也會影響到應用的可用性。 

  安全性 

雲端計算平臺的安全問題由兩方面構成。一是資料本身的保密性和安全性,因為雲端計算平臺,特別是公共雲端計算平臺的一個重要特徵就是開放性,各種應用整合在一個平臺上,對於資料洩漏和資料完整性的擔心都是雲端計算平臺要解決的問題。這就需要從軟體解決方案,應用規劃角度進行合理而嚴謹的設計。二是資料平臺上軟硬體的安全性,如果由於軟體錯誤或者硬體崩潰,導致應用資料損失,都會降低雲端計算平臺的效能。這就需要採用可靠的系統監控、災難恢復機制以確保軟硬體系統的安全執行。 

 服務等級協議 

雲端計算所面臨的挑戰,除了在系統方面的風險外,如何為使用者提供合乎要求的服務也是非常重要的。因為相對於傳統資料中心,雲端計算所提供的服務儘管更加豐富,但是也會給使用者帶來難以控制的擔心,通過對使用者的需求進行分析,提出合理、可執行的服務等級協議(SLA),將在很大程度上幫助使用者樹立對雲端計算服務的信心。

總結

從目前來看,雲端計算平臺在改進基礎架構、節省成本等方面具備相當的優勢。在一些場景,已經可以取代傳統的技術。IDC觀察到,越來越多的企業開始關注雲端計算,並評估自身建設雲端計算平臺的可能性。但是,雲端計算市場仍處於發展初期,大量企業沒有足夠的經驗和知識來自行建設雲端計算平臺。還有待雲端計算技術的進一步發展成熟。

隨著經濟的發展,服務化成為產業發展的必然趨勢,各種生產活動的成果逐漸開始以服務方式向用戶進行交付。而云計算所提供的XaaS模式正是服務化趨勢的體現。雲端計算為產業服務化提供了技術平臺,使生產流程的最終交付品是一種基於網路和資訊平臺的服務。I我們可以相信,隨著我國經濟不斷向第三產業轉型,雲端計算在國內將有廣闊的發展空間。在未來幾年中,中國雲端計算市場將會保持快速地增長。 

雲端計算作為一種新興的資訊科技發展迅速,通過總結最近幾年在該領域的應用與研究成果,我們在這裡初步探討了雲端計算體系架構,綜述了體系架構中主要關鍵技術的研究現狀,包括資料中心設計月管理、虛擬化、海量資料儲存與處理、資源管理與排程、服務質量保證與隱私保護等。總體來說,雲端計算的研究正處於發展階段,從拓展雲端計算應用模式,解決內在的侷限性等角度出發,圍繞可用性、規模彈性、成本能耗等因素,仍有大量關鍵問題需要深入研究。

參考文獻

[1] THUSOO A, SHAO Z, ANTHONY S, et al. Datawarehousing and analytics infrastructure at facebook[A]. SIGMOD'10[C].Indianapolis,Indiana, USA:ACM, 2010.1013-1020

[2] GILLEN A,BROUSSARD F W, PERRY R, et al. Optimizing infrastructure:

the relationship between it labor costs and bestpractices for managing the windows desktop[EB/OL].http://download.microsoft.com/download/a/4/4/a4474b0c-57d8-41a2-afe6-32037fa93ea6/IDC_windesktop_IO_whitepaper.pdf 2007.

[3]MELL P, GRANCET. The NIST Definition of Cloud Computing[R].

National Institute of Standards and Technology, 2011.

[4]AmazonEC2[EB/OL]. http://aws.amazon.com/ec2 2011.

[5] DEAN J,GHEMAWAT S. MapReduce: a flexible data processing

tool[J]. Commun ACM, 2010, 53(1): 72-77.

[6] Google AppEngine[EB/OL]. http://code.google.com/appengine/ 2011.

[7] SalesforceCRM[EB/OL]. http://www.salesforce.com/.

[8] MILOJICIC D,WOLSKI R. Eucalyptus: delivering a private cloud[J].

Computer. 2011, 44(4): 102-104.

[9] FOSTER I, YONGZ, RAICU I, et al. Cloud Computing and Grid

Computing 360-Degree Compared[Z]. 2008.1-10.

[10] Google investorrelations[EB/OL].http://investor.google.com/financial.

2011.

[11] GREENBERG A, HAMILTONJ, MALTZ D A, et al. The cost of a

cloud: research problems in data center networks[J].SIGCOMM

Comput Commun Rev, 2008, 39: 68-73.

[12] GREENBERG A,HAMILTON J R, JAIN N, et al. VL2: a scalable

and flexible data center network[A]. SIGCOMM'09[C]. Barcelona,

Spain: ACM, 2009.51-62.

相關推薦

作業系統系統概述——雲端計算

看了寫論文整理出的概述報告 雲端計算體系結構 摘要:系統地分析和總結雲端計算的研究現狀,劃分雲端計算體系架構為核心服務、服務管理、使用者訪問介面等3個層次。圍繞低成本、高可靠、高可用、規模可伸縮性等研究目標,深入全面地介紹了雲端計算的關鍵技術及最新研究進展。在雲端計算基礎設

怎麼理解LAXCUS大作業系統系統雲端計算體系中的定位

  最近一直在做laxcus大資料作業系統的分散式應用開發,因為做得多了,感觸也多了。按照雲端計算三層定義,即iaas(基礎設施即服務)、paas(平臺即服務)、saas(軟體即服務),laxcus屬於paas層,它提供了paas層的各種功能,如果做個對標,它實際是OpenStack、Hadoop、關係資料庫

分散式系統雲端計算概述

一、內容 分散式系統基礎 分散式系統特徵 系統模型 程序間通訊 間接通訊 …… 分散式系統泛型 分散式檔案系統

企業雲盤VS文件管理系統雲端計算的魅力與困惑

雲端計算是當前IT市場上一個炙手可熱的概念,當然這已經不僅僅侷限於概念,它事實上已成為強有力的商業模式,促成了微軟在2018年未重奪全球市值最高寶座,巧合的是同樣主推雲端計算的亞馬遜正好是全球市值第二的公司。雲端計算究竟有何魅力,它是否能更好滿足客戶需求呢?企業雲盤這個細分行業是一個很

第一章—計算機系統概述【計算機作業系統

1.1 列出並簡要地定義計算機的四個主要組成部分。 主儲存器,儲存資料和程式;算術邏輯單元,能處理二進位制資料;控制單元,解讀儲存器中的指令並且使他們得到執行;輸入/輸出裝置,由控制單元管理。 1.2 定義處理器暫存器的兩種主要類別。 使用者可見暫存器:優先使用這些暫存器,可以

2019年王道計算機考研作業系統筆記---系統概述

文章目錄 作業系統特性 作業系統功能 作業系統分類 作業系統執行機制 作業系統特性 併發 巨集觀上並行,微觀上序列,用通俗的語言描述, 在某一個時間間隔內並行,某

雲端計算全棧-系統管理04-目錄和檔案管理(二)

作者資訊: 房佳亮 ([email protected])   學習環境: 作業系統 IP地址 主

雲端計算全棧-系統管理03-目錄和檔案管理(一)

作者資訊: 房佳亮 ([email protected])   學習環境: 作業系統 IP地址 主

雲端計算與分散式系統 從並行處理到物聯網》下載

2018年11月01日 12:51:53 qq_43553691 閱讀數:6 標籤: 程式設計 資料

雲端計算下的雲端儲存系統

1、雲端計算 雲是網路、網際網路的一種比喻說法。過去在圖中往往用雲來表示電信網,後來也用來表示網際網路和底層基礎設施的抽象。 雲端計算是基於網際網路的相關服務的增加、使用和交付模式,通常涉及通過網際網路來提供動態易擴充套件且經常是虛擬化的資源。 2、雲端儲存 雲端儲存是在雲端計算(cloud

【產業智慧官】 用新一代技術+商業作業系統(AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧

產業智慧官 用新一代技術+商業作業系統(AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧...

【Enweitech Software Works】創新實踐。致力於軟體與網際網路研究…專注網站建設與推廣、軟體開發、雲端計算、手機APP定製、電子資訊系統整合與應用、資訊保安與資料管理、軟體外包、數字化解決方案和企業資訊化諮詢服務。

創新實踐。致力於軟體與網際網路研究…專注網站建設與推廣、軟體開發、雲端計算、手機APP定製、電子資訊系統整合與應用、資訊保安與資料管理、軟體外包、數字化解決方案和企業資訊化諮詢服務。...

作業系統---精髓與設計原理 之 計算機系統概述

1.作業系統的基本概念 1.1operating system 是指控制和管理整個計算機系統的硬體和軟體資源,併合理地組織排程計算機的工作和資源的分配,以提供給使用者和其他軟體方便的介面和環境的程式集合。計算機作業系統是隨著計算機研究和應用的發展逐步形成並發

分散式計算、平行計算雲端計算概述

1、什麼是分散式計算: 經科學研究發現,目前存在很多萬億次計算例項,其中涉及的問題都需要非常巨大的計算能力才能解決,這類問題很多還是跨學科的、極富挑戰性。除此之外還有很多研究專案需要巨大的計算能力 比如: 1)解決複雜的數學問題 2)尋找最安全的密碼系統 3)生物病理研究

資料探勘|資料開發|資料分析開發|大資料|hbase|hadoop|雲端儲存|雲端計算|推薦系統

Downloading OpenSSL: Run the command below, wget http://www.openssl.org/source/openssl-1.0.1g.tar.gz Also, download the MD5 hash to veri

【軟考】系統可靠性的計算(作業系統)

好頭痛,做了歷年真題....七十五道選擇題錯了大半,不活了 直接切入正題,系統可靠性計算是歷年軟考必考的內容,所以這裡來求4種系統的可靠性計算 可靠性計算主要涉及三種系統,即串聯絡統、並聯系統和冗餘系

作業系統精髓與設計原理-計算機系統概述

本文若未註明均摘抄自《作業系統精髓與設計原理》:William Stallings著,陳向群、陳渝譯,機械工業出版社出版第六版 1 計算機系統概述 關鍵詞 地址暫存器 變址暫存器 區域性性 輔助儲存器

作業系統(第一章 計算機系統概述

1、計算機的5大組成部件是:運算器、控制器、儲存器、輸入裝置和輸出裝置也叫做計算機系統的四大結構化部件:處理器(CPU,也是運算器和控制器的結合):控制計算機的操作,執行資料處理功能。當只有一個處理器時,它通常只中央處理器(CPU)記憶體:儲存資料和程式。此類儲存器通常是易失

作業系統精髓與設計原理】1. 計算機系統概述

計算的基本構成 處理器 記憶體 輸入輸出模組 系統匯流排 程式的執行 程式執行分為取指令與執行指令兩個過程,指令由操作碼與資料地址兩部分; 取指令即根據PC中的指令地址讀取指令至IR,執行就是將IR中的對應的操作與資料進行載入和執行。 指令格式與整數資料

華為雲端計算openstack的概述!個人總結筆記

openstack軟體是一個雲作業系統,用於控制整個資料中心的海量計算,儲存和網路資源,藉助統一檢視或openstack API進行管理。 openstack是一個可程式設計的架構。在計算,網路,儲存之上構建了一系列的API。 openstack的設計與開發