高性能計算系列之二-常見名詞一
-
超級計算機
“超級計算”(supercomputing)這名詞第一次出現,是在1929年《紐約世界報》關於IBM為哥倫比亞大學建造大型報表機(tabulator)的報道。
超級計算機是計算機中功能最強、運算速度最快、存儲容量最大的一類計算機,多用於國家高科技領域和尖端技術研究,是一個國家科研實力的體現,它對國家安全,經濟和社會發展具有舉足輕重的意義,是國家科技發展水平和綜合國力的重要標誌。針對超級計算機,全球每年會推出TOP500性能排行榜,中國也推出了TOP100排行榜。
現有的超級計算機運算速度最高每秒近20億億次(2018年6月)。 -
PVP
20世紀70年代出現的向量機可以看作是第一代的高性能計算機,以Cray Research公司開發的 Cray系列計算機為代表。當時的並行向量機( Parallel VectorProcessing,PVP) 通過增加處理器個數、擴展存儲器的方式不斷提升計算能力,占領高性能計算市場達20年之久。其架構如圖 1 所示,不過隨著並行向量機處理器數目的增加,使得定制費用和維護費用越來越昂貴,性價比越來越低,已難以滿足高性能計算機市場化的要求。這個類型的計算機以 CDC公司的CDC8600和CDC STAR- 100為代表。 -
SMP
隨著大規模集成電路的出現,微處理器應運而生.隨著微處理器性能的不斷提高,對稱多處理( Symmetric Multi-Processing,SMP)計算機取代了 PVP,直接導致並行向量機退出了高性能計算市場。這種技術在IL-LIAC IV時代就開始嘗試應用了。
但是SMP計算機可擴展的處理器數目有限,加之對I /O和存儲器操作的不便都限制了其發展。 -
MPP
20世紀90年代初,大規模並行處理(MassivelyParallel Processing,MPP)成為HPC發展的方向,並以ILLIAC IV和Cray I為代表,MPP架構下多個節點間通過網絡進行連接,微處理器之間通過消息傳遞進行通訊。如圖3所示,MPP系統使用專門的網絡和操作系統,而與此同時,隨著個人 PC 的發展,集群出現了。 - MPI
Message Passing Interface是一個並行計算的API,適合超級電腦,大規模集群。
MPV -
Cluster集群
集群就是由一些互相連接在一起的計算機構成的一個並行或分布式系統,從外部來看,它們僅僅是一個系統,對外提供統一的服務。集群一般用於單個電腦無法完成的高性能計算,擁有較高的性價比。在TOP500中,80%以上的超級計算機都是集群系統。
集群是價格低廉並且方便的高性能計算方法,通過本地網絡連接多臺計算機來共同完成工作,集群中的計算機處於平等地位,通過相互協作完成計算。集群以較低的成本獲得計算能力大幅度的提升,使高性能計算趨於平民化。集群結構如圖4所示,集群獲得了計算能力成倍的提高,與之相伴的就是並行與分布式計算技術。 - 並行計算
並行計算(Parallel Computing,或並行處理、平行計算)一般是指許多指令得以同時進行的計算模式。分布式計算(Distributed Computing)是一種把需要進行大量計算的工程數據分成小塊,由多臺計算機分別計算,上傳運算結果後,將結果統一合並得出數據結論的計算模式。目前實現並行與分布式計算最常見的技術是PVM和MPI。MPI已經成為並行計算的標準。
並行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程,是提高計算機系統計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來協同求解同一問題,即將被求解的問題分解成若幹個部分,各部分均由一個獨立的處理機來並行計算。並行計算系統既可以是專門設計的、含有多個處理器的超級計算機,也可以是以某種方式互連的若幹臺的獨立計算機構成的集群。通過並行計算集群完成數據的處理,再將處理的結果返回給用戶。並行計算是相對於串行計算來說的,所謂並行計算可分為時間上的並行和空間上的並行,時間上的並行就是指流水線技術,而空間上的並行則是指用多個處理器並發的執行計算。並行計算機有以下五種訪存模型:均勻訪存模型(UMA),非均勻訪存模型(NUMA),全高速緩存訪存模型(COMA),一致性高速緩存非均勻存儲訪問模型(CC-NUMA),非遠程存儲訪問模型(NORMA)。 - 分布式計算
分布式計算是一門計算機科學,它研究如何把一個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然後把這些部分分配給許多計算機進行處理,最後把這些計算結果綜合起來得到最終的結果。 - 網格計算
網格計算是分布式計算的一種。如果我們說某項工作是分布式的,那麽,參與這項工作的一定不只是一臺計算機,而是一個計算機網絡,顯然這種“螞蟻搬山”的方式將具有很強的數據處理能力。網格計算的實質就是組合與共享資源並確保系統安全。 - 科學計算
科學計算即是數值計算,科學計算是指應用計算機處理科學研究和工程技術中所遇到的數學計算。在現代科學和工程技術中,經常會遇到大量復雜的數學計算問題,這些問題用一般的計算工具來解決非常困難,而用計算機來處理卻非常容易。自然科學規律通常用各種類型的數學方程式表達,科學計算的目的就是尋找這些方程式的數值解。這種計算涉及龐大的運算量,簡單的計算工具難以勝任。計算過程主要包括建立數學模型、建立求解的計算方法和計算機實現三個階段。 - 量子計算
量子計算(Quantum Computing )是一種依照量子力學理論進行的新型計算,量子計算的基礎和原理以及重要量子算法為在計算速度上超越圖靈機模型提供了可能。其原理是量子的重疊與牽連原理產生了巨大的計算能力。普通計算機中的2位寄存器在某一時間僅能存儲4個二進制數(00、01、10、11)中的一個,而量子計算機中的2位量子位(qubit)寄存器可同時存儲這四個數,因為每一個量子比特可表示兩個值。如果有更多量子比特的話,計算能力就呈指數級提高。 - 數據密集型計算
數據密集型計算(Data Intensive Computing)是采用數據並行方法實現大數量並行計算的應用,計算數據量級為TB或PB級,因此也被成為是大數據的核心支撐技術。由數據密集型計算產生了數據密集型科學。利用多種來源的海量時空數據中實驗、分析、模擬與發現全球變化與區域可持續、均衡發展規律是當前數據密集型科學面臨的研究主題。 - 異構計算
異構計算技術從80年代中期產生,由於它能經濟有效地獲取高性能計算能力、可擴展性好、計算資源利用率高、發展潛力巨大,目前已成為並行/分布計算領域中的研究熱點之一。在異構計算系統上進行的並行計算通常稱為異構計算。人們已從不同角度對異構計算進行定義,綜合起來我們給出如下定義:異構計算是一種特殊形式的並行和分布式計算,它或是用能同時支持simd方式和mimd方式的單個獨立計算機,或是用由高速網絡互連的一組獨立計算機來完成計算任務。它能協調地使用性能、結構各異地機器以滿足不同的計算需求,並使代碼(或代碼段)能以獲取最大總體性能方式來執行。 - 大數據分析
大數據(Big data)是2008年9月發表在自然雜誌上一篇《大數據:PB級數據時代的科學》編輯總結文章再次成為熱點。近年來互聯網、移動、物聯網,空間對地觀測平臺技術的發展,全球範圍內數據與信息的處理、交換與服務業務需求這是傳統的常規技術手段無法應對的,於是提出PB級大數據的概念、同時滿足一致性、可用性和分區容忍性CAP定理的理論架構和技術,包括分布式緩存、基於MPP的分布式數據庫、分布式文件系統、各種NoSQL分布式存儲方案等。大數據特征可以概括為4個V, 數據量大(Volume)、速度快(Velocity)、類型多(Variety)、真實性(Veracity)。大數據作為時下最火熱的IT行業的詞匯,隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業價值的利用逐漸成為行業人士爭相追捧的焦點。 - 雲計算
雲計算(Cloud computing)是由Google公司Eric Schmidt 2006年提出的,一種以數據密集型計算技術支撐的服務端的商業模式。基礎是互聯網絡通過虛擬方式共享資源的算模式,使計算、儲存、網絡、軟件等資源按用戶的動態需要,實現為任何人、任何時間、任何地點、任何信息需求提供服務,雲計算後臺支撐技術是數據密集型計算技術。 - 多核處理器
多核處理器是指在一枚處理器中集成兩個或多個完整的計算引擎(內核)。多核技術的開發源於工程師們認識到,僅僅提高單核芯片的速度會產生過多熱量且無法帶來相應的性能改善,先前的處理器產品就是如此。他們認識到,在先前產品中以那種速率,處理器產生的熱量很快會超過太陽表面。即便是沒有熱量問題,其性價比也令人難以接受,速度稍快的處理器價格要高很多。 - 摩爾定律
摩爾定律是由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的晶體管數目,約每隔18個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18個月翻一倍以上。這一定律揭示了信息技術進步的速度。盡管這種趨勢已經持續了超過半個世紀,摩爾定律仍應該被認為是觀測或推測,而不是一個物理或自然法。預計定律將持續到至少2015年或2020年。然而,2010年國際半導體技術發展路線圖的更新增長已經放緩在2013年年底,之後的時間裏晶體管數量密度預計只會每三年翻一番。 - 內存墻
內存墻,指的是內存性能嚴重限制CPU性能發揮的現象。在過去的20多年中,處理器的性能以每年大約55%速度快速提升,而內存性能的提升速度則只有每年10%左右。長期累積下來,不均衡的發展速度造成了當前內存的存取速度嚴重滯後於處理器的計算速度,內存瓶頸導致高性能處理器難以發揮出應有的功效,這對日益增長的高性能計算(High Performance Computing,HPC)形成了極大的制約。事實上,早在1994年就有科學家分析和預測了這一問題,並將這種嚴重阻礙處理器性能發揮的內存瓶頸命名為"內存墻"(Memory Wall)。 - 協處理器
協處理器(coprocessor),一種芯片,用於減輕系統CPU的特定處理任務。例如,數學協處理器可以控制數字處理;圖形協處理器可以處理視頻繪制。
高性能計算系列之二-常見名詞一