CPU和GPU計算的優缺點分析
CPU和GPU都是具有運算能力的晶片,CPU更像“通才”——指令運算(執行)為重+數值運算,GPU更像“專才”——圖形類數值計算為核心。在不同型別的運算方面的速度也就決定了它們的能力——“擅長和不擅長”。晶片的速度主要取決於三個方面:微架構,主頻和IPC(每個時鐘週期執行的指令數)。
-
微架構
CPU微架構的設計是面向指令執行高效率而設計的,因而CPU是計算機中設計最複雜的晶片。和GPU相比,CPU核心的重複設計部分不多,這種複雜性不能僅以電晶體的多寡來衡量,這種複雜性來自於實現:如程式分支預測,推測執行,多重巢狀分支執行,並行執行時候的指令相關性和資料相關性,多核協同處理時候的資料一致性等等複雜邏輯。
GPU其實是由硬體實現的一組圖形函式的集合,這些函式主要用於繪製各種圖形所需要的運算。這些和畫素,光影處理,3D座標變換等相關的運算由GPU硬體加速來實現。圖形運算的特點是大量同類型資料的密集運算——如圖形資料的矩陣運算,GPU的微架構就是面向適合於矩陣型別的數值計算而設計的,大量重複設計的計算單元,這類計算可以分成眾多獨立的數值計算——大量數值運算的執行緒,而且資料之間沒有像程式執行的那種邏輯關聯性。
因此從微架構上看,CPU擅長的是像作業系統、系統軟體和通用應用程式這類擁有複雜指令排程、迴圈、分支、邏輯判斷以及執行等的程式任務。它的並行優勢是程式執行層面的,程式邏輯的複雜度也限定了程式執行的指令並行性,上百個並行程式執行的執行緒基本看不到。
-
主頻
GPU執行每個數值計算的速度並沒有比CPU快,從目前主流CPU和GPU的主頻就可以看出了,CPU的主頻都超過了2GHz,甚至3GHz,而GPU的主頻最高還不到2GHz,主流的也就1GHz。所以GPU在執行少量執行緒的數值計算時速度並不能超過CPU。
目前GPU數值計算的優勢主要是浮點運算,它執行浮點運算快是靠大量並行,但是這種數值運算的並行性在面對程式的邏輯執行時毫無用處。
-
IPC(每個時鐘週期執行的指令數)
這個方面,CPU和GPU無法比較,因為
另外,目前有些GPU也能夠支援比較複雜的控制指令,比如條件轉移、分支、迴圈和子程式呼叫等,但是GPU程式控制這方面的增加,和支援作業系統所需要的能力CPU相比還是天壤之別,而且指令執行的效率也無法和CPU相提並論。
總結一下:
CPU更適合處理邏輯控制密集的計算任務,而GPU適合處理資料密集的計算任務。並且由於現代CPU的發展,使得CPU與計算機主存的交換速度要遠遠大於GPU與計算機主存的交換速度,因此GPU更適合處理SIMD(SingleInstruction
MultiData,單資料多指令)的運算,即將資料放到視訊記憶體中進行多次計算的計算任務。
目前比較流行CPU+GPU的協同計算模型,在這個模型中,CPU與CPU協同工作,各司其職。CPU負責進行邏輯性強的事物處理和序列計算,GPU則專注於執行高度執行緒化的並行處理任務。CPU、GPU各自擁有相互獨立的儲存器地址空間:主機端的記憶體和裝置端的視訊記憶體。