【硬體基礎知識】 微架構
微架構(英語:microarchitecture),也被叫做計算機組織,微架構使得指令集架構(ISA)可以在處理器上被執行。指令集架構可以在不同的微架構上執行。計算機結構是一門探討微架構與指令集兩者互動的一門學問。
和指令集架構的關係
指令集架構是指在處理器內被處理的程式,指令集架構為組合語言的設計師和編譯器所見。指令集架構包含execution model,暫存器,地址以及資料格式。微架構包含處理器內部的構成以及這些構成起來的部分如何執行指令集架構。微架構通常被表示成流程圖,以描述機器內部元件的連結狀況,從一個閘或是暫存器,到算術邏輯單元(ALU)。圖上分佈著資料路徑(可以顯示資料在微架構的位置)以及
每個微架構的的元件都被表示成藉數個邏輯閘所建構而成的工具。每個邏輯閘都被表示成藉電晶體建構成的零件。擁有不同微架構的機器可能擁有相同的指令集架構,因此可以執行相同的程式。由於半導體科技的進步,新型的處理器可以以較快的速度執行相同的指令集架構。
微架構的概念
Intel 80286微架構現時,流水線資料路徑是微架構中最常被使用的資料路徑。這種作法也被普遍的用於微處理器,微控制器,以及數字訊號處理器。流水線的結構允許多個指令在同一時間執行,不同的指令在微架構不同的位置執行。流水線分有好幾個不同的階段(stage),這些階段是微架構的基礎。這些階段包含取指令,譯碼,執行指令,以及將資料寫回。一些結構還包含其他階段,像是對儲存器做訪問的動作。流水線是微架構其中一項主要的工作。執行單元也是微架構的基本元件。執行單元包含
指令週期
主條目:指令週期所有的中央處理器,微處理器藉由以下的步驟來執行程式:
- 讀取指令並將其譯碼
- 找到需要用到的資料以執行指令
- 執行指令
- 將結果寫回
指令週期將會不斷迴圈,直到電力用盡。
執行速度
上面的步驟看起來簡單,但層次結構儲存器使這些步驟變得複雜,層次結構儲存器包含快取,主存,以及非易失性的儲存器,例如硬碟(這是指令和資料儲存的地方),總是比處理器處理資料的速度慢。步驟(2)常常導致lengthy(在CPU內)delay,這種延遲是在資料通過
指令集的選擇
指令集從過去以來不斷的變化,從一開始的簡單到後來的複雜。最近,load-store結構,VLIW以及EPIC是最普遍的指令集。結構處理data parallelism的方法包括SIMD以及向量。一些指令集,例如CISC;多早期的裝置使用"CISC"。
然而,對指令集架構的選擇可能會對實現高效能的機器產生大的影響。發展RISC處理器是一個好的策略,可以將指令給簡化。這樣的指令容易在流水線內被擷取,解碼與執行,由於指令頻繁的被使用,快取便被頻繁的使用,這樣就使儲存器訪問的時間降低。
流水線(pipeline)
主條目:指令流水線化在目前,能夠最有效的提升效能的方法就是流水線。早期的處理器是等一個指令執行完所有步驟後,然後才輪到下一個指令執行。大部分的電路在某一個步驟結束後就處在閒置的狀態,例如,對指令進行解碼的電路在指令進入執行階段後就處於閒置狀態。
流水線化的電路藉由允許多個指令在同一時間,在電路上不同的位置進行不同的工作。例如,處理器可以在最後一個指令等待結果寫回時對另一個指令解碼。這使得處理器在同一時間可以處理四個指令,使處理器的效能增加了四倍。
RISC藉由將每個階段分割清楚並讓每個階段都花費一樣的時間執行來讓流水線變小和變得容易建構—每個階段花費1個cycle的時間。處理器使用了有如工廠流水線的設計,當指令由一邊進來的同時就有另一個指令從另一邊出去。由於RISC流水線是降低複雜度的設計,使得流水線核心跟指令快取可以被裝置在同一個晶片內,這是精簡指令集較為快速的原因。早期的裝置,例如SPARC和MIPS比Intel和Motorola的CISC還快10倍。
與指令集架構的關係
指令集架構大致上和處理器的程式設計模型(programming model)一樣。指令集架構包括執行模型(execution model),暫存器(Processor register),地址和資料格式等。微架構包括處理器的組成部分和對指令集架構的連線和操作。一個系統的微架構通常以描述不同微架構組成部分如何互相連線的平面圖代表,而這些微架構組成部分可以是簡單的邏輯閘(Logic gates),電阻,或是算術邏輯單元(Arithmetic logic unit ,ALU)等大型元件。這些平面圖通常把資料路徑(Data path)和控制路徑(control path)分開。每個組成部分會以示意圖表達他們和執行他們的邏輯閘之間的連繫。
幾種典型的微架構
Intel
- P5
- P6
- NetBurst
- Core
- Nehalem/Westmere
- Sandy Bridge/Ivy Bridge
- Haswell/Broadwell
- Skylake
- Kaby Lake
- Coffee Lake
- Comet Lake
- Ice Lake
AMD
主條目:AMD CPU微架構列表- K5- AMD的首個原創微架構。K5基於Am29000的微架構,並且添加了一個x86的解碼器。即使這個設計的原理和Pentium Pro相同,而實際效能更像是Pentium。
- K6- K6並非基於K5,而是基於當時已經被AMD所收購了的NexGen所設計的Nx686處理器,K6的針腳相容Intel Pentium。
- K7- 是AMD Athlon和Athlon XP的微架構。
- K8微架構 - 全球首款x86-64處理器,集成了儲存器控制器(Integrated Memory Controller),採用HyperTransport技術,增加了SSE指令集。後期的K8增加了SSE3。K8在2003年4月22日上市。HyperTransport取代了傳統的前端匯流排,讓CPU直接和記憶體連結。
- K9 - 被取消。
- K10微架構 - 代號為Barcelona ,是AMD系列的第十代微架構,最多內建四個核心,共享Level 3 Cache第三級快取,128位浮點單元,支援AMD-V Nested Paging Virtualization和HyperTransport 3.0。
- Bulldozer- 是繼K10之後,使用AMD M-SPACE模組化設計方法(modular design methodology)的微架構。Bulldozer是為功耗在10W至100W類別的處理器而設計,應用了XOP,FMA和CVT16指令集,並且部分產品集成了GPU核心(AMD APU)。
參考文獻
- 《計算機科學技術百科全書》(第二版). 作者:張效祥. 出版社:清華大學出版社,2005年. ISBN:7302105944, 9787302105947