1. 程式人生 > >記憶體時序

記憶體時序

最近在AMD平臺超記憶體,順便學習下記憶體知識,以下內容轉自:

在此感謝原貼作者們普及知識以及傳授經驗!

記憶體超頻軟體推薦:

Thaiphoon Burner (記憶體檢視器)

MemTest Pro(記憶體壓力測試工具,一般跑200%無報錯即視為穩定)

基本術語:

所謂時序,就是記憶體的時鐘週期數值,脈衝訊號經過上升再下降,到下一次上升之前叫做一個時鐘週期,隨著記憶體頻率提升,這個週期會變短。例如CL9的意思就是CL這個操作的時間是9個時鐘週期。

工作頻率:是記憶體顆粒實際的工作頻率,但是由於DDR記憶體可以在脈衝的上升和下降沿都傳輸資料,因此傳輸資料的等效頻率是工作頻率的兩倍;所以 工作頻率*2=等效頻率

Cell:顆粒中的一個數據儲存單元叫做一個Cell,由一個電容和一個N溝道MOSFET組成。

Bank:8bit的記憶體顆粒,一個顆粒叫做一個bank,4bit的顆粒,正反兩個顆粒合起來叫做一個bank。一根記憶體是64bit,如果是單面就是8個8bit顆粒,如果是雙面,那就是16個4bit的顆粒分別在兩面,不算ECC顆粒。

Rank:記憶體PCB的一面所有顆粒叫做一個rank,目前在Unbuffered桌上型電腦記憶體上,通常一面是8個顆粒,所以單面記憶體就是1個rank,8個bank,雙面記憶體就是2個rank,8個bank。Bank與rank的定義是SPD資訊的一部分,在AIDA64中SPD一欄可以看到。

DIMM:指一條可傳輸64bit資料的記憶體PCB,也就是記憶體顆粒的載體,算上ECC晶片,一條DIMM PCB最多可以容納18個晶片。

第一時序:CL-tRCD-tRP-tRAS-CR,就是我們常說的5個主要時序,前四個引數CL-tRCD-tRP-tRAS與記憶體包裝上的程式碼從左至右一一對應。

CAS Latency(CL):CAS即Column Address Strobe,列地址訊號,它定義了在讀取命令發出後到資料讀出到IO介面的間隔時間。由於CAS在幾乎所有的記憶體讀取操作中都會生效(除非是讀取到同一行地址中連續的資料,4bit顆粒直接讀取間隔3個地址,8bit顆粒直接讀取間隔7個地址,這時候CAS不生效),因此它是對記憶體讀取效能影響最強的

。如下圖,藍色的Read表示讀取命令,綠色的方塊表示資料讀出IO,中間間隔的時間就是CL。

image022.png

已知CL時鐘週期值CAS,我們可以使用以下公式來計算實際延遲時間tCAS:tCAS(ns)=(CAS*2000)/記憶體等效頻率

DRAM RAS to CAS Delay(tRCD):RAS的含義與CAS類似,就是行(Row)地址訊號。它定義的是在記憶體的一個rank(記憶體的一面)之中,行地址啟用(Active)命令發出之後,記憶體對行地址的操作所需要的時間。每一個記憶體cell就是一個可儲存資料的地址,每個地址都有對應的行號和列號,每一行包含1024個列地址,當某一行地址被啟用後,多個CAS請求會被髮送以進行讀寫操作。簡單的說,已知行地址位置,在這一行中找到相應的列地址,就可以完成定址,進行讀寫操作,從已知行地址到找到列地址過去的時間就是tRCD。當記憶體中某一行地址被啟用時,我們稱它為“open page”。在同一時刻,同一個rank可以開啟8個行地址(8個bank,也就是8個顆粒各一個)。下圖顯示一個行地址啟用命令發出,到尋找列地址併發出讀取指令,中間間隔的時間就是tRCD。tRCD值由於是最關鍵的定址時間,它對記憶體最大頻率影響最大,一般想要上高頻,在加電壓和放寬CL值不奏效的時候,我們都要放寬這個延遲

image024.png

DRAM RAS Precharge Time(tRP):RAS預充電時間。它定義的是前一個行地址操作完成並在行地址關閉(page close)命令發出之後,準備對同一個bank中下一個行地址進行操作,tRP就是下一個行地址啟用訊號發出前對其進行的預充電時間。由於在行地址關閉命令發出之前,一個rank中的多個行地址可能正在被讀寫,tRP對記憶體效能影響不如CL和tRCD。雖然tRP的影響會隨著多個行地址啟用與關閉訊號頻繁操作一個bank而加大,但是它的影響會被bank interleaving(bank交叉操作)和command scheduling(命令調配)所削弱。交叉讀寫會交替使用不同的bank進行讀寫,減少對一個bank的操作頻率;命令調配則是由CPU多執行緒訪問不同的記憶體地址,同樣是減少對一個bank的頻繁操作次數。例如SNB CPU的記憶體控制器可以對讀寫操作命令進行有效地重新分配,以使得行地址啟用命中率最大化(如果重複啟用一個已經處於啟用狀態的行地址,那就是RAS啟用命令未命中),所以tRP在SNB平臺對效能的影響不大,並且放寬它有可能可以幫助提升穩定性。下圖顯示的是一個即將被啟用的行地址開始預充電,到它被啟用間隔的時間,就是tRP。

image026.png

DRAM RAS Active Time(tRAS):行地址啟用的時間。它其實就是從一個行地址預充電之後,從啟用到定址再到讀取完成所經過的整個時間,也就是tRCD+tCL的意思。這個操作並不會頻繁發生,只有在空閒的記憶體新建資料的時候才會使用它。太緊的tRAS值,有可能會導致資料丟失或不完整,太寬的值則會影響記憶體效能,尤其是在記憶體使用量增加的時候。所以一般為了穩定性,我們設定tRAS≥tRTP+tRCD+CL即可(tRTP不是tRP,將在第二時序中介紹),尤其是PCB不好或者跑高頻的時候,多幾個週期比較穩妥

DRAM Command Mode(Command Rate,CR):首命令延遲,也就是我們平時說的1T/2T模式。是指從選定bank之後到可以發出行地址啟用命令所經過的時間。CR可能對效能的影響有比較大的變數:如果CPU所需要的資料都在記憶體的一個行地址上,就不需要進行重複多次的bank選擇,CR的影響就很小;但是如果一個rank中同時多個bank要啟用行地址,或者不同的rank中不同bank需要同時啟用的時候,CR對效能的影響就會提升。但是隨著記憶體頻率的提升,CR=1T/2T的時間差越短,它的影響就會越來越小,這就是我們看到DDR1的時候1T/2T對效能影響挺大,但是到了DDR3影響就很小的其中一個原因。但是為了效能最大化,我們儘量把CR設為1T,但是如果bank數很多的時候,例如插滿四條記憶體,就有32個bank,bank選擇隨機性增大,1T的首命令時間可能會不穩定

所以,記憶體的基本讀取操作的時序角度流程就是把上面那三張圖合起來:預充電-啟用行地址並尋找列地址-傳送讀取命令-讀出資料,這四步操作中間的三個延遲就分別是tRP、tRCD和CL。和我們常說的時序順序剛好是反過來的。

第二時序

DRAM CAS Write Latency(tWCL):列地址寫入延遲,也就是DRAM的最小寫入操作時間,與CL剛好是讀寫對應關係,一般跟CL值設為同一個值就是可以穩定的。由於記憶體讀取之前必須先寫入,所以這個值可以說與CL一樣重要。但是在BIOS裡一般沒得設定,可能是與CL綁定了。

DRAM Row Cycle Time(tRC):行週期時間。定義了同一bank兩次行啟用命令所間隔的最小時間,或者說是一個bank中完成一次行操作週期(Row Cycle)的時間,即tRP+tRAS(預充電加上啟用的整個過程),tRC設得太緊可能會直接點開不了機,一般只要能進系統再多加一兩個週期都是可以穩定的。下圖顯示的就是tRC的時間。

image028.png

DRAM Row Refresh Cycle Time(tRFC):行地址重新整理週期,定義了一個bank中行地址重新整理所需要的時間。重提一下重新整理的含義,由於cell中電容的電荷在MOSFET關閉之後一段時間就會失去,為了維持資料,每隔很短一段時間就需要重新充電。這裡多提一句,Intel平臺和AMD平臺對tRFC的含義不一樣,AMD平臺的tRFC是DRAM重新整理延遲時間,單位是ns,通常有90/110/160/300幾個值可以調整,也就是說它的tRFC時鐘週期會隨著頻率的提升而提升;而Intel平臺的單位則直接是時鐘週期,相反地延遲時間會隨著頻率的提升而降低。容量大的bank行地址和cell會更多,重新整理時間也更長,因此tRFC也要更高。另外,tRFC如果太快會導致資料出錯,太慢則影響效能,但可以增加穩定性

DRAM Refresh Interval(tREFI):記憶體重新整理時間間隔,也就是記憶體的重新整理命令生效前要經過的時間。重新整理的時間間隔一般取決於記憶體顆粒的容量(density),容量越大,就越需要頻繁重新整理,tREFI值就要越低。另外tREFI的時間也會受到記憶體工作溫度與記憶體電壓(Vdimm)影響,因為溫度越高電容漏電越快。一般在AMD主機板的BIOS裡,這個值只有3.9us和7.8us可選,而在SNB平臺,則是按時鐘週期算,例如DDR3-1333下預設值為5199T,換算過來就是2000/1333x5199=7800ns,也就是7.8us。一般DRAM顆粒的spec中都是規定工作溫度大於85度時採用3.9us。

DRAM RAS to RAS Delay(tRRD):行地址間延遲,定義的是同一rank不同bank間兩個連續啟用命令的最短延遲,在DDR3時代一般最小是4T。它的作用和CR有點像,不過比CR更多的時候對效能有較大的影響,所以這個時序可儘量縮小。

DRAM Write Recovery Time(tWR):記憶體寫入恢復時間,它定義了記憶體從寫入命令發出(從開始寫入算起)到下一次預充電間隔的時間,也就是tRP的前一個操作。如果這個時間設得太短,可能會導致前一次寫入未完成就開始下一次預充電,進行定址,那麼前一次寫入的資料就會不完整,造成丟資料的情況。這個週期也是第二時序中比較長的,DDR3-2000一般需要10-14個週期,甚至更高。

DRAM Read to Precharge Time(tRTP):與tWR類似,定義了同一rank上記憶體從讀取命令發出到tRP之前的間隔時間,但是它在讀取完成並且行地址關閉之後才會生效。單顆128MB的記憶體顆粒可以在DDR3-2000下執行在4到6個時鐘週期,如果bank容量增大時,這個時序有可能要放寬。

DRAM Four Active Window(tFAW):它定義了同一rank中允許同時傳送大於四個行啟用命令的間隔時間,因此最小值應該不小於tRRD的四倍。在DDR3上,tRRD的最小值是4T,因此tFAW的最小值就是16T。這個tFAW由於是在一個rank中大於四個bank同時啟用之後才生效,因此在記憶體不是很繁忙的時候,它對效能的影響並不是很大。但是對一些頻繁讀寫記憶體的操作(例如SuperPI 32M),tFAW對效能的影響可能會加大。由於現在記憶體用滿的機率非常非常小,兩根雙面的記憶體更是有4個rank,配合上interleaving,一個rank中同時啟用大於四個bank的機率應該不大,所以通常我們把它設為tRRD的四倍應該就不會出問題

DRAM Write to Read Delay(tWTR):記憶體寫-讀延遲,它定義的是記憶體寫入命令發出後到下一個讀取命令之間的時間間隔,最小為4T,與tRTP類似,提升記憶體的頻率或者容量提升時,這個值需要提高。

第三時序

第三時序中對效能影響最大的是tRDRD和tWRWR。當記憶體頻率小於2133MHz時,第三時序對效能的影響非常小。當記憶體頻率超過2400MHz之後,tRDRD和tWRWR對記憶體頻寬的影響非常大,這兩個引數的最小值為4個週期,每加1個週期,記憶體讀寫效能就會出現較大幅度的下降,每放大一個週期記憶體頻寬大約下降10%~15%。記憶體頻率達到2800MHz之後這兩個小參往往要放大到6個週期,效能上會有較大的損失,因此犧牲tRDRD和tWRWR換取超高頻的做法是不可取的。其餘第三時許的各個小參對效能影響不大,一般全部設定為Auto即可。

記憶體顆粒知識入門

DDR4以來,顆粒主流就三家,鎂光、海力士、三星,爾必達之流估計連市場份額的5%都沒有。 老顆粒(疲軟) 三星(d-die): K4A4G045WD、K4A4G085WD 單顆粒容量512MB 海力士(MFR): H5AN8G8NMFR(1GB) H5AN4G8NMFR(512MB) 鎂光: MT40A1G8PM-083E x8 1GB MT40A2G4PM-083E x4 1GB MT40A512M16HA-083E x16 1GB

新顆粒(敏感) 三星(B-die) 2133MHz 2400MHz  K4A8G045WB-BCPB K4A8G045WB-BCRC單顆容量2GB K4A8G085WB-BCPB K4A8G085WB-BCRC單顆容量1GB

注: 三星記憶體顆粒的編號規律,第二位的4 代表是 DRAM 產品, A 代表 DDR4,8G08 代表容量是 8Gb (1Gbx 8) 顆粒 ,W 後面的B 代表 Revision版本號,所以大家把這個顆粒稱為“B-Die” 顆粒。字尾BCPB 中的 B 代表 78 FBGA顆粒,PB 代表其速度為 0.938ns 即 DDR4-2133,電壓為1.2V,規格為 CL15-15-15。

海力士(AFR,特別關注,價效比目前較高的顆粒) H5AN8G6NAFR(1GB)、H5AN8G8NAFR(1GB)、 H5AN4G8NAFR(512MB)、H5AN4G6NAFR(512MB)