1. 程式人生 > >三種Cache寫入方式原理簡介

三種Cache寫入方式原理簡介

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow

也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!

               

三種Cache寫入方式原理簡介

   在386以上檔次的微機中,為了提高系統效率,普遍採用Cache(高速緩衝儲存器),現在的系統甚至可以擁有多級Cache。Cache實際上是位於CPU與DRAM主儲存器之間少量超高速的靜態儲存器(SRAM),通常的大小為8KB~512KB。

    對Cache的工作原理可以進行如下描述:具有Cache的計算機,當CPU需要進行儲存器存取時,首先檢查所需資料是否在Cache中。如果存在,則可以直接存取其中的資料而不必插入任何等待狀態,這是最佳情況,稱為高速命中。當CPU所需資訊不在Cache中時,則需切換存取主儲器,由於速度較慢,需 要插入等待,這種情況稱高速未命中。在CPU存取主儲存器的時候,按照最優化原則將儲存資訊同時寫入到Cache中以保證下次可能的高速命中。因此,同一資料可能同時儲存在主儲存器和Cache中;同樣,按照優化演算法,可以淘汰Cache中的一些不常使用的資料。

  所以,提高高速命中率的最好方法是儘量使Cache存放CPU最近一直在使用的指令與資料,當 Cache 裝滿後,可將相對長期不用的資料刪除,提高 Cache的使用效率。為保持 Cache 中資料與主儲存器中資料的一致性,避免CPU在讀寫過程中,將Cache中的新資料遺失,造成錯誤的讀資料,確保Cache 中更新過程的資料不會因覆蓋而消失,必須將 Cache 中的資料更新及時準確地反映到主儲存器中,這是一個寫入過程,通常採用的處理方法有:直寫式、緩衝直寫式與回寫式三種。

   1.直寫式系統: CPU對Cache寫入時,將資料同時寫入到主儲存器中,這樣可保證Cache中的內容與主儲存器的內容完全一致。這種方式比較直觀,而且簡單、可靠,但由於每次對Cache更新時都要對主儲存器進行寫操作,而這必須通過系統匯流排來完成,因此匯流排工作頻繁,系統執行速度就會受到影響。

   2.緩衝直寫式系統:為解決直寫式系統對匯流排速度的影響問題,在主儲存器的資料寫入時增加緩衝器區。當要寫入主儲存器的資料被緩衝器鎖存後,CPU 便可執行下一個週期的操作,不必等待資料寫入主儲存器 。 這相對於給主儲存器增加了一個單向單次快取記憶體。比如,在寫入週期之後可以緊接著一個數據已存在於Cache中的讀取週期,這樣就可避免直寫式系統造成的 操作延時。但這個緩衝器只能儲存一次寫入的資料,當連續兩次寫操作發生時,CPU仍需等待。

  3.回寫式系統:以前的兩種寫入方式系統,都是在 寫Cache的同時,對主儲存器進行寫操作。實際上這不僅是對匯流排頻寬的佔用,浪費了寶貴的執行時間,而且對於有的情況是不必要的,可以通過增加額外的標準來判斷是否有必要更新資料。回寫式系統就是通過在Cache中的每一資料塊的標誌欄位中加入一更新位,解決主儲存器不必要的寫操作。比如,若Cache 中的資料曾被CPU更新過但還未同時更新主儲存器,則該更新位被置1。每次CPU將一塊新內容寫入Cache時,首先,檢查Cache中該資料塊的更新 位,若更新位為0,則將資料直接寫入Cache;反之,若更新位為1,則先將 Cache 中的該項內容寫入到主儲存器中相應的位置,再將新資料寫回到Cache中。

   與直寫式系統相比,回寫式系統可省下一些不必要的立即回寫操作,而在許多情況下這是很頻繁出現的。即使一個Cache被更新,若未被新的資料所取代,則 沒有必要立刻進行主儲存器的寫操作。也就是說,實際寫入主儲存器的次數,可能少於CPU實際所執行的寫入週期的次數,但回寫式系統的結構較複雜, Cache也必須用額外的容量用來儲存標誌。

  由於回寫系統的高效率,現代的Cache大多采取這種方式進行操作。


 

由上面的介紹可以看出,寫透(上述直寫式)和寫回(上述回寫式)有著截然不同的操作,在不同的場合,不同的記憶體塊使用不同的回寫策略(如果你的系統可以實現的話)要比使用一種策略要高效得多。具體一點,對於反覆存取的記憶體塊置成寫回,而把一次寫入而很長時間以後再使用的記憶體置為寫透,可以大大提高 cache的效率。


第一點很容易理解,第二點就需要琢磨一下了,由於寫透的操作是,當快取有該地址的資料時同時更新快取和主存,當快取沒有該地址資料直接寫主存,忽略快取。當該地址的資料很長時間後才被使用到,那麼在使用的時候該資料肯定不在cache中(被替換了),所以不如直接寫入主存來得直接;

相反,如果使用寫回操作,當cache中有該地址資料,需要更新該資料,設定dirty位,很長時間後再使用該資料或被替換的時候才將其刷進主存,這有佔了茅坑不拉屎的嫌疑;而當cache沒有該地址資料時,情況更糟糕,首先需要將相應的主存資料(一個cache line)匯入cache,再更新資料,設定dirty位,再等待被刷回記憶體,這種情況不僅佔用了cache的空間,還多一次從主存中匯入資料的過程,同樣佔據匯流排,開銷很大。至於為什麼要先從主存中匯入資料,是因為cache往主存回寫資料時是按照一個cache line 單位來寫的,但被更新的資料可能沒有一個cache line這麼多,所以為了保證資料一致性,必須先把資料匯入cache,更新後再刷回來。

對於很多視訊解碼來說,幀寫入過程是一個一次性的動作,只有在下一次作為參考幀時才會被使用到,所以幀緩衝記憶體可以設定為寫透操作,而下一次使用它的時候很可能是作為參考幀來使用,而作為參考幀不需要反覆的存取,只需一次讀操作就可以了,所以效率並不會因為不經過cache而降低。實驗證明該方法可以使mpeg4 sp解碼提高20-30%的效率。

 

 

相似的內容cache操作的小技巧還有prefetch操作,prefetch操作是將主存的資料匯入cache而期間cpu不需要等待,繼續下一 條指令的執行,如果下一條指令也是匯流排的操作,那麼就必須等待prefetch完成以後再開始。所以,在使用該指令時,在prefetch指令後面插入盡 可能大於一次快取不命中所需要的clock數對應的指令,那麼prefetch與其後面的指令可以並行執行,從而省去了等待的過程,相當於抵消快取不命中 的損失。當然,如果插入的指令太多而cache太小,有可能prefetch的資料進入cache後又被替換掉了,所以,這需要自己去評估。

 


           

給我老師的人工智慧教程打call!http://blog.csdn.net/jiangjunshow

這裡寫圖片描述