QAtomicInt支持四種類型的操作,Relaxed、Acquired、Release、Ordered
阿新 • • 發佈:2018-04-19
life esp 出現 mic 發現 CP div 讀寫操作 執行
- Background
很久很久很久以前,CPU忠厚老實,一條一條指令的執行我們給它的程序,規規矩矩的進行計算和內存的存取。
很久很久以前, CPU學會了Out-Of-Order,CPU有了Cache,但一切都工作的很好,就像很久很久很久以前一樣,而且工作效率得到了很大的提高。
很久以前,我們需要多個CPU一起工作,於是出現了傳說中的SMP系統,每個CPU都有獨立的Cache,都會亂序執行,會打亂內存存取順序,於是事情變得復雜了…… - Problem
由於每個CPU都有自己的Cache,內存讀寫不再一定需要真的作內存訪問,而是直接從Cache裏面操作,同時CPU可能會在合適的時候對於內存訪問進行重新排序以提高效率,在只有一個CPU的時候,這很完美。- 從Cache到內存的flush操作通常是被延遲的,所以就需要某種方法保證CPU A進行的內存寫操作真的可以被CPU B讀取到。
- CPU可能會因為某些原因(比如某兩個變量同在一個Cacheline中)而打亂
- 實際內存寫入順序
- 實際內存讀取順序
- 之前的讀寫操作已經完成
- 未來的讀寫操作還沒開始
Thread A:
while (flag == 0)
; // do nothing
printf("%d\n", data);Thread B:
這裏data代表了某種數據,它可以像這裏一樣是一個簡單的整數,也可能是某種復雜的數據結構,總之,我們在Thread B中對data進行了寫入,並利用flag變量表示data已經準備好了。
data = 523;
flag = 1;
在Thread A中,一個忙等待直到發現data已經準備好了,然後開始使用data,這裏是簡單的把data打印出來。
現在考慮如果CPU發現對於data和flag的寫入,如果按照先寫入flag後寫入data的方式進行,或者考慮由於Cache的flush操作的延遲,使得內存中變量的實際修改順序是先flag後data,那麽都將導致Thread A的結果不正確。事實上,由於內存讀入操作同樣是可能亂序進行的,Thread A甚至可能在讀入flag進行判斷之前就已經完成了對data的讀入操作,這同樣導致錯誤的結果。 - Solution
在這個例子中,我們的需求是,Thread A中對於flag判斷時,後面的任何讀入操作都沒有開始,Thread B中對於flag寫入時,任何之前的寫入操作都已經完成。
在Linux內核中,smp_rmb()、smp_wmb()、smp_mb()就是用來解決這類問題的,mb表示memory barrier。rmb表示讀操作不可跨越(註意,不是人民幣的意思:-P),也就是我們這個例子中的Thread A所需要的。wmb表示寫操作不可跨越,也就是這裏Thread B所需要的。mb集合了rmb和wmb的能力,讀寫操作都不可跨越。
在Qt中,其支持原子操作的類QAtomicInt支持四種類型的操作,Relaxed、Acquired、Release、Ordered,其中 Relaxed最為簡單,就是不做特殊要求,由編譯器和處理器對讀寫進行合適的排序。Acquired表示原子操作之後的內存操作不可被重排至原子操作之前。Release表示原子操作之前的內存操作不可被重排至原子操作之後。Ordered表示Acquired + Release。在前面的例子中,Thread A對於flag的讀取操作需要Acquired版本,而Thread B對於flag的寫入操作需要Release版本。
在實際實現中,不同體系結構的實現方法各不相同,很多RISC機器提供了專門的指令用於實現mb,而在x86上面,通常使用lock指令前綴加上一個空操作來實現,註意當然不能真的是nop指令,但是可以用來實現空操作的指令其實是很多的,比如Linux中采用的addl $0, 0(%esp)。Qt的不同類型原子操作由於本身就需要進行某種可被lock前綴修飾的操作,所以就不需要畫蛇添足的再寫一條空操作了,比如 testAndSetOrdered就可以直接使用lock cmpxchgl實現。
轉貼自:http://etrnlog.appspot.com/2009/10/12/memory-ordering.html
http://www.cnblogs.com/codingmylife/archive/2010/04/28/1722573.html
QAtomicInt支持四種類型的操作,Relaxed、Acquired、Release、Ordered