偽共享 FalseSharing (CacheLine，MESI) 淺析以及解決方案

阿新 • • 發佈：2019-12-07

起因

在閱讀百度的發號器 uid-generator 原始碼的過程中，發現了一段很奇怪的程式碼：

/**
 * Represents a padded {@link AtomicLong} to prevent the FalseSharing problem<p>
 * 
 * The CPU cache line commonly be 64 bytes, here is a sample of cache line after padding:<br>
 * 64 bytes = 8 bytes (object reference) + 6 * 8 bytes (padded long) + 8 bytes (a long value)
 * 
 * @author yutianbao
 */
public class PaddedAtomicLong extends AtomicLong {
    private static final long serialVersionUID = -3415778863941386253L;

    /** Padded 6 long (48 bytes) */
    public volatile long p1, p2, p3, p4, p5, p6 = 7L;

    /**
     * Constructors from {@link AtomicLong}
     */
    public PaddedAtomicLong() {
        super();
    }

    public PaddedAtomicLong(long initialValue) {
        super(initialValue);
    }

}

這裡面有6個看上去毫無作用的volatile long變數（標紅）。如果這是我自己寫的程式碼，我肯定會認為是我自己手抖寫多了。

但是作為百度的發號器，開源了這麼久，如果是手抖早被fix了。肯定還是有深意的。於是閱讀了一些類註釋，看到了這句話：

to prevent the FalseSharing problem

果然，這幾個變數不是毫無作用的，是為了解決FalseSharing問題。

但是轉念一想，我好像不知道什麼是FalseSharing？解決了一個問題，又陷入了另一個更大的問題。

於是就上網查了很多資料，閱讀了很多部落格，算是對FalseSharing有了一個初步的瞭解。在這裡寫出來也為了希望能幫到有同樣困惑的人。

背景知識

要說清楚FalseSharing，不是一兩句話能做到的事，有一些必須瞭解的背景知識需要補充一下。

計算機儲存架構

上圖展示的是不同層級的硬體和cpu之間的互動延遲。越靠近CPU，速度越快。

計算機執行時，CPU是執行指令的地方，而指令會需要一些資料的讀寫。程式的執行時資料都是存放在主存的，而主存又特別慢（相對），所以為了解決CPU和主存之間的速度差異，現代計算機都引入了快取記憶體（L1L2L3）。

現代計算機對快取/記憶體的設計一般如下：

L1和L2由CPU的每個核心獨享，而L3則被整個CPU裡所有核心共享（僅指單CPU架構）。

CPU訪問資料時，按照先去L1，查不到去L2，再L3->主存的順序來查詢。

Cache Line

在上述CPU和快取的資料交換過程中，並不是以位元組為單位的。而是每次都會以Cache Line為單位來進行存取。

Cache Line其實就是一段固定大小的記憶體空間，一般為64位元組。

MESI

這個東西研究過 volatile的同學可能會比較熟悉，這個就是各個告訴快取之間的一個一致性協議。

因為L1 L2是每個核心自己使用，而不同核心又可能涉及共享變數問題，所以各個快取記憶體間勢必會有一致性的問題。MESI就是解決這些問題的一種方式。

MESI大致原理如下圖：

我這裡就摘抄一下網上搜到的解釋：

在MESI協議中，每個Cache line有4個狀態，可用2個bit表示，它們分別是：
M(Modified)：這行資料有效，資料被修改了，和記憶體中的資料不一致，資料只存在於本Cache中；
E(Exclusive)：這行資料有效，資料和記憶體中的資料一致，資料只存在於本Cache中；
S(Shared)：這行資料有效，資料和記憶體中的資料一致，資料存在於很多Cache中；
I(Invalid)：這行資料無效。

通俗一點說，就是如果Core0和Core1都在使用一個共享變數變數A，則0，1都會在自己的Cache裡有一份A的副本，分佈在不同的CacheLine。

如果大家都沒有修改A，則Core0和Core1裡變數A所在的Cache Line的狀態都是S。

如果Core0修改了A的值，則此時Core0的Cache Line變為M，Core1 的Cache Line變為I。

這樣CPU就可以通過CacheLine的狀態，來決定是刪除快取，還是直接讀取什麼的。

偽共享

背景知識介紹完畢了，這樣再說偽共享就不會顯得太難以理解了。

先說一個場景：

你的程式碼裡需要使用一個volatile的Bool變數，當做多執行緒行為的一個開關：

static volatile boolean flag = true;

    public static void main(String[] args) {
        for (int i = 0; i < 10; i++) {
            new Thread(() -> {
                Integer count = 0;
                while (flag) {
                    ++count;
                    System.out.println(Thread.currentThread().getName() + ":" + count);
                    try {
                        Thread.sleep(100);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
            }).start();
        }

        new Thread(() -> {
            try {
                Thread.sleep(1000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            flag = false;

        }).start();
    }

這段程式碼會宣告一個flag為true，然後有10個工作執行緒會在flag為true時沒100ms對count做個自增操作，然後輸出。當flag為false時，就會結束執行緒。

還有一個執行緒A，會在1000ms後將flag置為false。

這裡就是volatile的一個經典用法，可以保證多個執行緒對flag的可見性，不會因為執行緒A修改了flag的值，但是工作執行緒讀取到的不是最新值而額外執行一些工作。

這段程式碼看起來是沒有任何問題的，實際上跑起來也沒有問題。

但是結合之前的背景知識，考慮一下flag所在的cache line，肯定還會有其他的變數（cache line 64位元組，bool無法完整填充一個CacheLine）。

如果flag所在的CacheLine裡還有一個頻繁修改的共享變數，這時會發生什麼？

很簡單，就是flag所在的CacheLine被頻繁置為不可用，需要清除快取重新讀取。flag在工作狀態並沒有被修改，但是仍然會被其他頻繁修改的共享變數所影響。

這樣就會帶來一個問題，即使flag並沒有被修改，但我們的工作執行緒很多時間都等於是在主存中讀取flag的值，這樣在高併發時會帶來很大的效率問題。

以上就是所謂的 “FalseSharing” 問題。

解決辦法

FalseSharing對於普通業務應用，基本沒什麼實際影響。但是對於很多超高併發的中介軟體（例如發號器），可能就會帶來一定的效能瓶頸。所以這類專案都是需要關注這個問題的。

出現原因已經說清楚了，那麼該如何解決呢？

其實答案就在文章的開頭，那6個看上去沒有任何含義的volatile long變數，就是用來解決這個問題的。

The CPU cache line commonly be 64 bytes, here is a sample of cache line after padding:64 bytes = 8 bytes (object reference) + 6 * 8 bytes (padded long) + 8 bytes (a long value)

這行註釋就說明了這6個變數是如何解決FalseSharing問題的：

CacheLine一般是64位元組，64 = 8（物件本身的屬性資訊）+ 6*8（long佔用8個位元組） + 8 （AtomicLong本身帶有一個long）。

寫了這6個看著無效的變數後，PaddedAtomicLong就會佔用64個位元組，正好填滿一個CacheLine，這樣就會被獨自分配到一個CacheLine，這樣就不存在FalseSharing問題了。

需要注意的是本來AtomicLong僅佔用不到20位元組，但是為了解決FalseSharing做了填充之後就佔用64位元組了，這樣就會導致空間會膨脹很多。所以即使用的時候也要做好取捨。

偽共享 FalseSharing (CacheLine，MESI) 淺析以及解決方案

起因在閱讀百度的發號器 uid-generator 原始碼的過程中，發現了一段很奇怪的程式碼： /** * Represents a padded {@link AtomicLong} to prevent the FalseSharing problem<p>

內存溢出和內存泄漏的區別，產生原因以及解決方案

解決方案集合類釋放內存分頁需求查看內存取出程序 tof 一、概念與區別內存溢出 out of memory，是指程序在申請內存時，沒有足夠的內存空間供其使用，出現out of memory；比如申請了一個integer,但給它存了long才能存下的數，那就

Spring boot中引數注入，@Value失效以及解決方案

問題專案中我們都要要儘量避免將引數直接寫程序序裡，這樣一旦需要需要修改配置，我們可以只需要在配置檔案裡做修改，而不必在程式裡找，這樣可以避免很多錯誤，個人專案可能不會注意這一點，但是需要上線釋出的專案，Configure配置檔案就顯得非常重要！現在很多公司其

分散式鎖，分散式事務以及解決方案瞭解一下

一、分散式鎖 1、什麼是分散式鎖？場景1：常規的我們多執行緒訪問同一程式碼塊的時候，為了保證同一時間只能由一個執行緒訪問，保證資料安全一致性，通常我們使用synchronized關鍵字來對方法加鎖，以達到保證資料安全性。場景2：現在越來越多的專案，為了追求效能與高

史上最大CPU缺陷Meltdown融毀和Spectre幽靈來襲，各網絡設備廠家反饋以及解決方案匯總

dir ase agg 部分 arm 暴露 ace ado shadow 2018新年快樂新年好，轉眼就到了2018。首先祝福大家新年快樂，萬事如意！熱鬧的一月就在大家剛享受完短暫的元旦假期，1月3號互聯網上就爆出了一個非常勁爆的消息，Intel，AMD，ARM的CP

記一筆vue中的中央事件總線的問題，以及解決方案

ole work 手動 lag debug 事件總線 lse 沒有導致代碼結構：首先HeaderNav組件是被單獨拎出來的，router-view中就對應了內容組件，由於有時候i有的界面的header內容是不一樣的，因此要用到兄弟組件的相互通信，這個時候我首先選擇了bu

部署hadoop叢集ha模式常見的問題，以及解決方案

1. 叢集中的某個datanode無法啟動。原因：可能是該節點的clusterId和master上的不一樣了，修改clusterId和master一樣的就行了。如下：在core-site.xml中找到配置的hadoop

關於ORA-04091異常的出現原因，以及解決方案

1、異常出現的場景. 在使用Hibernate做為專案持久層的情況下，需要對某一張表進行一個擴充套件，擴充套件操作便是在該表上建立一個觸發器。將表中的資料讀入到其他表中。 SQL語句如下： drop table tr_table; create table tr_tabl

關於電腦連線藍芽耳機出現的一些問題，以及解決方案

首先，會有找不到對應的藍芽耳機裝置，這時，就說明，你的藍芽驅動不行，證明方法，網上有很多，自己查，重點是你需要重新下載藍芽驅動，重點來了 “關掉無線”---“關掉無線”---“關掉無線”，一定要關掉，否則，即使你的本來能用的，也一定用不了，等你下

哲學家就餐與死鎖問題，死鎖產生的條件以及解決方案

請結合經典案例－哲學家就餐，來談談你對死鎖的理解，以及怎麼預防和解除死鎖？哲學家就餐描述：在一張圓桌上，有n個哲學家，n支筷子，他們的生活方式只是交替地進行思考和進餐，飢餓時便試圖取其左、右最靠近他的筷子，只有在他拿到兩支筷子時才能進餐，進餐完畢，放下筷子又繼續思考

Fragment重影（重疊）白屏等問題原理解析，以及解決方案

前言絕大部分的app首頁架構均為Tab + Fragment,當程式發生異常自動恢復，或者app長時間處於後臺恢復後，Fragment出現重影(重疊)等問題。當然部分不顧及頁面層級的小夥伴，每個Fragment的view都設定了背景，可能就察覺不出來，但是並不代表沒有。然後很多Fragment裡面又

rabbitmq 3.7.0版本新增trace外掛後，新增報錯，以及解決方案（可用方案）

在建立rabbitmq叢集環境後，為了跟蹤訊息消費機制，新增了trace外掛，具體指令碼請參考： # 檢視已安裝的外掛 ./rabbitmq-plugins list ./rabbitmq-plugins enable rabbitmq_tracing ./rabbitmqctl trace

MySQL 5.6版本編碼問題，以及解決方案

最近操作MySQL 5.6版本的，出現瞭如下圖所示的問題問題：在新建一個表後，往表裡面插入漢字，儲存時出現上圖提示框的錯誤解決方案：說正確解決方法之前，先說下百度上折磨的經歷吧遇見問題，什麼都不用說了，先百度，據百度介紹，有以下3種方案：1、修改my-default.ini

tomcat中部署專案後，訪問失敗，報錯404的原因以及解決方案

MyEclipse中報的錯誤： org.apache.catalina.LifecycleException: Failed to start component [StandardEngine[Catalina].StandardHost[localhost].Sta

Git配置過程中出現的問題，以及解決方案

提示出錯資訊：fatal: remote origin already exists. 解決辦法如下： 1、先輸入$ git remote rm origin

Android studio 專案從老版本遷移到新版本遇到的問題，以及解決方案

記錄一下我的專案從studio2.0遷移到3.1.2上遇到的問題。希望對你提供幫助。更新步驟第一步：更新 gradle 將 gradle 更新到指定的版本，我用的是4.4.（gradle外掛版本也要一併更新，對應表請自行查閱）

初次接觸Android APP開發之安裝Android studio軟體出現的問題以及解決方案（錯誤史，一把辛酸淚）

序言筆者由於心血來潮，想玩玩Android開發。本想著用eclipes開發Android APP。但是發現網上說eclipes不是最好的選擇，所以筆者就放棄了熟悉的eclipes來開發Android APP，改用Android studio。在此之前，筆

VMware安裝Centos 7，網絡連接問題以及解決方案

war ble logs 如果方案技術分享 rdquo prot http 轉自：　https://www.cnblogs.com/owaowa/p/6123902.html 在這裏表示萬分感謝在使用CentOS虛擬機後，出現了無法上網的情況，使用主機ping虛

內存溢出和內存泄漏的區別、產生原因以及解決方案轉

服務 har 操作 ger 遞歸調用問題 let share 查錯內存溢出 out of memory，是指程序在申請內存時，沒有足夠的內存空間供其使用，出現out of memory；比如申請了一個integer,但給它存了long才能存下的數，那就是內存溢出。內

移動端300ms的點擊延遲以及解決方案

string 明顯而是一段通過然而監聽屬性 sca 【今天做在移動端的一些效果時，我選擇使用動畫而不是用過渡，這個300ms的點擊延遲是我為什麽使用動畫而不使用過渡最主要的一個原因】動畫和過渡共同點：都是css控制DOM運動，不同點： 1、過渡：只有兩個關

偽共享 FalseSharing (CacheLine，MESI) 淺析以及解決方案

起因

背景知識

計算機儲存架構

Cache Line

MESI

偽共享

解決辦法

相關推薦