Guava 原始碼分析之Cache的實現原理

阿新 • • 發佈：2018-12-22

前言

Google 出的 Guava 是 Java 核心增強的庫，應用非常廣泛。

我平時用的也挺頻繁，這次就藉助日常使用的 Cache 元件來看看 Google 大牛們是如何設計的。

快取

本次主要討論快取。快取在日常開發中舉足輕重，如果你的應用對某類資料有著較高的讀取頻次，並且改動較小時那就非常適合利用快取來提高效能。

快取之所以可以提高效能是因為它的讀取效率很高，就像是 CPU 的 L1、L2、L3 快取一樣，級別越高相應的讀取速度也會越快。

但也不是什麼好處都佔，讀取速度快了但是它的記憶體更小資源更寶貴，所以我們應當快取真正需要的資料。其實也就是典型的空間換時間。下面談談 Java 中所用到的快取。

JVM 快取

首先是 JVM 快取，也可以認為是堆快取。

其實就是建立一些全域性變數，如 Map、List 之類的容器用於存放資料。

這樣的優勢是使用簡單但是也有以下問題：

只能顯式的寫入，清除資料。
不能按照一定的規則淘汰資料，如 LRU，LFU，FIFO 等。
清除資料時的回撥通知。
其他一些定製功能等。

Ehcache、Guava Cache

所以出現了一些專門用作 JVM 快取的開源工具出現了，如本文提到的 Guava Cache。

它具有上文 JVM 快取不具有的功能，如自動清除資料、多種清除演算法、清除回撥等。

但也正因為有了這些功能，這樣的快取必然會多出許多東西需要額外維護，自然也就增加了系統的消耗。

分散式快取

剛才提到的兩種快取其實都是堆內快取，只能在單個節點中使用，這樣在分散式場景下就招架不住了。

於是也有了一些快取中介軟體，如 Redis、Memcached，在分散式環境下可以共享記憶體。

具體不在本次的討論範圍。

Guava Cache 示例

之所以想到 Guava 的 Cache，也是最近在做一個需求，大體如下：

從 Kafka 實時讀取出應用系統的日誌資訊，該日誌資訊包含了應用的健康狀況。
如果在時間視窗 N 內發生了 X 次異常資訊，相應的我就需要作出反饋（報警、記錄日誌等）。

對此 Guava 的 Cache 就非常適合，我利用了它的 N 個時間內不寫入資料時快取就清空的特點，在每次讀取資料時判斷異常資訊是否大於 X 即可。

虛擬碼如下：

    @Value("${alert.in.time:2}")
    private int time ;

    @Bean
    public LoadingCache buildCache(){
        return CacheBuilder.newBuilder()
                .expireAfterWrite(time, TimeUnit.MINUTES)
                .build(new CacheLoader<Long, AtomicLong>() {
                    @Override
                    public AtomicLong load(Long key) throws Exception {
                        return new AtomicLong(0);
                    }
                });
    }


    /**
     * 判斷是否需要報警
     */
    public void checkAlert() {
        try {
            if (counter.get(KEY).incrementAndGet() >= limit) {
                LOGGER.info("***********報警***********");

                //將快取清空
                counter.get(KEY).getAndSet(0L);
            }
        } catch (ExecutionException e) {
            LOGGER.error("Exception", e);
        }
    }

首先是構建了 LoadingCache 物件，在 N 分鐘內不寫入資料時就回收快取（當通過 Key 獲取不到快取時，預設返回 0）。

然後在每次消費時候呼叫 checkAlert() 方法進行校驗，這樣就可以達到上文的需求。

我們來設想下 Guava 它是如何實現過期自動清除資料，並且是可以按照 LRU 這樣的方式清除的。

大膽假設下：

內部通過一個佇列來維護快取的順序，每次訪問過的資料移動到佇列頭部，並且額外開啟一個執行緒來判斷資料是否過期，過期就刪掉。有點類似於我之前寫過的動手實現一個 LRU cache

胡適說過：大膽假設小心論證

下面來看看 Guava 到底是怎麼實現。

原理分析

看原理最好不過是跟程式碼一步步走了：

示例程式碼在這裡：

為了能看出 Guava 是怎麼刪除過期資料的在獲取快取之前休眠了 5 秒鐘，達到了超時條件。

最終會發現在 com.google.common.cache.LocalCache 類的 2187 行比較關鍵。

再跟進去之前第 2182 行會發現先要判斷 count 是否大於 0，這個 count 儲存的是當前快取的數量，並用 volatile 修飾保證了可見性。

接著往下跟到：

2761 行，根據方法名稱可以看出是判斷當前的 Entry 是否過期，該 entry 就是通過 key 查詢到的。

這裡就很明顯的看出是根據根據構建時指定的過期方式來判斷當前 key 是否過期了。

如果過期就往下走，嘗試進行過期刪除（需要加鎖，後面會具體討論）。

到了這裡也很清晰了：

獲取當前快取的總數量
自減一（前面獲取了鎖，所以執行緒安全）
刪除並將更新的總數賦值到 count。

其實大體上就是這個流程，Guava 並沒有按照之前猜想的另起一個執行緒來維護過期資料。

應該是以下原因：

新起執行緒需要資源消耗。
維護過期資料還要獲取額外的鎖，增加了消耗。

而在查詢時候順帶做了這些事情，但是如果該快取遲遲沒有訪問也會存在資料不能被回收的情況，不過這對於一個高吞吐的應用來說也不是問題。

總結

最後再來總結下 Guava 的 Cache。

其實在上文跟程式碼時會發現通過一個 key 定位資料時有以下程式碼：

其實 Guava Cache 為了滿足併發場景的使用，核心的資料結構就是按照 ConcurrentHashMap 來的，這裡也是一個 key 定位到一個具體位置的過程。

先找到 Segment，再找具體的位置，等於是做了兩次 Hash 定位。

上文有一個假設是對的，它內部會維護兩個佇列 accessQueue,writeQueue用於記錄快取順序，這樣才可以按照順序淘汰資料（類似於利用 LinkedHashMap 來做 LRU 快取）。

同時從上文的構建方式來看，它也是構建者模式來建立物件的。

因為作為一個給開發者使用的工具，需要有很多的自定義屬性，利用構建則模式再合適不過了。

Guava 其實還有很多東西沒談到，比如它利用 GC 來回收記憶體，移除資料時的回撥通知等。之後再接著討論。

掃碼關注微信公眾號，第一時間獲取訊息。

Guava 原始碼分析之Cache的實現原理

前言 Google 出的 Guava 是 Java 核心增強的庫，應用非常廣泛。我平時用的也挺頻繁，這次就藉助日常使用的 Cache 元件來看看 Google 大牛們是如何設計的。快取本次主要討論快取。快取在日常開發中舉足輕重，如果你的應用對某類資料有著較高的讀取頻次，並且改動較小時那就

Guava 原始碼分析（Cache 原理【二階段】）

前言文末提到了回收機制、移除時間通知等內容，許多朋友也挺感興趣，這次就這兩個內容再來分析分析。在開始之前先補習下 Java 自帶的兩個特性，Guava 中都有具體的應用。 Java 中的引用首先是 Java 中的引用。在之前分享過 JVM 是根據可達性分析演算法找出需要回收的物

【Android】原始碼分析 - LRUCache快取實現原理

一、Android中的快取策略一般來說，快取策略主要包含快取的新增、獲取和刪除這三類操作。如何新增和獲取快取這個比較好理解，那麼為什麼還要刪除快取呢？這是因為不管是記憶體快取還是硬碟快取，它們的快取大小都是有限的。當快取滿了之後，再想其新增快取，這個時候就需要刪除一些舊的快取

[Vue原始碼分析] v-model實現原理

最近小組有個關於vue原始碼分析的分享會，提前準備一下… 前言: 我們都知道使用v-model可以實現資料的雙向繫結，及實現資料的變化驅動dom的更新，dom的更新影響資料的變化。那麼v-model是怎麼實現這一原理的呢？接下來探索一下這部分的原始碼。前期準備 ①：vue2

Yii原始碼分析之Cache

Cache是支援不同快取儲存實現的快取類的基類。資料項可以通過呼叫set（）儲存在快取中，並通過get（）稍後（在相同或不同的請求中）檢索回來。在這兩個操作中，都需要一個標識資料項的金鑰。呼叫set（）時也可以指定到期時間和/或依賴項。如果資料項到期或者在呼叫get（）時依賴關係發生更改，

Spring原始碼學習之IOC實現原理（二）-ApplicationContext

一.Spring核心元件結構總的來說Spring共有三個核心元件，分別為Core，Context，Bean.三大核心元件的協同工作主要表現在：Bean是包裝我們應用程式自定義物件Object的，Object中存有資料，而Context就是為了這些資料存放提供一個生存環境，儲存各個 bean之間的

String原始碼閱讀之contains實現原理

本文將對String部分原始碼進行閱讀分析的記錄。 contains 對String中的contains方法進行分析，瞭解其採用的是什麼演算法進行匹配。 //用於判斷源字串是否包含目標字元序列 CharSequence s public bo

原始碼解析之HashMap實現原理

目錄二，栗子一，寫在前面在日常開發中，HashMap因其可以儲存鍵值對的特點經常被使用，僅僅知道如何使用HashMap是遠遠不夠的。以知其然知其所以然的鑽研態度，本篇文章將以圖文，原始碼的方式去解析HashMap的實現原理。二，栗子

Java多執行緒之Condition實現原理和原始碼分析（四）

章節概覽、 1、概述上面的幾個章節我們基於lock(),unlock()方法為入口，深入分析了獨佔鎖的獲取和釋放。這個章節我們在此基礎上，進一步分析AQS是如何實現await，signal功能。其功能上和synchronize的wait，notify一樣。

RocketMQ原始碼分析之RocketMQ事務訊息實現原理上篇(二階段提交)

根據上文的描述，傳送事務訊息的入口為： TransactionMQProducer#sendMessageInTransaction： public TransactionSendResult sendMessageInTransaction(final Message msg, final Object

Java多執行緒之ThreadPoolExecutor實現原理和原始碼分析（五）

章節概覽、 1、概述執行緒池的顧名思義，就是執行緒的一個集合。需要用到執行緒，從集合裡面取出即可。這樣設計主要的作用是優化執行緒的建立和銷燬而造成的資源浪費的情況。Java中的執行緒池的實現主要是JUC下面的ThreadPoolExecutor類完成的。下面

Java多執行緒之ReentrantLock實現原理和原始碼分析（二）

章節概覽、 1、ReentrantLock概述 ReentrantLock字面含義是可重入的互斥鎖，實現了和synchronize關鍵字一樣的獨佔鎖功能。但是ReentrantLock使用的是自旋鎖，通過CAS硬體原語指令實現的輕量級的鎖，不會引起上下文切換

一步步實現windows版ijkplayer系列文章之三——Ijkplayer播放器原始碼分析之音視訊輸出——音訊篇

一步步實現windows版ijkplayer系列文章之三——Ijkplayer播放器原始碼分析之音視訊輸出——音訊篇這篇文章的ijkplayer音訊原始碼研究我們還是選擇Android平臺，它的音訊解碼是不支援硬解的，音訊播放使用的API是OpenSL ES或AudioTrack。 OpenSL ES