【58沈劍架構系列】緩存架構設計細節二三事

阿新 • • 發佈：2018-01-15

得到數據余額優點提高得出商品命中率計算

本文主要討論這麽幾個問題：

（1）“緩存與數據庫”需求緣起

（2）“淘汰緩存”還是“更新緩存”

（3）緩存和數據庫的操作時序

（4）緩存和數據庫架構簡析

一、需求緣起

場景介紹

緩存是一種提高系統讀性能的常見技術，對於讀多寫少的應用場景，我們經常使用緩存來進行優化。

例如對於用戶的余額信息表account(uid, money)，業務上的需求是：

（1）查詢用戶的余額，SELECT money FROM account WHERE uid=XXX，占99%的請求

（2）更改用戶余額，UPDATE account SET money=XXX WHERE uid=XXX，占1%的請求

技術分享圖片
由於大部分的請求是查詢，我們在緩存中建立uid到money的鍵值對，能夠極大降低數據庫的壓力。

讀操作流程

有了數據庫和緩存兩個地方存放數據之後（uid->money），每當需要讀取相關數據時（money），操作流程一般是這樣的：

（1）讀取緩存中是否有相關數據，uid->money

（2）如果緩存中有相關數據money，則返回【這就是所謂的數據命中“hit”】

（3）如果緩存中沒有相關數據money，則從數據庫讀取相關數據money【這就是所謂的數據未命中“miss”】，放入緩存中uid->money，再返回

緩存的命中率 = 命中緩存請求個數/總緩存訪問請求個數 = hit/(hit+miss)

上面舉例的余額場景，99%的讀，1%的寫，這個緩存的命中率是非常高的，會在95%以上。

那麽問題來了

當數據money發生變化的時候：

（1）是更新緩存中的數據，還是淘汰緩存中的數據呢？

（2）是先操縱數據庫中的數據再操縱緩存中的數據，還是先操縱緩存中的數據再操縱數據庫中的數據呢？

（3）緩存與數據庫的操作，在架構上是否有優化的空間呢？

這是本文關註的三個核心問題。

二、更新緩存 VS 淘汰緩存

什麽是更新緩存：數據不但寫入數據庫，還會寫入緩存

什麽是淘汰緩存：數據只會寫入數據庫，不會寫入緩存，只會把數據淘汰掉

更新緩存的優點：緩存不會增加一次miss，命中率高

淘汰緩存的優點：簡單（我去，更新緩存我也覺得很簡單呀，樓主你太敷衍了吧）

那到底是選擇更新緩存還是淘汰緩存呢，主要取決於“更新緩存的復雜度”。

例如，上述場景，只是簡單的把余額money設置成一個值，那麽：

（1）淘汰緩存的操作為deleteCache(uid)

（2）更新緩存的操作為setCache(uid, money)

更新緩存的代價很小，此時我們應該更傾向於更新緩存，以保證更高的緩存命中率

如果余額是通過很復雜的數據計算得出來的，例如業務上除了賬戶表account，還有商品表product，折扣表discount

account(uid, money)

product(pid, type, price, pinfo)

discount(type, zhekou)

業務場景是用戶買了一個商品product，這個商品的價格是price，這個商品從屬於type類商品，type類商品在做促銷活動要打折扣zhekou，購買了商品過後，這個余額的計算就復雜了，需要：

（1）先把商品的品類，價格取出來：SELECT type, price FROM product WHERE pid=XXX

（2）再把這個品類的折扣取出來：SELECT zhekou FROM discount WHERE type=XXX

（3）再把原有余額從緩存中查詢出來money = getCache(uid)

（4）再把新的余額寫入到緩存中去setCache(uid, money-price*zhekou)

更新緩存的代價很大，此時我們應該更傾向於淘汰緩存。

however，淘汰緩存操作簡單，並且帶來的副作用只是增加了一次cache miss，建議作為通用的處理方式。

三、先操作數據庫 vs 先操作緩存

OK，當寫操作發生時，假設淘汰緩存作為對緩存通用的處理方式，又面臨兩種抉擇：

（1）先寫數據庫，再淘汰緩存

（2）先淘汰緩存，再寫數據庫

究竟采用哪種時序呢？

還記得在《冗余表如何保證數據一致性》文章（點擊查看）裏“究竟先寫正表還是先寫反表”的結論麽？

對於一個不能保證事務性的操作，一定涉及“哪個任務先做，哪個任務後做”的問題，解決這個問題的方向是：

如果出現不一致，誰先做對業務的影響較小，就誰先執行。

由於寫數據庫與淘汰緩存不能保證原子性，誰先誰後同樣要遵循上述原則。

技術分享圖片
假設先寫數據庫，再淘汰緩存：第一步寫數據庫操作成功，第二步淘汰緩存失敗，則會出現DB中是新數據，Cache中是舊數據，數據不一致。

技術分享圖片
假設先淘汰緩存，再寫數據庫：第一步淘汰緩存成功，第二步寫數據庫失敗，則只會引發一次Cache miss。

結論：數據和緩存的操作時序，結論是清楚的：先淘汰緩存，再寫數據庫。

四、緩存架構優化

技術分享圖片

上述緩存架構有一個缺點：業務方需要同時關註緩存與DB，有沒有進一步的優化空間呢？有兩種常見的方案，一種主流方案，一種非主流方案（一家之言，勿拍）。

技術分享圖片
主流優化方案是服務化：加入一個服務層，向上遊提供帥氣的數據訪問接口，向上遊屏蔽底層數據存儲的細節，這樣業務線不需要關註數據是來自於cache還是DB。

技術分享圖片
非主流方案是異步緩存更新：業務線所有的寫操作都走數據庫，所有的讀操作都總緩存，由一個異步的工具來做數據庫與緩存之間數據的同步，具體細節是：

（1）要有一個init cache的過程，將需要緩存的數據全量寫入cache

（2）如果DB有寫操作，異步更新程序讀取binlog，更新cache

在（1）和（2）的合作下，cache中有全部的數據，這樣：

（a）業務線讀cache，一定能夠hit（很短的時間內，可能有臟數據），無需關註數據庫

（b）業務線寫DB，cache中能得到異步更新，無需關註緩存

這樣將大大簡化業務線的調用邏輯，存在的缺點是，如果緩存的數據業務邏輯比較復雜，async-update異步更新的邏輯可能也會比較復雜。

五、其他未盡事宜

本文只討論了緩存架構設計中需要註意的幾個細節點，如果數據庫架構采用了一主多從，讀寫分離的架構，在特殊時序下，還很可能引發數據庫與緩存的不一致，這個不一致如何優化，後續的文章再討論吧。

六、結論強調

（1）淘汰緩存是一種通用的緩存處理方式

（2）先淘汰緩存，再寫數據庫的時序是毋庸置疑的

（3）服務化是向業務方屏蔽底層數據庫與緩存復雜性的一種通用方式

【文章轉載自微信公眾號“架構師之路”】

【58沈劍架構系列】緩存架構設計細節二三事

得到數據余額優點提高得出商品命中率計算本文主要討論這麽幾個問題：（1）“緩存與數據庫”需求緣起（2）“淘汰緩存”還是“更新緩存” （3）緩存和數據庫的操作時序（4）緩存和

【58沈劍架構系列】緩存與數據庫一致性保證

業務 b- ets 所有緩存 post 一個問題 ket 本文主要討論這麽幾個問題：（1）啥時候數據庫和緩存中的數據會不一致（2）不一致優化思路（3）如何保證數據庫與緩存的一致性一、需求緣起上一篇《緩存架構設計細節二三事》（點擊查看）引起了廣泛

快取架構設計細節二三事--究竟先操作快取，還是資料庫？

快取架構設計細節二三事原創： 58沈劍架構師之路 2016-03-08 本文主要討論這麼幾個問題：（1）“快取與資料庫”需求緣起（2）“淘汰快取”還是“更新快取” （3）快取和資料庫的操作時序（4）快取和資料庫架構簡析一、需求緣起場景介紹

快取架構設計細節二三事

本文主要討論這麼幾個問題：（1）“快取與資料庫”需求緣起（2）“淘汰快取”還是“更新快取” （3）快取和資料庫的操作時序（4）快取和資料庫架構簡析一、需求緣起場景介紹快取是一種提高系統讀效能的常見技術，對於讀多寫少的應用場景，我們經常使用快取來

【58沈劍架構系列】lvs為何不能完全替代DNS輪詢

loading 生效 keepalive dfp 這一常用 mage 服務層 nginx 上一篇文章“一分鐘了解負載均衡的一切”引起了不少同學的關註，評論中大家爭論的比較多的一個技術點是接入層負載均衡技術，部分同學持這樣的觀點： 1）nginx前

【58沈劍架構系列】主從DB與cache一致性

帶來時序增長卡住而是一個 png bubuko 為什麽本文主要討論這麽幾個問題：（1）數據庫主從延時為何會導致緩存數據不一致（2）優化思路與方案一、需求緣起上一篇《緩存架構設計細節二三事》中有一個小優化點，在只有主庫時，通過“串

【58沈劍架構系列】細聊冗余表數據一致性

body 有意義 order 服務之路常用完成比較做到本文主要討論四個問題：（1）為什麽會有冗余表的需求（2）如何實現冗余表（3）正反冗余表誰先執行（4）冗余表如何保證數據的一致性一、需求緣起互聯網很多業務場景的數據量很大，此時數

【 58沈劍架構師之路】究竟啥才是網際網路架構“高併發”

一、什麼是高併發高併發（High Concurrency）是網際網路分散式系統架構設計中必須考慮的因素之一，它通常是指，通過設計保證系統能夠同時並行處理很多請求。高併發相關常用的一些指標有響應時間（Response Time），吞吐量（Throughput），每秒查詢率QPS（Quer

【 58沈劍架構師之路】究竟啥才是網際網路架構“高併發”

一、什麼是高併發高併發（High Concurrency）是網際網路分散式系統架構設計中必須考慮的因素之一，它通常是指，通過設計保證系統能夠同時並行處理很多請求。高併發相關常用的一些指標有響應時間（Response Time），吞吐量（Throughput），每秒查詢率

【 58沈劍架構師之路】TCP接入層的負載均衡、高可用、擴充套件性架構

一、web-server的負載均衡網際網路架構中，web-server接入一般使用nginx來做反向代理，實施負載均衡。整個架構分三層：上游呼叫層，一般是browser或者APP 中間反向代理層，nginx 下游真實接入叢集，web-server，常見web-server的

【58沈劍架構師之路】InnoDB，快照讀，在RR和RC下有何差異？

快照讀(Snapshot Read) MySQL資料庫，InnoDB儲存引擎，為了提高併發，使用MVCC機制，在併發事務時，通過讀取資料行的歷史資料版本，不加鎖，來提高併發的一種不加鎖一致性讀(Consistent Nonlocking Read)。讀提交(Read Committed)

【 58沈劍架構師之路】InnoDB七種鎖——記錄鎖、間隙鎖、臨鍵鎖

MySQL的InnoDB的細粒度行鎖，是它最吸引人的特性之一。但是，如《InnoDB，5項最佳實踐》所述，如果查詢沒有命中索引，也將退化為表鎖。 InnoDB的細粒度鎖，是實現在索引記錄上的。一，InnoDB的索引 InnoDB的索引有兩類索引，聚集

【 58沈劍架構師之路】InnoDB七種鎖——共享/排它鎖、意向鎖、插入意向鎖

今天，將要介紹InnoDB另外三種：共享/排他鎖，意向鎖，插入意向鎖。一，共享/排它鎖(Shared and Exclusive Locks) 《InnoDB併發為何這麼高？》一文介紹了通用的共享/排它鎖，在InnoDB裡當然也實現了標準的行級鎖(row-level locking)，共

【 58沈劍架構師之路】InnoDB七種鎖——自增鎖（Auto-inc Locks）

一，案例說明 MySQL，InnoDB，預設的隔離級別(RR)，假設有資料表： t(id AUTO_INCREMENT, name); 資料表中有資料： 1, shenjian 2, zhangsan 3, lisi 事務A先執行，還未提交： inse

【58沈劍架構師之路】InnoDB併發如此高，原因竟然在這？

一、併發控制為啥要進行併發控制？併發的任務對同一個臨界資源進行操作，如果不採取措施，可能導致不一致，故必須進行併發控制（Concurrency Control）。技術上，通常如何進行併發控制？通過併發控制保證資料一致性的常見手段有：鎖（Locking）資料

【 58沈劍架構師之路】InnoDB七種鎖——自增鎖（Auto-inc Locks）

一，案例說明 MySQL，InnoDB，預設的隔離級別(RR)，假設有資料表： t(id AUTO_INCREMENT, name); 資料表中有資料： 1, shenjian 2, zhangsan 3, lisi 事務A先

【58沈劍架構師之路】InnoDB，快照讀，在RR和RC下有何差異？

快照讀(Snapshot Read) MySQL資料庫，InnoDB儲存引擎，為了提高併發，使用MVCC機制，在併發事務時，通過讀取資料行的歷史資料版本，不加鎖，來提高併發的一種不加鎖一致性讀(Consistent Nonlocking Read)。讀提交(Read Co

【58沈劍架構師之路】InnoDB併發如此高，原因竟然在這？

一、併發控制為啥要進行併發控制？併發的任務對同一個臨界資源進行操作，如果不採取措施，可能導致不一致，故必須進行併發控制（Concurrency Control）。技術上，通常如何進行併發控制？通過併發控制保證資料一致性的常見手段有：鎖（Loc

【58沈劍架構師之路】資料庫索引，到底是什麼做的？

問題1. 資料庫為什麼要設計索引？圖書館存了1000W本圖書，要從中找到《架構師之路》，一本本查，要查到什麼時候去？於是，圖書管理員設計了一套規則： (1)一樓放歷史類，二樓放文學類，三樓放IT類… (2)IT類，又分軟體類，硬體類… (3)軟體類，又按照書名音序排序… 以便快

【58沈劍架構師之路】資料庫索引，到底是什麼做的？

問題1. 資料庫為什麼要設計索引？圖書館存了1000W本圖書，要從中找到《架構師之路》，一本本查，要查到什麼時候去？於是，圖書管理員設計了一套規則： (1)一樓放歷史類，二樓放文學類，三樓放IT類… (2)IT類，又分軟體類，硬體類… (3)軟體類，又按照書

【58沈劍架構系列】緩存架構設計細節二三事

相關推薦