1. 程式人生 > >redis在分布式中的使用

redis在分布式中的使用

任務 如果 刪除 多路復用 排列 用戶 簡單 元素 分布式鎖

作者:孤獨煙

來自:http://rjzheng.cnblogs.com/

為什麽要用redis:為了並發和性能,使用redis做為緩沖

使用redis有什麽缺點

主要是四個問題

(一)緩存和數據庫雙寫一致性問題

分析:一致性問題是分布式常見問題,還可以再分為最終一致性和強一致性。數據庫和緩存雙寫,就必然會存在不一致的問題。答這個問題,先明白一個前提。就是如果對數據有強一致性要求,不能放緩存。我們所做的一切,只能保證最終一致性。

另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的概率,無法完全避免。因此,有強一致性要求的數據,不能放緩存。

回答:首先,采取正確更新策略,先更新數據庫,再刪緩存。其次,因為可能存在刪除緩存失敗的問題,提供一個補償措施即可,例如利用消息隊列。

(二)緩存雪崩問題 :緩存雪崩,即緩存同一時間大面積的失效,這個時候又來了一波請求,結果請求都懟到數據庫上,從而導致數據庫連接異常。

解決方案:
(一)給緩存的失效時間,加上一個隨機值,避免集體失效。

(二)使用互斥鎖,但是該方案吞吐量明顯下降了。

(三)雙緩存。我們有兩個緩存,緩存A和緩存B。緩存A的失效時間為20分鐘,緩存B不設失效時間。自己做緩存預熱操作。然後細分以下幾個小點

      • I 從緩存A讀數據庫,有則直接返回

      • II A沒有數據,直接從B讀數據,直接返回,並且異步啟動一個更新線程。

      • III 更新線程同時更新緩存A和緩存B。

(三)緩存擊穿問題

:緩存穿透,即黑客故意去請求緩存中不存在的數據,導致所有的請求都懟到數據庫上,從而數據庫連接異常。

解決方案:

(一)利用互斥鎖,緩存失效的時候,先去獲得鎖,得到鎖了,再去請求數據庫。沒得到鎖,則休眠一段時間重試

(二)采用異步更新策略,無論key是否取到值,都直接返回。value值中維護一個緩存失效時間,緩存如果過期,異步起一個線程去讀數據庫,更新緩存。需要做緩存預熱(項目啟動前,先加載緩存)操作。

(三)提供一個能迅速判斷請求是否有效的攔截機制,比如,利用布隆過濾器,內部維護一系列合法有效的key。迅速判斷

(四)緩存的並發競爭問題

分析:這個問題大致就是,同時有多個子系統去set一個key。這個時候要註意什麽呢?大家思考過麽。需要說明一下,博主提前百度了一下,發現答案基本都是推薦用redis事務機制。博主不推薦使用redis的事務機制。

因為我們的生產環境,基本都是redis集群環境,做了數據分片操作。你一個事務中有涉及到多個key操作的時候,這多個key不一定都存儲在同一個redis-server上。因此,redis的事務機制,十分雞肋。

回答:如下所示

(一)如果對這個key操作,不要求順序 這種情況下,準備一個分布式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單。

(二)如果對這個key操作,要求順序 假設有一個key1,系統A需要將key1設置為valueA,系統B需要將key1設置為valueB,系統C需要將key1設置為valueC. 期望按照key1的value值按照 valueA-->valueB-->valueC的順序變化。

這種時候我們在數據寫入數據庫的時候,需要保存一個時間戳。假設時間戳如下

系統A key 1 {valueA 3:00}

系統B key 1 {valueB 3:05}

系統C key 1 {valueC 3:10}

那麽,假設這會系統B先搶到鎖,將key1設置為{valueB 3:05}。接下來系統A搶到鎖,發現自己的valueA的時間戳早於緩存中的時間戳,那就不做set操作了。以此類推。 其他方法,比如利用隊列,將set方法變成串行訪問也可以。總之,靈活變通。

單線程的redis為什麽這麽快

(一)純內存操作

(二)單線程操作,避免了頻繁的上下文切換

(三)采用了非阻塞I/O多路復用機制:只有單個線程(一個快遞員),通過跟蹤每個socket(I/O流)的狀態(每個快遞的送達地點),來管理多個I/O流。

技術分享圖片

參照上圖,簡單來說,就是。我們的redis-client在操作的時候,會產生具有不同事件類型的socket。在服務端,有一段I/0多路復用程序,將其置入隊列之中。

然後,文件事件分派器,依次去隊列中取,轉發到不同的事件處理器中。 需要說明的是,這個I/O多路復用機制,redis還提供了select、epoll、evport、kqueue等多路復用函數庫,大家可以自行去了解。

redis的數據類型,以及每種數據類型的使用場景

(一)String:一般做一些復雜的計數功能的緩存。

(二)hash:做單點登錄的時候,就是用這種數據結構存儲用戶信息,以cookieId作為key,設置30分鐘為緩存過期時間,能很好的模擬出類似session的效果。

(三)list:使用List的數據結構,可以做簡單的消息隊列的功能。另外還有一個就是,可以利用lrange命令,做基於redis的分頁功能,性能極佳,用戶體驗好。

(四)set:因為set堆放的是一堆不重復值的集合。所以可以做全局去重的功能。為什麽不用JVM自帶的Set進行去重?因為我們的系統一般都是集群部署,使用JVM自帶的Set,比較麻煩,難道為了一個做一個全局去重,再起一個公共服務,太麻煩了。

另外,就是利用交集、並集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能。

(五)sorted set:sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做排行榜應用,取TOP N操作。另外,參照另一篇《分布式之延時任務方案解析》,該文指出了sorted set可以用來做延時任務。最後一個應用就是可以做範圍查找

redis的過期策略以及內存淘汰機制

分析:這個問題其實相當重要,到底redis有沒有用到家,這個問題就可以看出來。比如你redis只能存5G數據,可是你寫了10G,那會刪5G的數據。怎麽刪的,這個問題思考過麽?還有,你的數據已經設置了過期時間,但是時間到了,內存占用率還是比較高,有思考過原因麽?

回答: redis采用的是定期刪除+惰性刪除策略

定期刪除+惰性刪除是如何工作的呢?

定期刪除,redis默認每個100ms檢查,是否有過期的key,有過期key則刪除。需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。

因此,如果只采用定期刪除策略,會導致很多key到時間沒有刪除。

於是,惰性刪除派上用場。也就是說在你獲取某個key的時候,redis會檢查一下,這個key如果設置了過期時間那麽是否過期了?如果過期了此時就會刪除。

采用定期刪除+惰性刪除就沒其他問題了麽? 不是的,如果定期刪除沒刪除key。然後你也沒即時去請求key,也就是說惰性刪除也沒生效。這樣,redis的內存會越來越高。那麽就應該采用內存淘汰機制。

在redis.conf中有一行配置 # maxmemory-policy volatile-lru

redis在分布式中的使用