1. 程式人生 > >一文了解 Redis 記憶體監控和記憶體消耗

一文了解 Redis 記憶體監控和記憶體消耗

Redis 是一種記憶體資料庫,將資料儲存在記憶體中,讀寫效率要比傳統的將資料儲存在磁碟上的資料庫要快很多。所以,監控 Redis 的記憶體消耗並瞭解 Redis 記憶體模型對高效並長期穩定使用 Redis 至關重要。

記憶體使用統計

通過 info memory 命令可以獲得 Redis 記憶體相關的指標。較為重要的指標和解釋如下所示:

屬性名屬性說明
used_memory Redis 分配器分配的記憶體總量,也就是內部儲存的所有資料記憶體佔用量
usedmemoryhuman 以可讀的格式返回 used_memory
usedmemoryrss 從作業系統的角度顯示 Redis 程序佔用的實體記憶體總量
usedmemoryrss_human usedmemoryrss 的使用者宜讀格式的顯示
usedmemorypeak 記憶體使用的最大值,表示 used_memory 的峰值
usedmemorypeak_human 以可讀的格式返回 usedmemorypeak的值
usedmemorylua Lua 引擎所消耗的記憶體大小。
memfragmentationratio usedmemoryrss / used_memory 的比值,可以代表記憶體碎片率
maxmemory Redis 能夠使用的最大記憶體上限,0表示沒有限制,以位元組為單位。
maxmemory_policy Redis 使用的記憶體回收策略,可以是 noeviction、allkeys-lru、volatile-lru、allkeys-random、volatile-random 或者 volatile-ttl。預設是noeviction,也就是不會回收。

當 memfragmentationratio > 1 時,說明有部分記憶體並沒有用於資料儲存,而是被記憶體碎片所消耗,如果該值很大,說明碎片率嚴重。 當 memfragmentationratio < 1 時,這種情況一般出現在作業系統把 Redis 記憶體交換 (swap) 到硬碟導致,出現這種情況要格外關注,由於硬碟速度遠遠慢於記憶體,Redis 效能會變得很差,甚至僵死。

當 Redis 記憶體超出可以獲得記憶體時,作業系統會進行 swap,將舊的頁寫入硬碟。從硬碟讀寫大概比從記憶體讀寫要慢5個數量級。used_memory 指標可以幫助判斷 Redis 是否有被swap的風險或者它已經被swap。

在 Redis Administration 一文 (連結在文末) 建議要設定和記憶體一樣大小的交換區,如果沒有交換區,一旦 Redis 突然需要的記憶體大於當前作業系統可用記憶體時,Redis 會因為 out of memory 而被 Linix Kernel 的 OOM Killer 直接殺死。雖然當 Redis 的資料被換出 (swap out) 時,Redis的效能會變差,但是總比直接被殺死的好。

Redis 使用 maxmemory 引數限制最大可用記憶體。限制記憶體的目的主要有:

  • 用於快取場景,當超出記憶體上限 maxmemory 時使用 LRU 等刪除策略釋放空間。
  • 防止所用的記憶體超過伺服器實體記憶體,導致 OOM 後進程被系統殺死。

maxmemory 限制的是 Redis 實際使用的記憶體量,也就是 used_memory 統計項對應的記憶體。實際消耗的記憶體可能會比 maxmemory 設定的大,要小心因為這部記憶體導致 OOM。所以,如果你有 10GB 的記憶體,最好將 maxmemory 設定為 8 或者 9G

記憶體消耗劃分

Redis 程序內消耗主要包括:自身記憶體 + 物件記憶體 + 緩衝記憶體 + 記憶體碎片,其中 Redis 空程序自身記憶體消耗非常少,通常 usedmemoryrss 在 3MB 左右時,used_memory 一般在 800KB 左右,一個空的 Redis 程序消耗記憶體可以忽略不計。

物件記憶體

物件記憶體是 Redis 記憶體佔用最大的一塊,儲存著使用者所有的資料。Redis 所有的資料都採用 key-value 資料型別,每次建立鍵值對時,至少建立兩個型別物件:key 物件和 value 物件。物件記憶體消耗可以簡單理解為這兩個物件的記憶體消耗之和(還有類似過期之類的資訊)。鍵物件都是字串,在使用 Redis 時很容易忽略鍵對記憶體消耗的影響,應當避免使用過長的鍵。有關 Redis 物件系統的詳細內容,請看我之前的文章十二張圖帶你瞭解 Redis 的資料結構和物件系統。

緩衝記憶體

緩衝記憶體主要包括:客戶端緩衝、複製積壓緩衝區和 AOF 緩衝區。

客戶端緩衝指的是所有接入到 Redis 伺服器 TCP 連線的輸入輸出緩衝。

輸入緩衝無法控制,最大空間為 1G,如果超過將斷開連線。而且輸入緩衝區不受 maxmemory 控制,假設一個 Redis 例項設定了 maxmemory 為 4G,已經儲存了 2G 資料,但是如果此時輸入緩衝區使用了 3G,就已經超出了 maxmemory 限制,可能導致資料丟失、鍵值淘汰或者 OOM。

輸入緩衝區過大主要是因為 Redis 的處理速度跟不上輸入緩衝區的輸入速度,並且每次進入輸入緩衝區的命令包含了大量的 bigkey。

輸出緩衝通過引數 client-output-buffer-limit 控制,其格式如下所示。

  1. client-output-buffer-limit [hard limit] [soft limit] [duration]

hard limit 是指一旦緩衝區大小達到了這個閾值,Redis 就會立刻關閉該連線。而 soft limit 和時間 duration 共同生效,比如說 soft time 為 64mb、duration 為 60,則只有當緩衝區持續 60s 大於 64mb 時,Redis 才會關閉該連線。

普通客戶端是除了複製和訂閱的客戶端之外的所有連線。Reids 對其的預設配置是 client-output-buffer-limit normal 0 0 0 , Redis 並沒有對普通客戶端的輸出緩衝區做限制,一般普通客戶端的記憶體消耗可以忽略不計,但是當有大量慢連線客戶端接入時這部分記憶體消耗就不能忽略,可以設定 maxclients 做限制。特別當使用大量資料輸出的命令且資料無法及時推送到客戶端時,如 monitor 命令,容易造成 Redis 伺服器記憶體突然飆升。相關案例可以檢視這篇文章美團在Redis上踩過的一些坑-3.redis記憶體佔用飆升。

從客戶端用於主從複製,主節點會為每個從節點單獨建立一條連線用於命令複製,預設配置為 client-output-buffer-limit slave 256mb 64mb 60。當主從節點之間網路延遲較高或主節點掛載大量從節點時這部分記憶體消耗將佔用很大一部分,建議主節點掛載的從節點不要多於 2 個,主從節點不要部署在較差的網路環境下,如異地跨機房環境,防止複製客戶端連線緩慢造成溢位。與主從複製相關的一共有兩類緩衝區,一個是從客戶端輸出緩衝區,另外一個是下面會介紹到的複製積壓緩衝區。

訂閱客戶端用於釋出訂閱功能,連線客戶端使用單獨的輸出緩衝區,預設配置為 client-output-buffer-limit pubsub 32mb 8mb 60,當訂閱服務的訊息生產快於消費速度時,輸出緩衝區會產生積壓造成記憶體空間溢位。

輸入輸出緩衝區在大流量場景中容易失控,造成 Redis 記憶體不穩定,需要重點監控。可以定期執行 client list 命令,監控每個客戶端的輸入輸出緩衝區大小和其他資訊。

屬性名屬性說明
qbuf 查詢緩衝區的長度(位元組為單位, 0 表示沒有分配查詢緩衝區)
qbuf-free 查詢緩衝區剩餘空間的長度(位元組為單位, 0 表示沒有剩餘空間)
obl 輸出緩衝區的長度(位元組為單位, 0 表示沒有分配輸出緩衝區)
oll 輸出列表包含的物件數量(當輸出緩衝區沒有剩餘空間時,命令回覆會以字串物件的形式被入隊到這個佇列裡)
  1. 127.0.0.1:6379> client list
  2. id=3 addr=127.0.0.1:58161 fd=8 name= \
  3. age=1408 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 \
  4. qbuf=26 qbuf-free=32742 obl=0 oll=0 omem=0 \
  5. events=r cmd=client

client list 命令執行速度慢,客戶端較多時頻繁執行存在阻塞redis的可能,所以一般可以先使用 info clients 命令獲取最大的客戶端緩衝區大小。

  1. 127.0.0.1:6379> info clients
  2. # Clients
  3. connected_clients:1
  4. client_recent_max_input_buffer:2
  5. client_recent_max_output_buffer:0
  6. blocked_clients:0

複製積壓緩衝區是Redis 在 2.8 版本後提供的一個可重用的固定大小緩衝區,用於實現部分複製功能。根據 repl-backlog-size 引數控制,預設 1MB。對於複製積壓緩衝區整個主節點只有一個,所有的從節點共享此緩衝區。因此可以設定較大的緩衝區空間,比如說 100MB,可以有效避免全量複製。有關複製積壓緩衝區的詳情可以看我的舊文章 Redis 複製過程詳解。

AOF 重寫緩衝區:這部分空間用於在 Redis AOF 重寫期間儲存最近的寫入命令。AOF 重寫緩衝區的大小使用者無法控制,取決於 AOF 重寫時間和寫入命令量,不過一般都很小。有關 AOF 持久化的詳情可以看我的舊文章 Redis AOF 持久化詳解。

Redis 記憶體碎片

Redis 預設的記憶體分配器採用 jemalloc,可選的分配器還有:glibc、tcmalloc。記憶體分配器為了更好地管理和重複利用記憶體,分配記憶體策略一般採用固定範圍的記憶體塊進行分配。具體的分配策略後續會具體講解,但是 Redis 正常碎片率一般在 1.03 左右(為什麼是這個值)。但是當儲存的資料長度長度差異較大時,以下場景容易出現高記憶體碎片問題:

  • 頻繁做更新操作,例如頻繁對已經存在的鍵執行 append、setrange 等更新操作。
  • 大量過期鍵刪除,鍵物件過期刪除後,釋放的空間無法得到重複利用,導致碎片率上升。

這部分內容我們後續再詳細講解 jemalloc,因為大量的框架都會使用記憶體分配器,比如說 Netty 等。

子程序記憶體消耗

子程序記憶體消耗主要指執行 AOF 重寫 或者進行 RDB 儲存時 Redis 建立的子程序記憶體消耗。Redis 執行 fork 操作產生的子程序記憶體佔用量表現為與父程序相同,理論上需要一倍的實體記憶體來完成相應的操作。但是 Linux 具有寫時複製技術 (copy-on-write),父子程序會共享相同的實體記憶體頁,當父程序處理寫請求時會對需要修改的頁複製出一份副本完成寫操作,而子程序依然讀取 fork 時整個父程序的記憶體快照。

如上圖所示,fork 時只拷貝 page table,也就是頁表。只有等到某一頁發生修改時,才真正進行頁的複製。

但是 Linux Kernel 在 2.6.38 記憶體增加了 Transparent Huge Pages (THP) 機制,簡單理解,它就是讓頁大小變大,本來一頁為 4KB,開啟 THP 機制後,一頁大小為 2MB。它雖然可以加快 fork 速度( 要拷貝的頁的數量減少 ),但是會導致 copy-on-write 複製記憶體頁的單位從 4KB 增大為 2MB,如果父程序有大量寫命令,會加重記憶體拷貝量,都是修改一個頁的內容,但是頁單位變大了,從而造成過度記憶體消耗。例如,以下兩個執行 AOF 重寫時的記憶體消耗日誌:

  1. // 開啟 THP
  2. C * AOF rewrite: 1039 MB of memory used by copy-on-write
  3. // 關閉 THP
  4. C * AOF rewrite: 9MB of memory used by copy-on-write

這兩個日誌出自同一個 Redis 程序,used_memory 總量是 1.5GB,子程序執行期間每秒寫命令量都在 200 左右。當分別開啟和關閉 THP 時,子程序記憶體消耗有天壤之別。所以,在高併發寫的場景下開啟 THP,子程序記憶體消耗可能是父程序的數倍,造成機器實體記憶體溢位。

所以說,Redis 產生的子程序並不需要消耗 1 倍的父程序記憶體,實際消耗根據期間寫入命令量決定,所以需要預留一些記憶體防止溢位。並且建議關閉系統的 THP,防止 copy-on-write 期間記憶體過度消耗。不僅是 Redis,部署 MySQL 的機器一般也會關閉 THP。

本人部落格,歡迎來玩

微信公眾號原文

參考文章

  • https://www.datadoghq.com/pdf/Understanding-the-Top-5-Redis-Performance-Metrics.pdf

  • Redis Administration https://redis.io/topics/admin