1. 程式人生 > >Redis監控方案

Redis監控方案

Redis 監控最直接的方法當然就是使用系統提供的 info 命令來做了,你只需要執行下面一條命令,就能獲得 Redis 系統的狀態報告。

redis-cli info

記憶體使用

如果 Redis 使用的記憶體超出了可用的實體記憶體大小,那麼 Redis 很可能系統會被 OOM Killer殺掉。針對這一點,你可以通過 info 命令對 used_memory 和 used_memory_peak 進行監控,為使用記憶體量設定閥值,並設定相應的報警機制。當然,報警只是手段,重要的是你得預先計劃好,當記憶體使用量過大後,你應該做些什麼,是清除一些沒用的冷資料,還是把 Redis 遷移到更強大的機器上去。

持久化

如果因為你的機器或 Redis 本身的問題導致 Redis 崩潰了,那麼你唯一的救命稻草可能就是 dump 出來的 rdb檔案了,所以,對 Redis dump 檔案進行監控也是很重要的。你可以通過對rdb_last_save_time 進行監控,瞭解你最近一次 dump 資料操作的時間,還可以通過對rdb_changes_since_last_save 進行監控來知識如果這時候出現故障,你會丟失多少資料。

主從複製

如果你設定了主從複製模式,那麼你最好對複製的情況是否正常做一些監控,主要是對 info 輸出中的 master_link_status 進行監控,如果這個值是 up,那麼說明同步正常,如果是 down,那麼你就要注意一下輸出的其它一些診斷資訊了。比如下面這些:

role:slave
master_host:192.168.1.128
master_port:6379
master_link_status:down
master_last_io_seconds_ago:-1
master_sync_in_progress:0
master_link_down_since_seconds:1356900595

Fork 效能

當 Redis 持久化資料到磁碟上時,它會進行一次 fork 操作,通過 fork 對記憶體的 copy on write 機制最廉價的實現記憶體映象。但是雖然記憶體是 copy on write 的,但是虛擬記憶體表是在 fork 的瞬間就需要分配,所以 fork 會造成主執行緒短時間的卡頓(停止所有讀寫操作),這個卡頓時間和當前 Redis 的記憶體使用量有關。通常 GB 量級的 Redis 進行 fork 操作的時間在毫秒級。你可以通過對 info 輸出的 latest_fork_usec

 進行監控來了解最近一次 fork 操作導致了多少時間的卡頓。

配置一致

Redis 支援使用 CONFIG SET 操作來實現執行實的配置修改,這很方便,但同時也會導致一個問題。就是通過這個命令動態修改的配置,是不會同步到你的配置檔案中去的。所以當你因為某些原因重啟 Redis 時,你使用 CONFIG SET 做的配置修改就會丟失掉,所以我們最好保證在每次使用 CONFIG SET 修改配置時,也把配置檔案一起相應地改掉。為了防止人為的失誤,所以我們最好對配置進行監控,使用 CONFIG GET 命令來獲取當前執行時的配置,並與 redis.conf 中的配置值進行對比,如果發現兩邊對不上,就啟動報警。

慢日誌

Redis 提供了 SLOWLOG 指令來獲取最近的慢日誌,Redis 的慢日誌是直接存在記憶體中的,所以它的慢日誌開銷並不大,在實際應用中,我們通過 crontab 任務執行 SLOWLOG 命令來獲取慢日誌,然後將慢日誌存到檔案中,並用 Kibana 生成實時的效能圖表來實現效能監控。

值得一提的是,Redis 的慢日誌記錄的時間,僅僅包括 Redis 自身對一條命令的執行時間,不包括 IO 的時間,比如接收客戶端資料和傳送客戶端資料這些時間。另外,Redis 的慢日誌和其它資料庫的慢日誌有一點不同,其它資料庫偶爾出現 100ms 的慢日誌可能都比較正常,因為一般資料庫都是多執行緒併發執行,某個執行緒執行某個命令的效能可能並不能代表整體效能,但是對 Redis 來說,它是單執行緒的,一旦出現慢日誌,可能就需要馬上得到重視,最好去查一下具體是什麼原因了。

監控服務

-Sentinel

Sentinel 是 Redis 自帶的工具,它可以對 Redis 主從複製進行監控,並實現主掛掉之後的自動故障轉移。在轉移的過程中,它還可以被配置去執行一個使用者自定義的指令碼,在指令碼中我們就能夠實現報警通知等功能。

-Redis Live

Redis Live 是一個更通用的 Redis 監控方案,它的原理是定時在 Redis 上執行 MONITOR 命令,來獲取當前 Redis 當前正在執行的命令,並通過統計分析,生成web頁面的視覺化分析報表。

-Redis Faina

Redis Faina 是由著名的圖片分享應用 instagram 開發的 Redis 監控服務,其原理和 Redis Live 類似,都是對通過  來做的。

資料分佈

弄清 Redis 中資料儲存分佈是一件很難的是,比如你想知道哪型別的 key 值佔用記憶體最多。下面是一些工具,可以幫助你對 Redis 的資料集進行分析。

-Redis-sampler

Redis-sampler 是 Redis 作者開發的工具,它通過採用的方法,能夠讓你瞭解到當前 Redis 中的資料的大致型別,資料及分佈狀況。

-Redis-audit

Redis-audit 是一個指令碼,通過它,我們可以知道每一類 key 對記憶體的使用量。它可以提供的資料有:某一類 key 值的訪問頻率如何,有多少值設定了過期時間,某一類 key 值使用記憶體的大小,這很方便讓我們能排查哪些 key 不常用或者壓根不用。

-Redis-rdb-tools

Redis-rdb-tools 跟 Redis-audit 功能類似,不同的是它是通過對 rdb 檔案進行分析來取得統計資料的。