1. 程式人生 > 資料庫 >Redis連線錯誤的情況總結分析

Redis連線錯誤的情況總結分析

前言

最近由於流量增大,redis 出現了一連串錯誤,比如:

  • LOADING Redis is loading the dataset in memory
  • use of closed network connection
  • connection pool exhausted
  • connection refuse by peer

一個個來分析。

LOADING Redis is loading the dataset in memory

這裡至少有2種可能

  • 可用記憶體太小,修改 redis.conf 中的 maxmemory 即可解決
  • redis 在啟動時正在載入 dump.rdb 檔案,由於載入比較慢導致 redis 在啟動時不可用

我遇到的就是第2種情況,AWS在自動擴容的時候,每個新產生的 EC2 例項都報錯,原因就是 redis 在啟動時發現有個 dump.rdb,然後就去載入它,導致伺服器裡的服務都報錯,然後就退出了,並且 redis 載入這個要好久(不知道為什麼),supervisord 自動重啟了新的服務後依然報錯。

後來把映象中的 dump.rdb 檔案刪了,服務才能正常啟動。

dump.rdb 檔案產生的原因可能是之前 redis 出現了某種錯誤,然後在製作映象時也做進去了,導致新生成的例項個個都報錯。

這次吸取了教訓,下次製作映象之前都要先 stop 掉 redis 然後刪掉 dump.rdb 。

其他3種錯誤


一開始也是各種找資料,然後各種改配置,導致這3種錯誤都先後出現。

一開始我認為是 golang 程式碼沒有正確處理 redis 連線異常的情況,於是各種升級 redigo,改 golang 中的 timeout 、max_active、wait 等的配置,發現都沒有用。

這樣來來回回折騰了大概一週,終於從 pool.Active 和 pool.MaxActive 中發現了貓膩。

因為我 MaxActive 設定的是 10000,於是我開了 10000 個 go runtine 去測試它,發現當前連線數 pool.Active 老是才 4000 左右,然後就各種報錯。

那段時間也是腦子短路了,老是認為 redigo 沒有正確處理 redis 的連線才導致 pool.Active 不能上到最大。老是想著改 redigo 的程式碼……

後來實在沒辦法,想著去改一改 ulimit,舊的是 500000,改到 990000,發現還是報連線錯誤,pool.Active 還是上不去,我想這不可能啊,這才想到會不會是 redis 本身有最大連線數的配置。上網一查,果然,redis-server 有一個 maxclients 的配置……預設是 4000 多,改到 10000 後,整個世界都清靜了……

其實也不能怪我,因為 redigo 也有個 max_active 引數,鬼知道 redis-server 還要設定呢 [笑哭]?

Redis 用於高併發服務的配置

Redis 客戶端(即 golang 程式碼)

Wait: true 如果連線池滿了,就等待, Redis 處理很快的,等個幾微秒使用者也感覺不出來什麼
IdleTimeout: 5s 一個業務邏輯5s都處理不完,那你應該優化你的程式碼了。如果設定為0,萬一這個連線失蹤了服務端就收回不了了,會產生殭屍連線的。

MaxActive: 10000 相當於這個伺服器能處理每秒 10000 併發了。

Redis 伺服器(即 redis-server)

maxclients 要設定得比 MaxActive 大

附加題:一臺伺服器的最大檔案數怎麼算?

linux kernel - Need to “calculate” optimum ulimit and fs.file-max values according to my own server needs - Stack Overflow

this ends up being about 100 for every 1MB of ram.

例,如果是 4G 記憶體,那麼開啟檔案數最大可以設定為:4 * 1024 * 100 = 409600

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對我們的支援。