Redis 6.0 多執行緒效能測試結果及分析

阿新 • • 發佈：2020-12-23

單執行緒的Redis一向以簡潔高效著稱，但也有其阿喀琉斯之踵：阻塞！單個執行緒在最容易產生瓶頸的網路讀寫（Redis大key）請求完成之前，其他所有請求都將會被阻塞，嚴重影響其效率，因此Redis的多執行緒呼聲就越來越高。由於是基於記憶體的操作延遲非常低，所以即便是單執行緒模式下CPU資源也不會是的瓶頸。最容易出現瓶頸的還是網路IO操作。在Redis 6.0開始支援多執行緒之後，所謂的多執行緒也只是socket層面的多執行緒，核心的記憶體讀寫還是單執行緒模式。
弄清楚了多執行緒的本質之後，就會有一系列的問題，多執行緒會比單執行緒有多大的提升？設定多少個執行緒合適？見一些大神測試過，其結果也非常理想，但只是看看也不太過癮，決定一試為快，本文將對Redis的多執行緒進行一個粗淺的測試驗證。同時需要思考另外一個問題：面對多執行緒版本的Redis，和Redis cluster，該如何選擇？

多執行緒Redis

redis 6.0 的“多執行緒”特性讓很多標題黨高潮連連，參考圖片源自於：美圖技術團隊侵刪，核心的執行緒（Execute Command）還是單執行緒，多執行緒是指網路IO（socket）讀寫的多執行緒化。
如下圖所示，讀寫網路socket中的資料是可以用多個執行緒，所以Redis的多執行緒也叫做io thread，相關引數：“io-threads”。另一個引數是io-threads-do-reads，這裡涉及另外一個細節：多執行緒IO主要用在請求完成後返回結果集的過程，也就是socket寫操作，至於讀socket，單執行緒本身採用的多路IO複用技術，也不會產生瓶頸，因此Redis給出了一個io-threads-do-reads 引數，決定讀socket的時候是否啟用多執行緒。其實io-threads-do-reads是否啟用，對效能的影響並不大，最後會做一個驗證。

測試策略

本機配置：centos 7，16C+32GB記憶體
Redis版本
下面分別以1執行緒，2執行緒，4執行緒，6執行緒，8執行緒，10執行緒的配置下，同時為避免網路延遲帶來的影響，redis-benchmark在Redis例項本地，測試Redis的get和set效能。

翻車

整個測試開始之前，經歷了兩次翻車才得以繼續翻車現場1
centos 7上預設的gcc是4.*版本，無法編譯Redis 6.0，所以需要升級gcc，因為本機不支援yum安裝，參考這裡使用原始碼包安裝，gcc編譯的時候那個酸爽，本機16C+32GB記憶體的環境下，因為缺少某些依賴包，導致失敗了幾次，最終編譯成功的一次，花了大概1個小時10分鐘
翻車現場2
沒有認真讀配置檔案中的說明，設定io-threads後，重啟Redis服務後，上來就用redis-benchmark直接懟，其結果跟單執行緒差不多，令人大跌眼鏡。
最後還是在原始配置檔案發現了這段話：
If you want to test the Redis speedup using redis-benchmark, makesure you also run the benchmark itself in threaded mode, using the--threads option to match the number of Redis threads, otherwise you'll notbe able to notice the improvements. 意思是必須在redis-benchmark設定--threads引數，並且要match Redis中的執行緒設定，--threads引數是redis 6.0後新增的一個引數。只有加上--threads這個引數才能體現出來多執行緒Redis的效率。

關於Thread IO的說明

經歷了第二次翻車之後決定好好看一看redis.conf中關於thread io的註釋資訊

################################ THREADED I/O #################################

# Redis is mostly single threaded, however there are certain threaded
# operations such as UNLINK, slow I/O accesses and other things that are
# performed on side threads.
#
# Now it is also possible to handle Redis clients socket reads and writes
# in different I/O threads. Since especially writing is so slow, normally
# Redis users use pipelining in order to speed up the Redis performances per
# core, and spawn multiple instances in order to scale more. Using I/O
# threads it is possible to easily speedup two times Redis without resorting
# to pipelining nor sharding of the instance.
#
# By default threading is disabled, we suggest enabling it only in machines
# that have at least 4 or more cores, leaving at least one spare core.
# Using more than 8 threads is unlikely to help much. We also recommend using
# threaded I/O only if you actually have performance problems, with Redis
# instances being able to use a quite big percentage of CPU time, otherwise
# there is no point in using this feature.
#
# So for instance if you have a four cores boxes, try to use 2 or 3 I/O
# threads, if you have a 8 cores, try to use 6 threads. In order to
# enable I/O threads use the following configuration directive:
#
# io-threads 4
#
# Setting io-threads to 1 will just use the main thread as usual.
# When I/O threads are enabled, we only use threads for writes, that is
# to thread the write(2) syscall and transfer the client buffers to the
# socket. However it is also possible to enable threading of reads and
# protocol parsing using the following configuration directive, by setting
# it to yes:
#
# io-threads-do-reads no
#
# Usually threading reads doesn't help much.
#
# NOTE 1: This configuration directive cannot be changed at runtime via
# CONFIG SET. Aso this feature currently does not work when SSL is
# enabled.
#
# NOTE 2: If you want to test the Redis speedup using redis-benchmark, make
# sure you also run the benchmark itself in threaded mode, using the
# --threads option to match the number of Redis threads, otherwise you'll not
# be able to notice the improvements.

大概意思如下：
大多數情況下redis是以單執行緒的方式執行的，然而，有一些執行緒操作，如斷開連結，耗時的I/O操作（bgsave，expired key清理之類的操作）和其他任務是在side執行緒（主執行緒fork出來的先執行緒）中執行的。現在也可以在不同的I/O執行緒中處理Redis客戶端socket讀和寫。由於寫入（指socket寫入）速度非常慢，Redis使用者通常使用pipelining來提高Redis在單核上的效能，並使用多個例項的方式來擴容。使用I/O執行緒可以很容易地提升Redis在socket讀寫上的效能，而無需求助於管道或例項的分片。 Redis 6.0中預設情況下多執行緒被是被禁用的，建議至少有4個或更多核的機器中啟用多執行緒，且至少留下1備用核。使用超過8個執行緒不大可能有太大幫助。由於Redis例項能夠充分利用CPU資源（譯者注：意思是即便是單執行緒下，CPU並不是瓶頸），多執行緒I/O只有在你確實有效能問題的情況下才能提升執行效率，否則就沒有必要使用這個特性。如果你有一個4核的伺服器，嘗試使用2或3個I/O執行緒，如果是8核，嘗試使用6個執行緒。要啟用多執行緒I/O，請使用以下配置指令： io-threads 4 設定io-threads為1會像傳統的redis一樣啟用單個主執行緒，當I/O threads被啟用之後，僅僅支援寫操作（譯者注：指的是socket的寫操作，socket的讀操作使用多路io複用技術，本身也不是瓶頸）即IO執行緒呼叫syscall並將客戶端緩衝區傳輸到socket。
但是，也可以啟用讀寫執行緒，使用以下配置指令進行協議解析，方法是將其設定為“yes”： io-threads-do-reads no 通常情況下，threading reads執行緒對效能的提升幫助並不大注1：此配置指令不能在執行時通過配置集進行更改，只能在修改配置檔案之後重啟。啟用SSL時，當前此特性也無效。注2：如果你想用Redis-benchmark測試Redis的效能，務必以threaded mode的方式執行Redis-benchmark，使用--threads選項來匹配Redis執行緒的數量，否則無法觀察到測試結果的提升。

測試結果及分析

如下是不同執行緒requests per second測試結果的橫向對比

從中可以看到： 1，1個執行緒，也就是傳統的單執行緒模式，get 操作的QPS可以達到9W左右 2，2個執行緒，get 操作的QPS可以達到18W左右，相比單執行緒有100%+的提升 3，4個執行緒，相比2個現場，會有一定程度的提高，但是已經沒有從1個執行緒到2個執行緒翻一倍的提升了 4，6個執行緒，與4執行緒相比，沒有明顯的提升 5，8個執行緒，相比4執行緒和6執行緒，8執行緒下大概有10%的提升 6，10個執行緒，相比效率最高的8執行緒，此時效能反倒是開始下降了，與4執行緒或者6執行緒的效率相當
因此在本機環境下，io-threads 4設定成2或者4個都ok，最多不超過8個，超出後效能反而會下降，同時也不能超出cpu的個數，正如配置檔案中註釋中說的，至少要留出一個CPU。如下是不同執行緒下10測試結果中GET和SET的requests per second平均值對比：

關於io-threads-do-reads引數

上文提到過io-threads-do-reads這個引數，它是決定socket讀操作是否開啟多執行緒，Redis的socket讀操作採用多路IO複用技術，本身不會成為瓶頸，所以這個引數對多執行緒下測試影響比較小。依舊參考這裡的這個圖侵刪，這個io-threads-do-reads在筆者理解起來，就是socket讀的執行緒，是否開啟影響不大。

參考如下截圖，在開啟了兩個執行緒的情況下，分別開啟和禁用io-threads-do-reads，從整體上看，效能影響差別很小。當然專業的大神可以從原始碼的角度去分析。
io-threads為2，且啟動io-threads-do-reads

io-threads為2，且禁動io-threads-do-reads

多執行緒版本的Redis和Redis Cluster的選擇

redis叢集有兩種模式：sentinel和cluster，這裡暫時先不提sentinel，來思考多執行緒版本的Redis和Redis Cluster的選擇問題。
Redis的Cluster解決的就是擴充套件性和單節點單執行緒的阻塞隱患，如果Redis支援了多執行緒（目前多執行緒的Redis最對不建議超出8個執行緒），在不考慮單個節點網絡卡瓶頸的情況下，其實這兩個問題都已經解決了，單節點可以支援多執行緒和充分利用多核CPU，單節點可以支援到25W QPS，還要啥自行車？
同時要考慮到Redis cluster的痛點：
1，不支援multiple操作（第三方外掛也不一定穩定）。
2，cluster中每個主節點要掛一個從節點，不管這個節點是不是獨立的物理節點還是單機多例項中的一個節點，終究是增加了維護成本。
3，只能使用一個數據庫
4，叢集自身擴容、縮容帶來的一系列slot遷移等效能問題，以及叢集的管理問題
這些所謂的痛點也不復存在了，所以這裡就面臨一個重新選擇的問題：是使用多執行緒版本的Redis，還是使用Redis cluster？這是一個需要思考的問題。

疑問

關於redis-benchmark 測試時候./bin/redis-benchmark -d 128 -c 200 -n 1000000 -t set -q --threads 2，涉及的兩個引數-c和--threads，個人是不太理解的
-c的解釋是：指定併發連線數
--threads是redis-benchmark的執行緒數？
對此去跟老錢求證了一下，說該引數是redis-benchmark客戶端的epoll，伺服器端的多路IO複用原理已經看得我七葷八素了，客戶端也是帶epoll的，還是不太理解這兩者之間的關係。

redis-benchmark測試現場

如下是redis-benchmark測試過程中部分截圖

圖太多了，就不一一貼上來了。

Redis 6.0 多執行緒效能測試結果及分析

多執行緒Redis

測試策略

翻車

關於Thread IO的說明

測試結果及分析

關於io-threads-do-reads引數

多執行緒版本的Redis和Redis Cluster的選擇

疑問

redis-benchmark測試現場

Redis 6.0 多執行緒效能測試結果及分析

正式支援多執行緒！Redis 6.0與老版效能對比評測

6.18Java多執行緒併發、同步效能分析

redis 延遲佇列(多執行緒測試)

解決多執行緒效能問題技巧分享

redis6.0?多執行緒？到底發生腎麼事了？

6.18Java多執行緒同步方法實現DemoNo2

6.21Java多執行緒併發協作訊號燈法

6.21Java多執行緒併發管程法

6.21Java多執行緒併發高階主題_定時排程問題

6.22Java多執行緒單例設計模式

6.22Java多執行緒volitale

6.22Java多執行緒happenbefore

6.23Java多執行緒CAS原子操作

6.23Java多執行緒可重入鎖實現原理

Redis6.0多執行緒模型

Junit測試例中使用多執行緒，輸出結果不正確

英特爾推出 12 代酷睿 U / P 系列移動處理器：多執行緒效能最高提升 70%，新一代輕薄本 3 月上市

6、多執行緒

淺談Java獲得多執行緒的返回結果方式(3種)

Redis 6.0 多執行緒效能測試結果及分析

多執行緒Redis

測試策略

翻車

關於Thread IO的說明

測試結果及分析

關於io-threads-do-reads引數

多執行緒版本的Redis和Redis Cluster的選擇

疑問

redis-benchmark測試現場

相關推薦