1. 程式人生 > 其它 >資料庫快取服務——NoSQL之Redis配置與優化

資料庫快取服務——NoSQL之Redis配置與優化

快取概念

快取是為了調節速度不一致的兩個或多個不同的物質的速度,在中間對速度較慢的一方起到加速作用,比如CPU的一級、二級快取是儲存了CPU最近經常訪問的資料,記憶體是儲存CPU經常訪問硬碟的資料,而且硬碟也有大小不一的快取,甚至是物理伺服器的raid 卡有也快取,都是為了起到加速CPU 訪問硬碟資料的目的,因為CPU的速度太快了,CPU需要的資料由於硬碟往往不能在短時間內滿足CPU的需求,因此CPU快取、記憶體、Raid 卡快取以及硬碟快取就在一定程度上滿足了CPU的資料需求,即CPU 從快取讀取資料可以大幅提高CPU的工作效率。

系統快取

buffer與cache:

  • buffer: 緩衝也叫寫緩衝,一般用於寫操作,可以將資料先寫入記憶體再寫入磁碟,buffer 一般用於寫緩衝,用於解決不同介質的速度不一致的緩衝,先將資料臨時寫入到裡自己最近的地方,以提高寫入速度,CPU會把資料先寫到記憶體的磁碟緩衝區,然後就認為資料已經寫入完成看,然後由核心在後續的時間在寫入磁碟,所以伺服器突然斷電會丟失記憶體中的部分資料。
  • cache: 快取也叫讀快取,一般用於讀操作,CPU讀檔案從記憶體讀,如果記憶體沒有就先從硬碟讀到記憶體再讀到CPU,將需要頻繁讀取的資料放在裡自己最近的快取區域,下次讀取的時候即可快速讀取。

 快取儲存位置及分層結構

網際網路應用領域,提到快取為王。

  • 使用者層:瀏覽器DNS快取,應用程式DNS快取,作業系統DNS快取客戶端
  • 代理層:CDN,反向代理快取
  • Web層:Web伺服器快取
  • 應用層:頁面靜態化
  • 資料層:分散式快取,資料庫
  • 系統層:作業系統cache
  • 物理層:磁碟cache, Raid Cache

關係型資料庫與非關係型資料庫

關係型資料庫:特別適合高事務性要求和需要控制執行計劃的任務,事務細粒度控制更好。

非關係型資料庫:事務控制會稍顯弱勢,其價值點在於高擴充套件性和大資料量處理方面。

關係型資料庫(SQL)

  • 關係型資料庫是一個結構化的資料庫,建立在關係模型(二維表格模型)基礎上,一般面向於記錄。
  • SQL語句(標準資料查詢語言)就是一種基於關係型資料庫的語言,用於執行對關係型資料庫中資料的檢索和操作。
  • 主流的關係型資料庫包括Oracle、 MySQL、SQL Server、Microsoft Access、 DB2、PostgreSQL 等。

以上資料庫在使用的時候必須先建庫建表設計表結構,然後儲存資料的時候按表結構去存,如果資料與表結構不匹配就會儲存失敗。

非關係型資料庫(NoSQL)

  • NoSQL(NoSQL=NotonlysQL),意思是“不僅僅是SQL",是非關係型資料庫的總稱。
  • 除了主流的關係型資料庫外的資料庫,都認為是非關係型。
  • 不需要預先建庫建表定義資料儲存表結構,每條記錄可以有不同的資料型別和欄位個數(比如微信群聊裡的文字、圖片、視訊、音樂等)。
  • 主流的NOSQL 資料庫有Redis、MongBD、 Hbase(分散式非關係型資料庫,大資料使用)、Memcached、ElasticSearch(簡稱ES,索引型資料庫)、TSDB(時續型資料庫) 等。

關係型資料庫和非關係型資料庫區別:

1. 資料儲存方式不同

關係型和非關係型資料庫的主要差異是資料儲存的方式。

  • 關係型資料天然就是表格式的,因此儲存在資料表的行和列中。資料表可以彼此關聯協作儲存,也很容易提取資料。
  • 與其相反,非關係型資料不適合儲存在資料表的行和列中,而是大塊組合在一起。非關係型資料通常儲存在資料集中,就像文件、鍵值對或者圖結構。你的資料及其特性是選擇資料儲存和提取方式的首要影響因素。(很容易切換資料型別,一個數據集當中有多種資料型別)

2. 擴充套件方式不同

SQL和NoSQL資料庫最大的差別可能是在擴充套件方式上,要支援日益增長的需求當然要擴充套件。

  • 要支援更多併發量,SQL資料庫是縱向擴充套件,也就是說提高處理能力,使用速度更快速的計算機,這樣處理相同的資料集就更快了。因為資料儲存在關係表中,操作的效能瓶頸可能涉及很多個表,這都需要通過提高計算機效能來克服。雖然SQI資料庫有很大打展空間,但最終肯定會達到縱向擴充套件的上限。(資料一般儲存在本地的檔案系統中。讀可以通過讀寫分離、負載均衡來分攤效能,但讀寫仍然很消耗IO效能)
  • 而NoSQL資料庫是橫向擴充套件的。因為非關係型資料儲存天然就是分散式的,NoSQL資料庫的擴充套件可以通過給資源池新增更多普通的資料庫伺服器(節點)來分擔負載。(資料分佈儲存在不同伺服器上,可以併發地讀寫,加快效率)

3. 對事務性的支援不同

  • 如果資料操作需要高事務性或者複雜資料查詢需要控制執行計劃,那麼傳統的SQL資料庫從效能和穩定性方面考慮是你的最佳選擇。SQL資料庫支援對事務原子性細粒度控制,並且易於回滾事務。
  • 雖然NoSQL資料庫也可以使用事務操作,但穩定性方面沒法和關係型資料庫比較,所以它們真正閃亮的價值是在操作的擴充套件性和大資料量處理方面。
  • 非關係型資料庫在事務的處理和穩定性方面,不如關係型資料庫。但讀寫效能好、易於擴充套件,處理大資料方面佔優勢。

非關係型資料庫產生背景

可用於應對Web2.0純動態網站型別的三高問題。

(1)High performance —— 對資料庫高併發讀寫需求。

(2)Hugestorage——對海量資料高效儲存與訪問需求。

(3)HighScalability&&HighAvailability——對資料庫高可擴充套件性與高可用性需求。

關係型資料庫和非關係型資料庫都有各自的特點與應用場景,兩者的緊密結合將會給web2.0的資料庫發展帶來新的思路。讓關係型資料庫關注在關係上和對資料的一致性保障,非關係型資料庫關注在儲存和高效率上。例如,在讀寫分離的MySQI資料庫環境中,可以把經常訪問的資料(即高熱資料)儲存在非關係型資料庫中,提升訪問速度

Redis簡介

Redis (遠端字典伺服器)是一個 開源的、使用C語言編寫的NoSQL 資料庫。

Redis 基於記憶體執行並支援持久化,採用key-value (鍵值對)的儲存形式,是目前分散式架構中不可或缺的一環。

Redis伺服器程式是單程序模型,也就是在一臺伺服器上可以同時啟動多個Redis程序,Redis的實際處理速度則是完全依靠於主程序的執行效率。

  • 若在伺服器上只執行一個Redis程序,當多個客戶端同時訪問時,伺服器的處理能力是會有一定程度的下降;
  • 若在同一臺伺服器上開啟多個Redis程序,Redis在提高併發處理能力的同時會給伺服器的CPU造成很大壓力。

即:在實際生產環境中,需要根據實際的需求來決定開啟多少個Redis程序。若對高併發要求更高一些,可能會考慮在同一臺伺服器上開啟多個程序。若CPU資源比較緊張,採用單程序即可。

Redis的優點

(1)具有極高的資料讀寫速度: 資料讀取的速度最高可達到110000 次/s,資料寫入速度最高可達到81000次/s。

(2)支援的資料結構: key-value,支援豐富的資料型別:Strings、 Lists、Hashes、 Sets 及Sorted Sets 等資料型別操作。

  • Strings 字串型
  • Lists 列表型
  • Hashes 雜湊(雜湊)
  • Sets 無序集合
  • Sorted Sets 有序集合(或稱zsets)

(redis也可以做訊息佇列,可以通過Sorted Sets實現)

(3)支援資料的持久化: 可以將記憶體中的資料儲存在磁碟中,重啟的時候可以再次載入進行使用。

(4)原子性: Redis所有操作都是原子性的。(支援事務,所有操作都作為事務)

(5)支援資料備份: 即 master-salve 模式的資料備份。(支援主從複製)

Redis的缺點

  1. 快取和資料庫雙寫一致性問題
  2. 快取雪崩問題
  3. 快取擊穿問題
  4. 快取的併發競爭問題

Redis的適用場景

  • Redis作為基於記憶體執行的資料庫,是一個高效能的快取,一般應用在session快取、 佇列、排行榜、計數器、最近最熱文章、最近最熱評論、釋出訂閱等。
  • Redis適用於資料實時性要求高、資料儲存有過期和淘汰特徵的、不需要持久化或者只需要保證弱一致性、邏輯簡單的場景。

Redis速度快的原因

  • 基於記憶體執行
  • 採用單執行緒處理資料的讀寫(減少鎖競爭和執行緒切換的消耗)
  • 採用IO多路複用機制(可以讓單執行緒處理多個連線請求,減少網路IO的消耗)

Redis安裝部署

1. 關閉防火牆和安全功能

systemctl stop firewalld
setenforce 0

2. 編譯安裝redis

cd /opt/
yum install -y gcc gcc-c++ make

tar zxvf redis-5.0.7.tar.gz 

cd /opt/redis-5.0.7/
make && make PREFIX=/usr/local/redis install

3. 執行軟體包自帶的install_server.sh指令碼檔案設定redid服務相關配置

cd /opt/redis-5.0.7/utils
./install_server.sh
……
慢慢回車4次
Please select the redis executable path []
手動輸入  /usr/local/redis/bin/redis-server
#要一次性輸入正確,不然還要重新執行
Selected config:
Port           : 6379                                #預設偵聽埠為6379
Config file    : /etc/redis/6379.conf                #配置檔案路徑
Log file       : /var/log/redis_6379.log            #日誌檔案路徑
Data dir       : /var/lib/redis/6379                #資料檔案路徑
Executable     : /usr/local/redis/bin/redis-server    #可執行檔案路徑
Cli Executable : /usr/local/bin/redis-cli            #客戶端命令工具

4. 把redis的可執行程式檔案放入路徑環境變數的目錄中便於系統識別

ln -s /usr/local/redis/bin/* /usr/local/bin/

#當install_server.sh 指令碼執行完畢,Redis服務就已經啟動,預設偵聽埠為6379
netstat -natp | grep redis

#redis服務控制
/etc/init.d/redis_6379 stop                #停止
/etc/init.d/redis_6379 start            #啟動
/etc/init.d/redis_6379 restart            #重啟
/etc/init.d/redis_6379 status            #狀態

5. 修改配置 /etc/redis/6379.conf 引數

vim /etc/redis/6379.conf

#70行;新增;監聽的主機地址
bind 127.0.0.1 192.168.136.10                
#93行;Redis預設的監聽埠
port 6379                                    
#137行;啟用守護程序
daemonize yes                            
#159行;指定 PID 檔案
pidfile /var/run/redis_6379.pid                
#167行;日誌級別
loglevel notice                                
#172行;指定日誌檔案
logfile /var/log/redis_6379.log                
#重啟redis服務
/etc/init.d/redis_6379 restart

Redis 命令工具

redis-server        用於啟動 Redis 的工具
redis-benchmark        用於檢測 Redis 在本機的執行效率
redis-check-aof        修復 AOF 持久化檔案
redis-check-rdb        修復 RDB 持久化檔案
redis-cli             Redis命令列工具

1. redis-cli 命令列工具

語法:redis-cli -h host -p port -a password

-h    指定遠端主機
-p    指定 Redis 服務的埠號
-a    指定密碼,未設定資料庫密碼可以省略-a 選項
若不新增任何選項表示,則使用 127.0.0.1:6379 連線本機上的 Redis 資料庫
例:
redis-cli -h 192.168.136.10 -p 6379
#此時無密碼,不需要-a直接登陸

2. redis-benchmark 測試工具

redis-benchmark 是官方自帶的Redis效能測試工具,可以有效的測試 Redis服務的效能

語法:redis-benchmark [選項]  [選項值]
-h    指定伺服器主機名
-p    指定伺服器埠
-s    指定伺服器socket
-c    指定併發連線數
-n    指定請求數
-d    以位元組的形式指定 SET/GET 值的資料大小。
-k    1=keep alive 0=reconnect 
-r    SET/GET/INCR 使用隨機 key, SADD使用隨機值
-P    通過管道傳輸請求
-q    強制退出 redis。僅顯示query/sec值
–csv    以CSV格式輸出
-l    生成迴圈,永久執行測試
-t    僅執行以逗號分隔的測試命令列表
-I    Idle 模式。僅開啟N個idle連線並等待

向 IP 地址為 192.168.136.10、埠為 6379 的 Redis 伺服器傳送 100 個併發連線與 100000 個請求測試效能
redis-benchmark -h 192.168.136.10 -p 6379 -c 100 -n 100000

測試存取大小為 100 位元組的資料包的效能
redis-benchmark -h 192.168.136.10 -p 6379 -q -d 100

測試本機上 Redis 服務在進行 set 與 lpush 操作時的效能
redis-benchmark -t set,lpush -n 100000 -q

2. redis-benchmark 測試工具

redis-benchmark 是官方自帶的Redis效能測試工具,可以有效的測試 Redis服務的效能

語法:redis-benchmark [選項]  [選項值]
-h    指定伺服器主機名
-p    指定伺服器埠
-s    指定伺服器socket
-c    指定併發連線數
-n    指定請求數
-d    以位元組的形式指定 SET/GET 值的資料大小。
-k    1=keep alive 0=reconnect 
-r    SET/GET/INCR 使用隨機 key, SADD使用隨機值
-P    通過管道傳輸請求
-q    強制退出 redis。僅顯示query/sec值
–csv    以CSV格式輸出
-l    生成迴圈,永久執行測試
-t    僅執行以逗號分隔的測試命令列表
-I    Idle 模式。僅開啟N個idle連線並等待

向 IP 地址為 192.168.136.10、埠為 6379 的 Redis 伺服器傳送 100 個併發連線與 100000 個請求測試效能
redis-benchmark -h 192.168.136.10 -p 6379 -c 100 -n 100000

測試存取大小為 100 位元組的資料包的效能
redis-benchmark -h 192.168.136.10 -p 6379 -q -d 100

測試本機上 Redis 服務在進行 set 與 lpush 操作時的效能
redis-benchmark -t set,lpush -n 100000 -q

Redis 資料庫常用命令

1. 存放/獲取資料——set/get

set:存放資料,命令格式為 set key value
get:獲取資料,命令格式為 get key

例:
redis-cli -p 6379

set name zhangsan #存放資料name值為張三
get name  #獲取name的值

2. 結合萬用字元檢視鍵值列表——keys

#keys     命令可以取符合規則的鍵值列表,通常情況可以結合*、?等選項來使用。
keys *    #檢視當前資料庫中所有的資料
keys v*      #檢視當前資料庫中以v開頭的資料
keys v??  #檢視當前資料庫中以v開頭後面包含任意一位的資料
keys v??  #檢視當前資料庫中以v開頭後面包含任意兩位的資料

3. 判斷鍵值是否存在——exists

語法:exists  [鍵]
返回值為1表示存在,0表示不存在

exists name
exists aaaa

4. 刪除當前資料庫的指定key——del

語法:del  [鍵]

keys *
del name
keys *

5. 獲取key對應的value值型別——type

語法:type  [鍵]

6. 對已有key進行重新命名(覆蓋)——rename

命令格式:rename 源key 目標key

使用rename命令進行重新命名時,無論目標key是否存在都進行重新命名,且源key的值會覆蓋目標key的值。
在實際使用過程中,建議先用exists命令檢視目標key是否存在,然後再決定是否執行rename命令,以避免覆蓋重要資料。

7. 對已有key進行重新命名(不覆蓋)——renamex

語法:renamex 源key 目標key
#renamenx 命令是對已有key進行重新命名,並檢測新名是否存在,如果目標 key 存在則不進行重新命名(不覆蓋)

8. 檢視當前資料庫中key的數目——dbsize

dbsize 命令的作用是檢視當前資料庫中 key 的數目。
例:
keys *
dbsize

9. 設定密碼

#設定密碼
config set requirepass password

#檢視密碼(一旦設定密碼,必須先驗證通過密碼,否則所有操作不可用)
auth 密碼
config get requirepass

#刪除密碼
auth 密碼
config get requirepass ''

例:
config set requirepass abc123
auth abc123
config get requirepass
quit
redis-cli
keys *
auth abc123
keys * 

Redis多資料庫之間常用命令

Redis 支援多資料庫,Redis預設情況下包含16個數據庫,資料庫名稱是用數字0-15來依次命名的。

使用redis-cli連線Redis資料庫後,預設使用的是序號為0的資料庫。

多資料庫相互獨立,互不干擾。

多資料庫間切換select

命令格式:select 序號
 ​
 #使用redis-cli連線Redis資料庫後,預設使用的是序號為0的資料庫。
 127.0.0.1:6379>select 10      #切換至序號為10的資料庫
 ​
 127.0.0.1:6379[10]>select 15  #切換至序號為15的資料庫
 ​
 127.0.0.1:6379[15]>select 0   #切換至序號為0的資料庫
 ​
 127.0.0.1:6379[0]>

多資料庫間移動資料

命令格式:move 鍵值 序號
 ​
 #示例:
 127.0.0.1:6379> set a1 100    #在資料庫0中設定鍵k1
 OK
 127.0.0.1:6379> get a1        #檢視鍵k1的值,為100
 "100"
 127.0.0.1:6379> select 1       #切換至目標資料庫1
 OK  
 127.0.0.1:6379[1]> get a1      #資料庫1無法檢視到k1的值
 (nil)
 127.0.0.1:6379[1]> select 0    #切換至目標資料庫0
 OK
 127.0.0.1:6379> get a1         #檢視目標資料是否存在
 "100"
 127.0.0.1:6379> move a1 1      #將資料庫0中k1移動到資料庫1中
 (integer) 1
 127.0.0.1:6379> select 1       #切換至目標資料庫1
 OK
 127.0.0.1:6379[1]> get a1      #檢視被移動資料
 "100"
 127.0.0.1:6379[1]> select 0    #切換到資料庫0
 OK
 127.0.0.1:6379> get a1         #在資料庫0中無法檢視到k1的值
 (nil)

清除資料庫內資料

 FLUSHDB:清空當前資料庫資料
 FLUSHALL:清空所有資料庫的資料,慎用!!!

例:

192.168.136.10:6379[1]> keys *      #資料庫1中有1個鍵
 1) "a1"
 192.168.136.10:6379[1]> flushdb     #清空當前資料庫的資料
 OK
 192.168.136.10:6379[1]> keys *      #資料庫1已無資料 (empty list or set)
 192.168.136.10:6379[1]> select 0    #切換到資料庫0 OK
 192.168.136.10:6379> keys *         #資料庫0的資料仍然存在
 192.168.136.10:6379>

Redis 運維的故障與處理方法

Redis常見運維故障

  1. 使用 keys* 把庫堵死。——建議使用別名把這個命令改名。
  2. 超過記憶體使用後,部分資料被刪除。——這個有刪除策略的,選擇適合自己的即可。
  3. 沒開持久化,卻重啟了例項,資料全掉。——記得非快取的資訊需要開啟持久化。
  4. RDB的持久化需要 Vm.overcommit_memory=1 ,否則會持久化失敗。
  5. 沒有持久化情況下,主從,主重啟太快,從還沒認為主掛的情況下,從會清空自己的資料,人為重啟主節點前,先關閉從節點的同步。

Redis故障排查

  1. 結合Redis 監控檢視QPS、快取命中率、記憶體使用率等資訊。
  2. 確認機器層面的資源是否有異常。
  3. 故障時及時上機,使用 redis-cli monitor 打印出操作日誌,然後分析(事後分析此條失效)。
  4. 和研發溝通,確認是否有大Key在堵塞(大Key也可以在日常的巡檢中獲得) 和組內同事溝通,確實是否有誤操作。
  5. 和運維同事、研發一起排查流量是否正常,是否存在被刷的情況。