redis的五種數據結構及其使用場景
根據http://www.cleey.com/blog/single/id/808.html整理
1. String
常用命令:
get、set、incr、decr、mget等
應用場景:
String是最常用的數據類型,普通的key/value都可以歸為此類,value其實不僅是String,也可以是數字。
比如想知道什麽時候封鎖一個IP地址(訪問超過幾次)。INCRBY命令讓這些變得很容易,通過原子遞增保持計數。
實現方式:
m,decr等操作時會轉成數值型進行計算,此時redisObject的encoding字段為int。
2.Hash
常用命令:
hget、hset、hgetall等
應用場景:
比如我們要存儲一個用戶的信息,包含以下信息:
用戶ID,為查找的key
存儲的value用戶對象包含姓名name,年齡age,生日birthday 等信息
如果以普通的key/value結構存儲,主要有以下兩種存儲方式:
第一種方式將用戶id作為key,其他信息封裝成對象以序列化的方式存儲,如
set u001 "李三,18,20010101"
這種方式的缺點,增加了序列化/反序列化的開銷;需要修改其中一項信息時,需要把整個對象取回,修改操作需要對並發進行保護,引入CAS等復雜問題。
第二種方式是這個用戶信息有多少成員就存成多少個key-value對,用用戶id+對應屬性名稱作為唯一的標識來取得對應屬性的值,如:
mset user:001:name "李三 "user:001:age18 user:001:birthday "20010101"
雖然省去了序列化開銷和並發問題,但是用戶ID為重復存儲,如果存在大量這樣的數據,內存浪費較大。
redis提供的hash很好的解決了這個問題,redis的hash實際是內部存儲的value為一個HashMap,並且提供了直接存取這個map的成員接口。如
hmset user:001 name "李三" age 18 birthday "20010101"
也就是說,key仍然是用戶id,value是一個map,這個map的key是成員的屬性名,value是屬性值。
這裏同時需要註意,Redis提供了接口(hgetall)可以直接取到全部的屬性數據,但是如果內部Map的成員很多,那麽涉及到遍歷整個內部Map的操作,由於Redis單線程模型的緣故,這個遍歷操作可能會比較耗時,而另其它客戶端的請求完全不響應,這點需要格外註意。
實現方式:
Redis的Hash對應的Value內部實際就是一個HashMap,實際有兩種不同的實現,如果成員較少時,Redis為了節省內存會采用類似一維數組方式存儲,對應的value RedisObject的encoding為zipmap,當成員數量增大時會自動轉成真正的HashMap,此時encoding為ht。
3.List
常用命令:
lpush,rpush,lpop,rpop,lrange,BLPOP(阻塞版)等。
應用場景:
最新消息排行。
消息隊列。利用Lists的push的操作,將任務存儲在list中,然後工作線程再用pop操作將任務取出進行執行。
實現方式:
redis list的實現是一個雙向鏈表,可以支持反向查找和遍歷,更方便操作,不過帶來了部分額外的內存開銷,redis內部的很多實現,包括發送緩沖隊列等也都用的是這個數據結構。
4. Set
常用命令:
sadd,srem,spop,sdiff ,smembers,sunion 等。
應用場景:
set類似list,特殊之處是set可以自動排重。
set還提供了某個成員是否在一個set內的接口,這個也是list沒有的。
比如在微博應用中,每個人的好友存在一個集合(set)中,這樣求兩個人的共同好友的操作,可能就只需要用求交集命令即可。
Redis還為集合提供了求交集、並集、差集等操作。
實現方式:
set內部實現是一個value永遠為null的HashMap,實際就是通過hash的方式快速排重的。
5. Sort Set
常用命令:
zadd,zrange,zrem,zcard等
使用場景:
sorted set的使用場景與set類似,區別是set不是自動有序的,而sorted set可以通過用戶額外提供一個優先級(score)的參數來為成員排序,並且是插入有序的,即自動排序。
比如:twitter 的public timeline可以以發表時間作為score來存儲,這樣獲取時就是自動按時間排好序的。
比如:全班同學成績的SortedSets,value可以是同學的學號,而score就可以是其考試得分,這樣數據插入集合的,就已經進行了天然的排序。
另外還可以用Sorted Sets來做帶權重的隊列,比如普通消息的score為1,重要消息的score為2,然後工作線程可以選擇按score的倒序來獲取工作任務。讓重要的任務優先執行。
需要精準設定過期時間的應用
比如你可以把上面說到的sorted set的score值設置成過期時間的時間戳,那麽就可以簡單地通過過期時間排序,定時清除過期數據了,不僅是清除Redis中的過期數據,你完全可以把Redis裏這個過期時間當成是對數據庫中數據的索引,用Redis來找出哪些數據需要過期刪除,然後再精準地從數據庫中刪除相應的記錄。
實現方式:
Redis sorted set的內部使用HashMap和跳躍表(SkipList)來保證數據的存儲和有序,HashMap裏放的是成員到score的映射,而跳躍表裏存放的是所有的成員,排序依據是HashMap裏存的score,使用跳躍表的結構可以獲得比較高的查找效率,並且在實現上比較簡單。
此外,redis還有兩個特性
1. 消息訂閱
Pub/Sub 從字面上理解就是發布(Publish)與訂閱(Subscribe),在Redis中,你可以設定對某一個key值進行消息發布及消息訂閱,
當一個key值上進行了消息發布後,所有訂閱它的客戶端都會收到相應的消息。這一功能最明顯的用法就是用作實時消息系統,比如普通的即時聊天,群聊等功能。
客戶端1:subscribe rain
客戶端2:PUBLISH rain "my love!!!"
(integer) 2 代表有幾個客戶端訂閱了這個消息
2. transaction
Redis的Transactions提供的並不是嚴格的ACID的事務(比如一串用EXEC提交執行的命令,在執行中服務器宕機,那麽會有一部分命令執行了,剩下的沒執行),但是這個Transactions還是提供了基本的命令打包執行的功能(在服務器不出問題的情況下,可以保證一連串的命令是順序在一起執行的,中間有會有其它客戶端命令插進來執行)。
Redis還提供了一個Watch功能,你可以對一個key進行Watch,然後再執行Transactions,在這過程中,如果這個Watched的值進行了修改,那麽這個Transactions會發現並拒絕執行。
redis的五種數據結構及其使用場景