redis-13-記憶體優化
一、特殊編碼:
自從Redis 2.2之後,很多資料型別都可以通過特殊編碼的方式來進行儲存空間的優化。其中,Hash、List和由Integer組成的Sets都可以通過該方式來優化儲存結構,以便佔用更少的空間,在有些情況下,可以省去9/10的空間。
這些特殊編碼對於Redis的使用而言是完全透明的,事實上,它只是CPU和記憶體之間的一個交易而言。如果記憶體使用率方面高一些,那麼在操作資料時消耗的CPU自然要多一些,反之亦然。在Redis中提供了一組配置引數用於設定與特殊編碼相關的各種閾值,如:
#如果Hash中欄位的數量小於引數值,Redis將對該Key的Hash Value採用特殊編碼。
hash-max-zipmap-entries 64
#如果Hash中各個欄位的最大長度不超過512位元組,Redis也將對該Key的Hash Value採用特殊編碼方式。
hash-max-zipmap-value 512
#下面兩個引數的含義基本等同於上面兩個和Hash相關的引數,只是作用的物件型別為List。
list-max-ziplist-entries 512
list-max-ziplist-value 64
#如果set中整型元素的數量不超過512時,Redis將會採用該特殊編碼。
set-max-intset-entries 512
倘若某個已經被編碼的值再經過修改之後超過了配置資訊中的最大限制,那麼Redis會自動將其轉換為正常編碼格式,這一操作是非常快速的,但是如果反過來操作,將一個正常編碼的較大值轉換為特殊編碼,Redis的建議是,在正式做之前最好先簡單測試一下轉換效率,因為這樣的轉換往往是非常低效的。
二、BIT和Byte級別的操作:
從Redis 2.2開始,Redis提供了GETRANGE/SETRANGE/GETBIT/SETBIT四個用於字串型別Key/Value的命令。通過這些命令,我們便可以像運算元組那樣來訪問String型別的值資料了。比如唯一標識使用者身份的ID,可能僅僅是String值的其中一段子字串。這樣就可以通過GETRANGE/SETRANGE命令來方便的提取。再有就是可以使用BITMAP來表示使用者的性別資訊,如1表示male,0表示female。用這種方式來表示100,000,000個使用者的性別資訊時,也僅僅佔用12MB的儲存空間,與此同時,在通過SETBIT/GETBIT命令進行資料遍歷也是非常高效的。
三、儘可能使用Hash:
由於小的Hash型別資料佔用的空間相對較少,因此我們在實際應用時應該儘可能的考慮使用Hash型別,比如使用者的註冊資訊,這其中包括姓名、性別、email、年齡和口令等欄位。我們當然可以將這些資訊以Key的形式進行儲存,而使用者填寫的資訊則以String Value的形式儲存。然而Redis則更為推薦以Hash的形式儲存,以上資訊則以Field/Value的形式表示。
現在我們就通過學習Redis的儲存機制來進一步證明這一說法。在該篇部落格的開始處已經提到了特殊編碼機制,其中有兩個和Hash型別相關的配置引數:hash-max-zipmap-entries和hash-max-zipmap-value。至於它們的作用範圍前面已經給出,這裡就不再過多的贅述了。現在我們先假設儲存在Hash Value中的欄位數量小於hash-max-zipmap-entries,而每個元素的長度又同時小於hash-max-zipmap-value。這樣每當有新的Hash型別的Key/Value儲存時,Redis都會為Hash Value建立定長的空間,最大可預分配的位元組數為:
total_bytes = hash-max-zipmap-entries * hash-max-zipmap-value
這樣一來,Hash中所有欄位的位置已經預留,並且可以像訪問陣列那樣隨機的訪問Field/Value,他們之間的步長間隔為hash-max-zipmap-value。只有當Hash Value中的欄位數量或某一新元素的長度分別超過以上兩個引數值時,Redis才會考慮將他們以Hash Table的方式進行重新儲存,否則將始終保持這種高效的儲存和訪問方式。不僅如此,由於每個Key都要儲存一些關聯的系統資訊,如過期時間、LRU等,因此和String型別的Key/Value相比,Hash型別極大的減少了Key的數量(大部分的Key都以Hash欄位的形式表示並存儲了),從而進一步優化了儲存空間的使用效率。