高可用Redis(六)：瑞士軍刀之bitmap，HyperLoglog和GEO

阿新 • • 發佈：2018-12-15

1.bitmap點陣圖

1.1 bitmap點陣圖的概念

首先來看一個例子，字串big，

字母b的ASCII碼為98，轉換成二進位制為 01100010
字母i的ASCII碼為105，轉換成二進位制為 01101001
字母g的ASCII碼為103，轉換成二進位制為 01100111

如果在Redis中，設定一個key，其值為big，此時可以get到big這個值，也可以獲取到 big的ASCII碼每一個位對應的值，也就是0或1

例如：

127.0.0.1:6379> set hello big
OK
127.0.0.1:6379> getbit hello 0      # b的二進位制形式的第1位，即為0
(integer) 0
127.0.0.1:6379> getbit hello 1      # b的二進位制形式的第2位，即為1
(integer) 1

big長度為3個位元組，對應的長度為24位，使用getbit命令可以獲取到big對應的位的對應的值

所以Redis是可以直接對位進行操作的

1.2 bitmap的常用命令

1.2.1 setbit命令

setbit key offset vlaue         給點陣圖指定索引設定值

例子：

127.0.0.1:6379> set hello big       # 設定鍵值對，key為'hello',value為'big'
OK
127.0.0.1:6379> setbit hello 7 1    # 把hello二進位制形式的第8位設定為1，之前的ASCII碼為98,現在改為99，即把b改為c
(integer) 0                         # 返回的是之前這個位上的值
127.0.0.1:6379> get hello           # 修改之後，獲取'hello'的值，為'cig'
"cig"

上面big的長度只有24位，如果使用setbit命令時，指定的位大於目標的長度時

127.0.0.1:6379> setbit hello 50 1
(integer) 0
127.0.0.1:6379> get hello
"cig\x00\x00\x00 "

從第25開始到第49位，中間用0來填充，第50位才會被設定為1

1.2.2 getbit命令

getbit key offset           獲取點陣圖指定索引的值

例子：

127.0.0.1:6379> getbit hello 25
(integer) 0
127.0.0.1:6379> getbit hello 49
(integer) 0
127.0.0.1:6379> getbit hello 50
(integer) 1

1.2.3 bitcount命令

bitcount key [start end]        獲取點陣圖指定範圍(start到end,單位為位元組，如果不指定就是獲取全部)位值為1的個數

例子：

127.0.0.1:6379> bitcount hello
(integer) 14
127.0.0.1:6379> bitcount hello 0 23
(integer) 14

1.2.4 bitop命令

bitop op dtstkey key [key...]       做多個bitmap的and(交集),or(並集),not(非),xor(異或)操作並將結果儲存在destkey中
bitpos key targetBit [start] [end]  計算點陣圖指定範圍(start到end,單位為位元組，如果不指定就是獲取全部)第一個偏移量對應的值等於targetBit的位置

1.3 bitmap點陣圖應用

如果一個網站有1億使用者，假如user_id用的是整型，長度為32位，每天有5千萬獨立使用者訪問，如何判斷是哪5千萬使用者訪問了網站

1.3.1 方式一：用set來儲存

使用set來儲存資料執行一天需要佔用的記憶體為

32bit * 50000000 = (4 * 50000000) / 1024 /1024 MB，約為200MB

執行一個月需要佔用的記憶體為6G，執行一年佔用的記憶體為72G

30 * 200 = 6G

1.3.2 方式二：使用bitmap的方式

如果user_id訪問網站，則在user_id的索引上設定為1，沒有訪問網站的user_id，其索引設定為0，此種方式執行一天佔用的記憶體為

1 * 100000000 = 100000000 / 1014 /1024/ 8MB，約為12.5MB

執行一個月佔用的記憶體為375MB，一年佔用的記憶體容量為4.5G

由此可見，使用bitmap可以節省大量的記憶體資源

1.4 bitmap使用經驗

bitmap是string型別，單個值最大可以使用的記憶體容量為512MB
setbit時是設定每個value的偏移量，可以有較大耗時
bitmap不是絕對好，用在合適的場景最好

2.HyperLoglog

2.1 HyperLoglog簡介

基於HyperLogLog演算法，極小空間完成獨立數量統計

2.2 常用命令

pfadd key element [element...]                  向hyperloglog新增元素
pfcount key [key...]                            計算hyperloglog的獨立總數
prmerge destkey sourcekey [sourcekey...]        合併多個hyperloglog

例子：

127.0.0.1:6379> pfadd unique_ids1 'uuid_1' 'uuid_2' 'uuid_3' 'uuid_4'       # 向unique_ids1中新增4個元素
(integer) 1
127.0.0.1:6379> pfcount unique_ids1         # 檢視unique_ids1中元素的個數
(integer) 4
127.0.0.1:6379> pfadd unique_ids1 'uuid_1' 'uuid_2' 'uuid_3' 'uuid_10'      # 再次向unique_ids1中新增4個元素
(integer) 1
127.0.0.1:6379> pfcount unique_ids1         # 由於兩次新增的value有重複，所以unique_ids1中只有5個元素
(integer) 5
127.0.0.1:6379> pfadd unique_ids2 'uuid_1' 'uuid_2' 'uuid_3' 'uuid_4'       # 向unique_ids2中新增4個元素
(integer) 1
127.0.0.1:6379> pfcount unique_ids2         # 檢視unique_ids2中元素的個數
(integer) 4
127.0.0.1:6379> pfadd unique_ids2 'uuid_4' 'uuid_5' 'uuid_6' 'uuid_7'       # 再次向unique_ids2中新增4個元素
(integer) 1
127.0.0.1:6379> pfcount unique_ids2         # 再次檢視unique_ids2中元素的個數，由於兩次新增的元素中有一個重複，所以有7個元素
(integer) 7
127.0.0.1:6379> pfmerge unique_ids1 unique_ids2     # 合併unique_ids1和unique_ids2
OK
127.0.0.1:6379> pfcount unique_ids1         # unique_ids1和unique_ids2中有重複元素，所以合併後的hyperloglog中只有8個元素
(integer) 8

2.3 HyperLoglog記憶體消耗(百萬獨立使用者)

例子：

127.0.0.1:6379> flushall            # 清空Redis中所有的key和value
OK
127.0.0.1:6379> info                # 檢視Redis佔用的記憶體量
...省略
# Memory
used_memory:833528
used_memory_human:813.99K           # 此時Redis中沒有任何鍵值對，佔用814k記憶體
used_memory_rss:5926912
used_memory_rss_human:5.65M
used_memory_peak:924056
used_memory_peak_human:902.40K
total_system_memory:1023938560
total_system_memory_human:976.50M
used_memory_lua:37888
used_memory_lua_human:37.00K
maxmemory:0
maxmemory_human:0B
maxmemory_policy:noeviction
mem_fragmentation_ratio:7.11
mem_allocator:jemalloc-3.6.0
...省略

執行如下python程式碼：

import redis
import time

client = redis.StrictRedis(host='192.168.81.101',port=6379)
key = 'unique'
start_time = time.time()

for i in range(1000000):
    client.pfadd(key,i)

等待python程式碼執行完成，再次檢視Redis佔用的記憶體數

127.0.0.1:6379> info
...省略
# Memory
used_memory:849992
used_memory_human:830.07K
used_memory_rss:5939200
used_memory_rss_human:5.66M
used_memory_peak:924056
used_memory_peak_human:902.40K
total_system_memory:1023938560
total_system_memory_human:976.50M
used_memory_lua:37888
used_memory_lua_human:37.00K
maxmemory:0
maxmemory_human:0B
maxmemory_policy:noeviction
mem_fragmentation_ratio:6.99
mem_allocator:jemalloc-3.6.0
...省略

可以看到，使用hyperloglog向redis中存入100萬條資料，需佔用的記憶體為

830.07K - 813.99K約為16k

佔用的記憶體很少。

當然天下沒有免費的午餐，hyperloglog也有非常明顯的侷限性

首先，hyperloglog有一定的錯誤率，在使用hyperloglog進行資料統計的過程中，hyperloglog給出的資料不一定是對的
按照維基百科的說法，使用hyperloglog處理10億條資料，佔用1.5Kb記憶體時，錯誤率為2%
其次，沒法從hyperloglog中取出單條資料，這很容易理解，使用16KB的記憶體儲存100萬條資料，此時還想把100萬條資料取出來，顯然是不可能的

2.4 HyperLoglog注意事項

使用hyperloglog進行資料統計時，需要考慮三個因素：

1.是否需要很少的記憶體去解決問題，
2.是否能容忍錯誤
3.是否需要單條資料

3.GEO

3.1 GEO簡介

GEO即地址資訊定位可以用來儲存經緯度，計算兩地距離，範圍計算等

如上圖中，計算北京到天津兩地之間的距離

3.2 GEO常用命令

3.2.1 geoadd命令

geoadd key longitude latitude member [longitude latitude member...]     增加地理位置資訊

如上圖是5個城市經緯度相關資料

127.0.0.1:6379> geoadd cities:locations 116.28 39.55 beijing                # 新增北京的經緯度
(integer) 1
127.0.0.1:6379> geoadd cities:locations 117.12 39.08 tianjin 114.29 38.02 shijiazhuang    # 新增天津和石家莊的經緯度
(integer) 2
127.0.0.1:6379> geoadd cities:locations 118.01 39.38 tangshan 115.29 38.51 baoding         # 新增唐山和保定的經緯度
(integer) 2

3.2.2 geppos命令

geopos key member [member...]       獲取地理位置資訊

例子：

127.0.0.1:6379> geopos cities:locations tianjin     # 獲取天津的地址位置資訊
1) 1) "117.12000042200088501"
   2) "39.0800000535766543"

3.2.3 geodist命令

geodist key member1 member2 [unit]      獲取兩個地理位置的距離,unit:m(米),km(千米),mi(英里),ft(尺)

例子：

127.0.0.1:6379> geodist cities:locations tianjin beijing km
"89.2061"
127.0.0.1:6379> geodist cities:locations tianjin baoding km
"170.8360"

3.2.4 georadius命令和georadiusbymember命令

georedius key longitude latitude radiusm|km|ft|mi [withcoord] [withdist] [withhash] [COUNT count] [asc|desc] [store key][storedist key]
georadiusbymember key member radiusm|km|ft|mi [withcoord] [withdist] [withhash] [COUNT count] [asc|desc] [store key][storedist key]
獲取指定位置範圍內的地理位置資訊集合
    withcoord:返回結果中包含經緯度
    withdist:返回結果中包含距離中心節點位置
    withhash:返回結果中包含geohash
    COUNT count:指定返回結果的數量
    asc|desc:返回結果按照距離中心節點的距離做升序或者降序
    store key:將返回結果的地理位置資訊儲存到指定鍵
    storedist key:將返回結果距離中心節點的距離儲存到指定鍵

例子：

127.0.0.1:6379> georadiusbymember cities:locations beijing 150 km   # 獲取距離北京150km範圍內的城市
1) "beijing"
2) "tianjin"
3) "tangshan"
4) "baoding"

3.3 GEO相關說明

Redis的GEO功能是從3.2版本新增
geo功能基於zset實現
geo沒有刪除命令

3.3.1 使用zrem命令來進行geo的刪除操作

命令：

zrem key member

例子：

127.0.0.1:6379> georadiusbymember cities:locations beijing 150 km
1) "beijing"
2) "tianjin"
3) "tangshan"
4) "baoding"
127.0.0.1:6379> zrem cities:locations baoding
(integer) 1
127.0.0.1:6379> georadiusbymember cities:locations beijing 150 km
1) "beijing"
2) "tianjin"
3) "tangshan"

3.4 GEO的應用場景

微信搖一搖

高可用Redis(六)：瑞士軍刀之bitmap，HyperLoglog和GEO

1.bitmap點陣圖 1.1 bitmap點陣圖的概念首先來看一個例子，字串big，字母b的ASCII碼為98，轉換成二進位制為 01100010 字母i的ASCII碼為105，轉換成二進位制為 01101001 字母g的ASCII碼為103，轉換成二進位制為 01100111 如果在Redis中，設定

高可用Redis(十)：Redis原生命令搭建叢集

1.搭建Redis Cluster主要步驟 1.配置開啟節點 2.meet 3.指派槽 4.主從關係分配 2.環境說明兩臺虛擬機器，IP地址分別為：192.168.81.100和192.168.81.101 兩臺虛擬機器作業系統均為：CentOS 7.5 64位兩臺虛擬機器系統說明：使用y

高可用Redis(八)：Redis主從複製

1.Redis複製的原理和優化 1.1 Redis單機的問題 1.1.1 機器故障在一臺伺服器上部署一個Redis節點，如果機器發生主機板損壞，硬碟損壞等問題，不能在短時間修復完成，就不能處理Redis操作了，這就是單機可能存在的問題同樣的，伺服器正常執行，但是Redis主程序發

高可用Redis(九)：Redis Sentinel

1.主從複製高可用的問題主從複製高可用的作用 1.為master提供備份，當master宕機時，slave有完整的備份資料 2.對master實現分流，實現讀寫分離但是主從架構有一個問題 1.如果master宕機，故障轉移需要手動完成或者由別的工具來完成，從slave中選擇一個slave做為新的m

高可用Redis(七)：Redis持久化

1.什麼是持久化持久化就是將資料從掉電易失的記憶體同步到能夠永久儲存的裝置上的過程 2.Redis為什麼需要持久化 redis將資料儲存在記憶體中，一旦Redis伺服器被關閉，或者執行Redis服務的主機本身被關閉的話，儲存在記憶體裡面的資料就會丟失如果僅僅將redis用作快取的話，那麼這種資料丟失帶來的

ESP32那些事兒(五)：瑞士軍刀之ESP32的常用API分析

事實上，所有在esp32上用到的api在esp-idf中都能找到，但是對於我們來講這是一個大而全的API參考指南，在專案的初期，我們沒有必要花費太多的時間詳細的閱讀每一個API的使用，挑一些常用的API進行學習，而後再根據使用情況來查詢參考文件，這樣才能達到事半功倍的效果，那

Redis瑞士軍刀:慢查詢，Pipeline和釋出訂閱

1.慢查詢 1.1 慢查詢的生命週期步驟一：client通過網路向Redis傳送一條命令步驟二：由於Redis是單執行緒應用，可以把Redis想像成一個佇列，client執行的所有命令都在排隊等著server端執行步驟三：Redis服務端按順序執行命令步驟四：server端把命令結果通過網路返回給cl

Redis高可用詳解：持久化技術及方案選擇

本文將先說明上述幾種技術分別解決了Redis高可用的什麼問題，然後詳細介紹Redis的持久化技術，主要是RDB和AOF兩種持久化方案。在介紹RDB和AOF方案時，不僅介紹其作用及操作方法，同時還會介紹持久化實現的一些原理細節及需要注意的問題。最後，介紹在實際使用中持久化方案的

高可用Redis(十一)：使用redis-trib.rb工具搭建叢集

環境說明：兩臺虛擬機器，IP地址分別為：192.168.81.100和192.168.81.101 虛擬機器系統為：CentOS 7.5 Redis為yum安裝，版本為3.2 系統環境：關閉firewalld Redis Cluster叢集節點包括：192.168.81.101機器的9000.9001,90

高可用Redis(十二)：Redis Cluster

Redis Cluster是Redis官方提供的Redis叢集功能 1.為什麼要實現Redis Cluster 1.主從複製不能實現高可用 2.隨著公司發展，使用者數量增多，併發越來越多，業務需要更高的QPS，而主從複製中單機的QPS可能無法滿足業務需求 3.資料量的考慮，現有伺服器記憶體不能滿足業務資料的需

Redis高可用詳解：持久化技術及方案選擇（推薦）--轉載自程式設計迷思部落格www.cnblogs.com/kismetv/p/8654978.html

一、Redis高可用概述在介紹Redis高可用之前，先說明一下在Redis的語境中高可用的含義。我們知道，在web伺服器中，高可用是指伺服器可以正常訪問的時間，衡量的標準是在多長時間內可以提供正常服務（99.9%、99.99%、99.999% 等等）。但是在Redis語境中，高可用的含義似乎要寬泛一些，除

效能測試二十六：環境部署之Mysql+Redis+Tomcat環境整合

系統中使用了快取+資料庫，通用讀取資料規則1、先從快取讀資料，如果有，直接返回資料；2、如果沒有，去資料庫中讀，然後再插入到快取中，再返回資料 Mysql+Redis+Tomcat環境整合 1、修改PerfTeach/WEB-INF/classes/redis-config.properties2、將re

性能測試二十六：環境部署之Mysql+Redis+Tomcat環境整合

web-inf 技術提高 tar 從數據之前 sse 取數最小系統中使用了緩存+數據庫，通用讀取數據規則1、先從緩存讀數據，如果有，直接返回數據；2、如果沒有，去數據庫中讀，然後再插入到緩存中，再返回數據 Mysql+Redis+Tomcat環境整合 1、修改Per

SharePoint 2016：效能優化和高可用（六，SharePoint 2016服務應用程式和服務的高可用性）

SharePoint 2016服務應用程式和服務的高可用性在SharePoint 2016伺服器場中使服務應用程式和服務高度可用的過程比確保Web或資料庫層的高可用性更簡單。在大多數情況下，要使服務應用程式或服務具有高可用性，必須在多個伺服器上啟動服務例項。然後，Shar

Net分布式系統之六：微服務之API網關

pan 業務邏輯 nginx clas 系統 gin 性能 blog services 　　本人建立了個人技術、工作經驗的分享微信號，計劃後續公眾號同步更新分享，比在此更多具體。歡迎有興趣的同學一起加入相互學習。基於上篇微服務架構分享，今天分享其中一個重要的基礎組件&ldq

MYSQL高可用解決方案：PHXSQL（騰訊微信）編譯實錄

mysql phxsql [root@king01 ~]# rpm -ivh epel-release-6-8.noarch.rpm[root@king01 ~]# yum install -y automake zlib autoconf cmake gcc libtool ncurses ncur

高可用Redis服務架構分析與搭建

alt server proxy 基於監控接收不可 slaves -s 基於內存的Redis應該是目前各種web開發業務中最為常用的key-value數據庫了，我們經常在業務中用其存儲用戶登陸態（Session存儲），加速一些熱數據的查詢（相比較mysql而言，速度有

Docker(六)：Docker 三劍客之 Docker Swarm

lib ini 節點數 box 流量虛擬 .html 刪除解釋實踐中會發現，生產環境中使用單個 Docker 節點是遠遠不夠的，搭建 Docker 集群勢在必行。然而，面對 Kubernetes, Mesos 以及 Swarm 等眾多容器集群系統，我們該如何選擇呢？它

高可用Redis服務架構分析與搭建！

size 回調運行 .com red 復雜指導地址 ado 基於內存的Redis應該是目前各種Web開發業務中最為常用的Key-Value數據庫了，我們經常在業務中用其存儲用戶登陸態（Session存儲），加速一些熱數據的查詢（相比較MySQL而言，速度有數量級的提升

如何搭建高可用redis架構？

一定的啟動 down size 新特性消息秒級客戶端請求 image 1 題記 Redis 是一個開源的使用 ANSI C 語言編寫、支持網絡、可基於內存亦可持久化的日誌型、Key-Value 數據庫，並提供多種語言的 API。如今，互聯網業務的數據正以更快的速度

高可用Redis(六)：瑞士軍刀之bitmap，HyperLoglog和GEO

1.bitmap點陣圖

1.1 bitmap點陣圖的概念

1.2 bitmap的常用命令

1.2.1 setbit命令

1.2.2 getbit命令

1.2.3 bitcount命令

1.2.4 bitop命令

1.3 bitmap點陣圖應用

1.3.1 方式一：用set來儲存

1.3.2 方式二：使用bitmap的方式

1.4 bitmap使用經驗

2.HyperLoglog

2.1 HyperLoglog簡介

2.2 常用命令

2.3 HyperLoglog記憶體消耗(百萬獨立使用者)

2.4 HyperLoglog注意事項

3.GEO

3.1 GEO簡介

3.2 GEO常用命令

3.2.1 geoadd命令

3.2.2 geppos命令

3.2.3 geodist命令

3.2.4 georadius命令和georadiusbymember命令

3.3 GEO相關說明

3.3.1 使用zrem命令來進行geo的刪除操作

3.4 GEO的應用場景

相關推薦