面試突擊 | Redis 如何從海量資料中查詢出某一個 Key？附視訊

阿新 • • 發佈：2020-02-27

1 考察知識點

本題考察的知識點有以下幾個：

Keys 和 Scan 的區別
Keys 查詢的缺點
Scan 如何使用？
Scan 查詢的特點

2 解答思路

Keys 查詢存在的問題
Scan 的使用
Scan 的特點

3 Keys 使用相關

1）Keys 用法如下

2）Keys 存在的問題

此命令沒有分頁功能，我們只能一次性查詢出所有符合條件的 key 值，如果查詢結果非常巨大，那麼得到的輸出資訊也會非常多；
keys 命令是遍歷查詢，因此它的查詢時間複雜度是 o(n)，所以資料量越大查詢時間就越長。

4 Scan 使用相關

我們先來模擬海量資料，使用 Pipeline 新增 10w 條資料，Java 程式碼實現如下：

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;
import utils.JedisUtils;

public class ScanExample {
    public static void main(String[] args) {
        // 新增 10w 條資料
        initData();
    }
    public static void initData(){
        Jedis jedis = JedisUtils.getJedis();
        Pipeline pipe = jedis.pipelined();
        for (int i = 1; i < 100001; i++) {
            pipe.set("user_token_" + i, "id" + i);
        }
        // 執行命令
        pipe.sync();
        System.out.println("資料插入完成");
    }
}

我們來查詢使用者 id 為 9999* 的資料，Scan 命令使用如下：

127.0.0.1:6379> scan 0 match user_token_9999* count 10000
1) "127064"
2) 1) "user_token_99997"
127.0.0.1:6379> scan 127064 match user_token_9999* count 10000
1) "1740"
2) 1) "user_token_9999"
127.0.0.1:6379> scan 1740 match user_token_9999* count 10000
1) "21298"
2) 1) "user_token_99996"
127.0.0.1:6379> scan 21298 match user_token_9999* count 10000
1) "65382"
2) (empty list or set)
127.0.0.1:6379> scan 65382 match user_token_9999* count 10000
1) "78081"
2) 1) "user_token_99998"
   2) "user_token_99992"
127.0.0.1:6379> scan 78081 match user_token_9999* count 10000
1) "3993"
2) 1) "user_token_99994"
   2) "user_token_99993"
127.0.0.1:6379> scan 3993 match user_token_9999* count 10000
1) "13773"
2) 1) "user_token_99995"
127.0.0.1:6379> scan 13773 match user_token_9999* count 10000
1) "47923"
2) (empty list or set)
127.0.0.1:6379> scan 47923 match user_token_9999* count 10000
1) "59751"
2) 1) "user_token_99990"
   2) "user_token_99991"
   3) "user_token_99999"
127.0.0.1:6379> scan 59751 match user_token_9999* count 10000
1) "0"
2) (empty list or set)

從以上的執行結果，我們看出兩個問題：

查詢的結果為空，但遊標值不為 0，表示遍歷還沒結束；
設定的是 count 10000，但每次返回的數量都不是 10000，且不固定，這是因為 count 只是限定伺服器單次遍歷的字典槽位數量 (約等於)，而不是規定返回結果的 count 值。

相關語法：scan cursor [MATCH pattern] [COUNT count]

其中：

cursor：游標位置，整數值，從 0 開始，到 0 結束，查詢結果是空，但遊標值不為 0，表示遍歷還沒結束；
match pattern：正則匹配欄位；
count：限定伺服器單次遍歷的字典槽位數量 (約等於)，只是對增量式迭代命令的一種提示 (hint)，並不是查詢結果返回的最大數量，它的預設值是 10。

5 Scan 程式碼實戰

本文我們使用 Java 程式碼來實現 Scan 的查詢功能，程式碼如下：

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import utils.JedisUtils;

public class ScanExample {
    public static void main(String[] args) {
        Jedis jedis = JedisUtils.getJedis();
        // 定義 match 和 count 引數
        ScanParams params = new ScanParams();
        params.count(10000);
        params.match("user_token_9999*");
        // 遊標
        String cursor = "0";
        while (true) {
            ScanResult<String> res = jedis.scan(cursor, params);
            if (res.getCursor().equals("0")) {
                // 表示最後一條
                break;
            }
            cursor = res.getCursor(); // 設定遊標
            for (String item : res.getResult()) {
                // 列印查詢結果
                System.out.println("查詢結果：" + item);
            }
        }
    }
}

以上程式執行結果如下：

查詢結果：user_token_99997

查詢結果：user_token_9999

查詢結果：user_token_99996

查詢結果：user_token_99998

查詢結果：user_token_99992

查詢結果：user_token_99994

查詢結果：user_token_99993

查詢結果：user_token_99995

查詢結果：user_token_99990

查詢結果：user_token_99991

查詢結果：user_token_99999

6 總結

通過本文我們瞭解到，Redis 中如果要在海量的資料資料中，查詢某個資料應該使用 Scan，Scan 具有以下特徵：

Scan 可以實現 keys 的匹配功能；
Scan 是通過遊標進行查詢的不會導致 Redis 假死；
Scan 提供了 count 引數，可以規定遍歷的數量；
Scan 會把遊標返回給客戶端，使用者客戶端繼續遍歷查詢；
Scan 返回的結果可能會有重複資料，需要客戶端去重；
單次返回空值且遊標不為 0，說明遍歷還沒結束；
Scan 可以保證在開始檢索之前，被刪除的元素一定不會被查詢出來；
在迭代過程中如果有元素被修改， Scan 不保證能查詢出相關的元素。

7 視訊版

視訊版：https://www.bilibili.com/video/av880769

面試突擊 | Redis 如何從海量資料中查詢出某一個 Key？附視訊

1 考察知識點本題考察的知識點有以下幾個： Keys 和 Scan 的區別 Keys 查詢的缺點 Scan 如何使用？ Scan 查詢的特點 2 解答思路 Keys 查詢存在的問題 Scan 的使用 Scan 的特點 3 Keys 使用相關 1）Keys 用法如下 2）Keys 存在的問題

【演算法-點陣圖法】在海量資料中查詢重複元素

什麼是點陣圖法？舉個簡單例子，在java中一個int型別的數有32位，而這32只表示一個數太過浪費，於是就考慮讓這32位可以表示32個數，每一位表示該數是否存在，例如：這裡用16位的二進位制就能表示十六個數字，1表示存在，0表示不存在，上圖就表示存在（16，12，

從海量資料中找中位數（c語言實現）

題目：5億個int，從中找出第k大的數演算法：之後補上。。。實現： #include <assert.h> #include <fcntl.h> #include <stdio.h> #include <stdlib.h&g

如何從大量資料中找出異常值

前言機器學習中資料預處理階段，首先要考慮的就是將資料集中的異常值找出來，然後再做額外處理。當然，異常值的處理並不存在什麼銀彈，只能具體情況具體分析再根據效果選擇處理方法。直方圖看看資料集直方圖也許能看出點端倪，比如下面這個圖，下方的是原始資料集，上面的是對應直方圖，可以看到大多數都分佈在11000

海量資料中找出前k大數

前兩天面試3面學長問我的這個問題（想說TEG的3個面試學長都是好和藹，希望能完成最後一面，各方面原因造成我無比想去鵝場的心已經按捺不住了），這個問題還是建立最小堆比較好一些。先拿10000個數建堆，然後一次新增剩餘元素，如果大於堆頂的數（10000中最小的

海量日誌資料__怎麼在海量資料中找出重複次數最多的一個

問題一：怎麼在海量資料中找出重複次數最多的一個演算法思想：方案1：先做hash，然後求模對映為小檔案，求出每個小檔案中重複次數最多的一個，並記錄重複次數。然後找出上一步求出的資料中重複次數最多的一個就是所求（如下）。問題二：

海量資料中找出前k大數（topk問題）

前兩天面試3面學長問我的這個問題（想說TEG的3個面試學長都是好和藹，希望能完成最後一面，各方面原因造成我無比想去鵝場的心已經按捺不住了），這個問題還是建立最小堆比較好一些。先拿10000個數建堆，然後一次新增剩餘元素，如果大於堆頂的數（10000中最小

ajax_ajax從json資料中取其中某一值，輸出未定義

問題：flag1能正常輸出，flag2卻輸出未定義 var flag ; $.getJSON("#",function(json){ flag = json.flag; alert("flag1:" + flag ); }); alert(

如何從mysql資料庫中查詢指定欄位且符合條件的資料，然後拼接成json字串，最後匯出json檔案

SELECT CONCAT("{'name':'",IFNULL(Name,''),"',","'sex':'",IFNULL(Sex,''),"',","'age':'",IFNULL(Age,''),"',", "'phone':'",IFNULL(Phon

TOP-K排序演算法，從海量不重複資料中找出最大/小的K個數

如題，TOP-K排序的主要功能是找出一堆不重複資料中的最小或最大的幾個數，此處我們介紹這種型別題目的某種解法：最大最小堆，最大堆結構裡面的每一個數不都是小於root的值麼？和我們要解決的問題很像。由此，我們可以構造一個堆，並且用它來儲存我們需要找的那幾個數。有這麼一個動態

Elasticsearch對Hbase中的資料建索引實現海量資料快速查詢

一、將專案匯入myeclipse中方法1：將下載好的檔案（是解壓es_hbase6資料夾而不是Test-master）解壓到你myeclipse的Workspaces目錄中，然後在myeclipse中右鍵點選Import匯入專案方法2：將下載好的檔案解壓到你的Windows桌

kettle從mysql中查詢出特定的資料然後傳送郵件附件到指定的郵箱。

剛開始接觸kettle，還是小白，但是感覺這東西挺強大。做了一個傳送附件excel到指定郵箱的demo。現在記錄如下。 1. 2. 3. . 4.job檔案新建job檔案，在空白處設定屬性 5.拖入以下按鈕設定郵件引數到這裡應該就差不多了，執行成功的截

二分法從有序數列中查詢資料

#include "stdio.h"int main(){ int x = 1; int a[10]; int s = 0, i = 0, mid = 0, b = 0;start: printf("請輸入一個有序陣列10個數（從小到大）："); s = sizeof(a

程式碼實現從某個表中查詢資料插入到另一個表中

前提條件&產生問題原因： 1、由於資料量比較大，又沒有使用hadoop等方式處理資料。所以使用分表的形式。分表的看另一篇文章。 2、然後，需求變了，臥槽～～～需求又變了！！！不用分表了，需要把所有的分表資料，插入到一張表中。當然，這所有表的欄位要求一致。 ///稍

postgresql 從一張表中查詢出記錄然後批量插入到另一張表中

有個業務從 appuser 表中把uid 查出來所有uid 資料，然後批量插入 app_user_sdk 表中 insert into app_user_sdk ((select uid,'MY' from appuser); 又要重複插入，又把新新增的使用者，

從頂點資料中傳入頂點位置和頂點顏色

一、目的：不需要在著色器中指定圖形的顏色，直接在頂點資料中指定顏色 //畫三角形的頂點陣列 float vertices[] = { 　　//位置　　　　 //顏色　　-0.5f, -0.5f, 0.0f,1.0f,0.0f,0.0f, 　　0.5f, -0.5f,0.0f,0.0f,1.0f,0.0f

QT 用正則表示式從tableView中篩選出某一日期範圍內的資料

QDate date1,date2; date1=ui->dateEdit_2->date();//提取開始時間 date2=ui->dateEdit_3->date();//提取結束時間 data_filter->

面試技巧——十道海量資料處理面試題與十個方法大總結

第一部分、十道海量資料處理面試題 1、海量日誌資料，提取出某日訪問百度次數最多的那個IP。首先是這一天，並且是訪問百度的日誌中的IP取出來，逐個寫入到一個大檔案中。注意到IP是32位的，最多有個2^32個IP。同樣可以採用對映的方法，比如模1000，把整個大

從網頁程式碼中查詢所需內容

2018年11月09日 17:40:52 huavhuahua 閱讀數：6 個人分類：爬蟲

21、怎麼才能夠突破單機瓶頸，讓redis支撐海量資料？

redis的叢集架構redis cluster支撐N個redis master node，每個master node都可以掛載多個slave node讀寫分離的架構，對於每個master來說，寫就寫到master，然後讀就從mater對應的slave去讀高可用，因為每個master都有salve節點

面試突擊 | Redis 如何從海量資料中查詢出某一個 Key？附視訊

1 考察知識點

2 解答思路

3 Keys 使用相關

1）Keys 用法如下

2）Keys 存在的問題

4 Scan 使用相關

5 Scan 程式碼實戰

6 總結

7 視訊版

相關推薦