延遲任務的實現總結

阿新 • • 發佈：2019-01-04

實現延遲任務的方式有很多，各有利弊，有單機和分散式的。在這裡做一個總結，在遇到這類問題的時候希望給大家一個參考和思路。

延遲任務有別於定式任務，定式任務往往是固定週期的，有明確的觸發時間。而延遲任務一般沒有固定的開始時間，它常常是由一個事件觸發的，而在這個事件觸發之後的一段時間內觸發另一個事件。延遲任務相關的業務場景如下：

場景一：物聯網系統經常會遇到向終端下發命令，如果命令一段時間沒有應答，就需要設定成超時。

場景二：訂單下單之後30分鐘後，如果使用者沒有付錢，則系統自動取消訂單。

下面我們來探討一些方案，其實這些方案沒有好壞之分，和系統架構一樣，只有最適合。對於資料量較小的情況下，任意一種方案都可行，考慮的是簡單明瞭和開發速度，儘量避免把系統搞複雜了。而對於資料量較大的情況下，就需要有一些選擇，並不是所有的方案都適合了。

1. 資料庫輪詢

這是比較常見的一種方式，所有的訂單或者所有的命令一般都會儲存在資料庫中。我們會起一個執行緒去掃資料庫或者一個數據庫定時Job，找到那些超時的資料，直接更新狀態，或者拿出來執行一些操作。這種方式很簡單，不會引入其他的技術，開發週期短。

如果資料量比較大，千萬級甚至更多，插入頻率很高的話，上面的方式在效能上會出現一些問題，查詢和更新對會佔用很多時間，輪詢頻率高的話甚至會影響資料入庫。一種可以嘗試的方式就是使用類似TBSchedule或Elastic-Job這樣的分散式的任務排程加上資料分片功能，把需要判斷的資料分到不同的機器上執行。

如果資料量進一步增大，那掃資料庫肯定就不行了。另一方面，對於訂單這類資料，我們也許會遇到分庫分表，那上述方案就會變得過於複雜，得不償失。

2. JDK延遲佇列

Java中的DelayQueue位於java.util.concurrent包下，作為單機實現，它很好的實現了延遲一段時間後觸發事件的需求。由於是執行緒安全的它可以有多個消費者和多個生產者，從而在某些情況下可以提升效能。DelayQueue本質是封裝了一個PriorityQueue，使之執行緒安全，加上Delay功能，也就是說，消費者執行緒只能在佇列中的訊息“過期”之後才能返回資料獲取到訊息，不然只能獲取到null。

之所以要用到PriorityQueue，主要是需要排序。也許後插入的訊息需要比佇列中的其他訊息提前觸發，那麼這個後插入的訊息就需要最先被消費者獲取，這就需要排序功能。PriorityQueue內部使用最小堆來實現排序佇列。隊首的，最先被消費者拿到的就是最小的那個。使用最小堆讓佇列在資料量較大的時候比較有優勢。使用最小堆來實現優先順序佇列主要是因為最小堆在插入和獲取時，時間複雜度相對都比較好，都是O(logN)。

下面例子實現了未來某個時間要觸發的訊息。我把這些訊息放在DelayQueue中，當訊息的觸發時間到，消費者就能拿到訊息，並且消費，實現處理方法。示例程式碼：

/*

 * 定義放在延遲佇列中的物件，需要實現Delayed介面
 
*/

public class DelayedTask implements Delayed {
    private int _expireInSecond = 0;

    public DelayedTask(int delaySecond) {
        Calendar cal = Calendar.getInstance();
        cal.add(Calendar.SECOND, delaySecond);
        _expireInSecond = (int) (cal.getTimeInMillis() / 1000);
    }

    public int compareTo(Delayed o) {
        long d = (getDelay(TimeUnit.NANOSECONDS) - o.getDelay(TimeUnit.NANOSECONDS));
        return (d == 0) ? 0 : ((d < 0) ? -1 : 1);
    }

    public long getDelay(TimeUnit unit) {       
	//TODO Auto-generated method stub   
        Calendar cal = Calendar.getInstance();
        return _expireInSecond - (cal.getTimeInMillis() / 1000); 
    }

}

下面定義了三個延遲任務，分別是10秒，5秒和15秒。依次入佇列，期望5秒鐘後，5秒的訊息先被獲取到，然後每個5秒鐘，依次獲取到10秒資料和15秒的那個資料。

public static void main(String[] args) throws InterruptedException {
        
	//TODO Auto-generated method stub
        SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

        //定義延遲佇列
        DelayQueue<DelayedTask> delayQueue = new DelayQueue<DelayedTask>();

        //定義三個延遲任務
        DelayedTask task1 = new DelayedTask(10);
       	DelayedTask task2 = new DelayedTask(5);
        DelayedTask task3 = new DelayedTask(15);

        delayQueue.add(task1);
        delayQueue.add(task2);
        delayQueue.add(task3);

        System.out.println(sdf.format(new Date()) + " start");
        
       	while(delayQueue.size() != 0) {
            
            //如果沒到時間，該方法會返回

            DelayedTask task = delayQueue.poll();

    	    if(task != null) {
                Date now = new Date();
                System.out.println(sdf.format(now));
            }
            
            Thread.sleep(1000);
        }
    }

輸出結果如下圖：

DelayQueue是一種很好的實現方式，雖然是單機，但是可以多執行緒生產和消費，提高效率。拿到訊息後也可以使用非同步執行緒去執行下一步的任務。如果有分散式的需求可以使用Redis來實現訊息的分發，如果對訊息的可靠性有非常高的要求可以使用訊息中介軟體：

使用DelayQueue需要考慮程式掛掉之後，記憶體裡面未處理訊息的丟失帶來的影響。

3. JDK ScheduledExecutorService

JDK自帶的一種執行緒池，它能排程一些命令在一段時間之後執行，或者週期性的執行。文章開頭的一些業務場景主要使用第一種方式，即，在一段時間之後執行某個操作。程式碼例子如下：

public static void main(String[] args) {
        // TODO Auto-generated method stub

        ScheduledExecutorService executor = Executors.newScheduledThreadPool(100);

        for(inti = 10; i > 0; i--) {
            executor.schedule(new Runnable() {
		public void run() {
                    //TODO Auto-generated method stub

                    System.out.println("Work start, thread id:" + Thread.currentThread().getId() + " " + sdf.format(new Date()));
                }
            }, i, TimeUnit.SECONDS);
        }
    }

執行結果：

ScheduledExecutorService的實現類ScheduledThreadPoolExecutor提供了一種並行處理的模型，簡化了執行緒的排程。DelayedWorkQueue是類似DelayQueue的實現，也是基於最小堆的、執行緒安全的資料結構，所以會有上例排序後輸出的結果。

ScheduledExecutorService比上面一種DelayQueue更加實用。因為，一般來說，使用DelayQueue獲取訊息後觸發事件都會實用多執行緒的方式執行，以保證其他事件能準時進行。而ScheduledThreadPoolExecutor就是對這個過程進行了封裝，讓大家更加方便的使用。同時在加強了部分功能，比如定時觸發命令。

4. 時間輪

時間輪是一種非常驚豔的資料結構。其在Linux核心中使用廣泛，是Linux核心定時器的實現方法和基礎之一。按使用場景，大致可以分為兩種時間輪：原始時間輪和分層時間輪。分層時間輪是原始時間輪的升級版本，來應對時間“槽”數量比較大的情況，對記憶體和精度都有很高要求的情況。我們延遲任務的場景一般只需要用到原始時間輪就可以了。

原始時間輪：如下圖一個輪子，有8個“槽”，可以代表未來的一個時間。如果以秒為單位，中間的指標每隔一秒鐘轉動到新的“槽”上面，就好像手錶一樣。如果當前指標指在1上面，我有一個任務需要4秒以後執行，那麼這個執行的執行緒回撥或者訊息將會被放在5上。那如果需要在20秒之後執行怎麼辦，由於這個環形結構槽數只到8，如果要20秒，指標需要多轉2圈。位置是在2圈之後的5上面（20 % 8 + 1）。這個圈數需要記錄在槽中的資料結構裡面。這個資料結構最重要的是兩個指標，一個是觸發任務的函式指標，另外一個是觸發的總第幾圈數。時間輪可以用簡單的陣列或者是環形連結串列來實現。

原始的時間輪

相比DelayQueue的資料結構，時間輪在演算法複雜度上有一定優勢。DelayQueue由於涉及到排序，需要調堆，插入和移除的複雜度是O(lgn)，而時間輪在插入和移除的複雜度都是O(1)。

時間輪比較好的開源實現是Netty的

//建立Timer, 精度為100毫秒,

        HashedWheelTimer timer = new HashedWheelTimer();

        System.out.println(sdf.format(new Date()));

        MyTask task1 = new MyTask();
        MyTask task2 = new MyTask();
        MyTask task3 = new MyTask();
        
        timer.newTimeout(task1, 5, TimeUnit.SECONDS);
        timer.newTimeout(task2, 10, TimeUnit.SECONDS);
        timer.newTimeout(task3, 15, TimeUnit.SECONDS);
        
        //阻塞main執行緒

        try{
            System.in.read();
        } catch(IOException e) {
            //TODO Auto-generated catch block
            e.printStackTrace();
        }

其中HashedWheelTimer有多個建構函式。其中：

ThreadFactory ：建立執行緒的類，預設Executors.defaultThreadFactory()。

TickDuration：多少時間指標順時針轉一格，單位由下面一個引數提供。

TimeUnit：上一個引數的時間單位。

TicksPerWheel：時間輪上的格子數。

如果一個任務要在120s後執行，時間輪是預設引數的話，那麼這個任務在時間輪上需要經過

120000ms / (512 * 100ms) = 2輪

120000ms % (512 * 100ms) = 176格。

在使用HashedWheelTimer的過程中，延遲任務的實現最好使用非同步的，HashedWheelTimer的任務管理和執行都在一個執行緒裡面。如果任務比較耗時，那麼指標就會延遲，導致整個任務就會延遲。

4. Quartz

quartz是一個企業級的開源的任務排程框架，quartz內部使用TreeSet來儲存Trigger，如下圖。Java中的TreeSet是使用TreeMap實現，TreeMap是一個紅黑樹實現。紅黑樹的插入和刪除複雜度都是logN。和最小堆相比各有千秋。最小堆插入比紅黑樹快，刪除頂層節點比紅黑樹慢。

相比上述的三種輕量級的實現功能豐富很多。有專門的任務排程執行緒，和任務執行執行緒池。quartz功能強大，主要是用來執行週期性的任務，當然也可以用來實現延遲任務。但是如果只是實現一個簡單的基於記憶體的延時任務的話，quartz就稍顯龐大。

5. Redis ZSet

Redis中的ZSet是一個有序的Set，內部使用HashMap和跳錶(SkipList)來保證資料的儲存和有序，HashMap裡放的是成員到score的對映，而跳躍表裡存放的是所有的成員，排序依據是HashMap裡存的score,使用跳躍表的結構可以獲得比較高的查詢效率，並且在實現上比較簡單。

public class ZSetTest {

    private JedisPool jedisPool = null;
    //Redis伺服器IP

    private String ADDR = "10.23.22.42";
    //Redis的埠號

    private int PORT = 6379;

    private SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public void intJedis() {
        jedisPool = new JedisPool(ADDR, PORT);
    }

    public static void main(String[] args) {
        //TODO Auto-generated method stub

        ZSetTest zsetTest = new ZSetTest();
        zsetTest.intJedis();

        zsetTest.addItem();
        zsetTest.getItem();

        zsetTest.deleteZSet();
    }

    public void deleteZSet() {
        Jedis jedis = jedisPool.getResource();
        jedis.del("zset_test");
    }

    public void addItem() {
        Jedis jedis = jedisPool.getResource();

        Calendar cal1 = Calendar.getInstance();
        cal1.add(Calendar.SECOND, 10);
        int second10later = (int) (cal1.getTimeInMillis() / 1000);

        Calendar cal2 = Calendar.getInstance();
        cal2.add(Calendar.SECOND, 20);
        int second20later = (int) (cal2.getTimeInMillis() / 1000);

        Calendar cal3 = Calendar.getInstance();
        cal3.add(Calendar.SECOND, 30);
        int second30later = (int) (cal3.getTimeInMillis() / 1000);

        Calendar cal4 = Calendar.getInstance();
        cal4.add(Calendar.SECOND, 40);
        int second40later = (int) (cal4.getTimeInMillis() / 1000);

        Calendar cal5 = Calendar.getInstance();
        cal5.add(Calendar.SECOND, 50);
        int second50later = (int) (cal5.getTimeInMillis() / 1000);

        jedis.zadd("zset_test", second50later, "e");
        jedis.zadd("zset_test", second10later, "a");
        jedis.zadd("zset_test", second30later, "c");
        jedis.zadd("zset_test", second20later, "b");
        jedis.zadd("zset_test", second40later, "d");

        System.out.println(sdf.format(new Date()) + " add finished.");
    }

    public void getItem() {

        Jedis jedis = jedisPool.getResource();

        while(true) {
            try {

                Set<Tuple> set = jedis.zrangeWithScores("zset_test", 0, 0);

                String value = ((Tuple) set.toArray()[0]).getElement();
                int score = (int) ((Tuple) set.toArray()[0]).getScore();

                Calendar cal = Calendar.getInstance();
                int nowSecond = (int) (cal.getTimeInMillis() / 1000);

                if (nowSecond >= score) {
                    jedis.zrem("zset_test", value);
                    System.out.println(sdf.format(new Date()) + " removed value:" + value);
                }

                if(jedis.zcard("zset_test") <= 0)
                {
                    System.out.println(sdf.format(new Date()) + " zset empty ");
                    return;
                }
                Thread.sleep(1000);
            } catch(InterruptedException e) {
                //TODO Auto-generated catch block

                e.printStackTrace();
            }
        }
    }

}

在用作延遲任務的時候，可以在新增資料的時候，使用zadd把score寫成未來某個時刻的unix時間戳。消費者使用zrangeWithScores獲取優先順序最高的（最早開始的的）任務。注意，zrangeWithScores並不是取出來，只是看一下並不刪除，類似於Queue的peek方法。程式對最早的這個訊息進行驗證，是否到達要執行的時間，如果是則執行，然後刪除zset中的資料。如果不是，則繼續等待。

由於zrangeWithScores 和 zrem是先後使用，所以有可能有併發問題，即兩個執行緒或者兩個程序都會拿到一樣的一樣的資料，然後重複執行，最後又都會刪除。如果是單機多執行緒執行，或者分散式環境下，可以使用Redis事務，也可以使用由Redis實現的分散式鎖，或者使用下例中Redis Script。你可以在Redis官方的Transaction 章節找到事務的相關內容。

使用Redis的好處主要是：

1. 解耦：把任務、任務發起者、任務執行者的三者分開，邏輯更加清晰，程式強壯性提升，有利於任務發起者和執行者各自迭代，適合多人協作。

2. 異常恢復：由於使用Redis作為訊息通道，訊息都儲存在Redis中。如果傳送程式或者任務處理程式掛了，重啟之後，還有重新處理資料的可能性。

3. 分散式：如果資料量較大，程式執行時間比較長，我們可以針對任務發起者和任務執行者進行分散式部署。特別注意任務的執行者，也就是Redis的接收方需要考慮分散式鎖的問題。

6. Jesque

Jesque是Resque的java實現，Resque是一個基於Redis的Ruby專案，用於後臺的定時任務。Jesque實現延遲任務的方法也是在Redis裡面建立一個ZSet，和上例一樣的處理方式。上例提到在使用ZSet作為優先順序佇列的時候，由於zrangeWithScores 和 zrem沒法保證原子性，所有在分散式環境下會有問題。在Jesque中，它使用的Redis Script來解決這個問題。Redis Script可以保證操作的原子性，相比事務也減少了一些網路開銷，效能更加出色。

7. RabbitMQ TTL和DXL

使用RabbitMQ的TTL和DXL實現延遲佇列在這裡不做詳細的介紹。

綜上所述，解決延遲佇列有很多種方法。選擇哪個解決方案也需要根據不同的資料量、實時性要求、已有架構和元件等因素進行判斷和取捨。對於比較簡單的系統，可以使用資料庫輪訓的方式。資料量稍大，實時性稍高一點的系統可以使用JDK延遲佇列（也許需要解決程式掛了，記憶體中未處理任務丟失的情況）。如果需要分散式橫向擴充套件的話推薦使用Redis的方案。但是對於系統中已有RabbitMQ，那RabbitMQ會是一個更好的方案。

延遲任務的實現總結

1. 資料庫輪詢

2. JDK延遲佇列

3. JDK ScheduledExecutorService

4. 時間輪

4. Quartz

5. Redis ZSet

6. Jesque

7. RabbitMQ TTL和DXL

史上最全的延遲任務實現方式彙總！附程式碼（強烈推薦）

延遲任務的實現總結

延遲任務的幾種實現思路

定時任務實現方法總結與分析

RabbitMQ使用延遲佇列實現一次性定時任務(php版)

Rabbitmq延遲佇列實現定時任務

用PHP+Redis實現延遲任務，實現自動取消訂單

String 經常用法最優算法實現總結（二）

兩個任務的總結

批處理+定時任務實現定時休息提醒

ScheduledExecutorService--目前最理想的定時任務實現方式

Linux運維學習筆記-定時任務知識總結

Python多任務實現之協程並發下載多圖片

ASP.NET MVC計劃任務實現方法（定時執行某個功能）

.net 定時任務實現方式

任務整理總結（7.5）

Android長時間定時任務實現

MS SQL Server 定時任務實現自動備份

Layered Window 透明窗體的實現總結

RabbitMQ 延遲佇列實現訂單支付結果非同步階梯性通知

延遲任務的實現總結

1. 資料庫輪詢

2. JDK延遲佇列

3. JDK ScheduledExecutorService

4. 時間輪

4. Quartz

5. Redis ZSet

6. Jesque

7. RabbitMQ TTL和DXL

相關推薦