twitter id生成演算法snowflake詳解

阿新 • • 發佈：2019-01-04

1 概述
分散式系統中，有一些需要使用全域性唯一ID的場景，這種時候為了防止ID衝突可以使用36位的UUID，但是UUID有一些缺點，首先他相對比較長，另外UUID一般是無序的。

為了滿足Twitter每秒上萬條訊息的請求，每條訊息都必須分配一條唯一的id，這些id還需要一些大致的順序（方便客戶端排序），並且在分散式系統中不同機器產生的id必須不同。

2 結構
snowflake生成64的id，剛好使用long來儲存，結構如下:

1位標識，由於long基本型別在Java中是帶符號的，最高位是符號位，正數是0，負數是1，所以id一般是正數，最高位是0

41位時間截，注意，41位時間截不是儲存當前時間的時間截，而是儲存時間截的差值（當前時間截 - 開始時間截得到的值），這裡的的開始時間截，一般是我們的id生成器開始使用的時間，由我們程式來指定的（如下下面程式IdWorker類的startTime屬性）。41位的時間截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69

10位的資料機器位，可以部署在1024個節點，包括5位datacenterId和5位workerId

12位序列，同一時間截，同一機器，可以生成4096個id

snowflake生成的ID整體上按照時間自增排序，並且整個分散式系統內不會產生ID碰撞

3 原始碼及註釋

public class IdWorker {  

    //開始該類生成ID的時間截，1288834974657 (Thu, 04 Nov 2010 01:42:54 GMT) 這一時刻到當前時間所經過的毫秒數，佔 41 位（還有一位是符號位，永遠為 0）。  
    private final long startTime = 1463834116272L;  

    //機器id所佔的位數  
    private long workerIdBits = 5L;  

    //資料標識id所佔的位數  
    private long datacenterIdBits = 5L;  

    //支援的最大機器id，結果是31,這個移位演算法可以很快的計算出幾位二進位制數所能表示的最大十進位制數（不信的話可以自己算一下，記住，計算機中儲存一個數都是儲存的補碼，結果是負數要從補碼得到原碼）
    private long maxWorkerId = -1L ^ (-1L << workerIdBits);  

    //支援的最大資料標識id  
    private long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);  

    //序列在id中佔的位數  
    private long sequenceBits = 12L;  

    //機器id向左移12位
    private long workerIdLeftShift = sequenceBits;  

    //資料標識id向左移17位 
    private long datacenterIdLeftShift = workerIdBits + workerIdLeftShift;  

    //時間截向左移5+5+12=22位
    private long timestampLeftShift = datacenterIdBits + datacenterIdLeftShift;  

    //生成序列的掩碼，這裡為1111 1111 1111
    private long sequenceMask = -1 ^ (-1 << sequenceBits);  

    private long workerId;  

    private long datacenterId;  

    //同一個時間截內生成的序列數，初始值是0，從0開始  
    private long sequence = 0L;  

    //上次生成id的時間截  
    private long lastTimestamp = -1L;  

    public IdWorker(long workerId, long datacenterId){  
        if(workerId < 0 || workerId > maxWorkerId){  
            throw new IllegalArgumentException(  
                String.format("workerId[%d] is less than 0 or greater than maxWorkerId[%d].", workerId, maxWorkerId));  
        }  
        if(datacenterId < 0 || datacenterId > maxDatacenterId){  
            throw new IllegalArgumentException(  
                String.format("datacenterId[%d] is less than 0 or greater than maxDatacenterId[%d].", datacenterId, maxDatacenterId));  
        }  
        this.workerId = workerId;  
        this.datacenterId = datacenterId;  
    }  

    //生成id  
    public synchronized long nextId(){  
        long timestamp = timeGen();  
        if(timestamp < lastTimestamp){  
            throw new RuntimeException(  
                String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));  
        }  
        //如果是同一時間生成的，則自增
        if(timestamp == lastTimestamp){  
            sequence = (sequence + 1) & sequenceMask;  
            if(sequence == 0){  
                //生成下一個毫秒級的序列  
                timestamp = tilNextMillis();  
                //序列從0開始  
                sequence = 0L;  
            }  
        }else{  
            //如果發現是下一個時間單位，則自增序列回0，重新自增 
            sequence = 0L;  
        }  

        lastTimestamp = timestamp;  

        //看本文第二部分的結構圖，移位並通過或運算拼到一起組成64位的ID
        return ((timestamp - startTime) << timestampLeftShift)  
            | (datacenterId << datacenterIdLeftShift)
            | (workerId << workerIdLeftShift)
            | sequence;
    }  

    protected long tilNextMillis(){  
        long timestamp = timeGen();  
        if(timestamp <= lastTimestamp){  
            timestamp = timeGen();  
        }  
        return timestamp;  
    }  

    protected long timeGen(){  
        return System.currentTimeMillis();  
    }  

    public static void main(String[] args) {

        class IdServiceThread implements Runnable {
            private Set<Long> set;
            @Autowired
            private IdService idService;

            public IdServiceThread(Set<Long> set, IdService idService) {
                this.set = set;
                this.idService = idService;
            }

            @Override
            public void run() {
                while (true) {
                    long id = idService.nextId();
                    System.out.println("duplicate:" + id);
                    if (!set.add(id)) {
                        System.out.println("duplicate:" + id);
                    }
                }
            }
        }

        Set<Long> set = new HashSet<Long>();
        for(int i=0;i<100;i++){
            Thread t1 = new Thread(new IdServiceThread(set, idService));
            t1.setDaemon(true);
            t1.start();
            try {
                Thread.sleep(30000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }

}

著重說一下-1L ^ (-1L << workerIdBits)

可以用System.out.println檢測一下，結果是31，那麼具體是怎麼操作的？

首先要明白，計算機中儲存資料都是補碼。這樣做的好處在於，採用補碼運算時，由於符號位與數值一樣參與運算，所以不必像原碼運算那樣對兩數的大小、符號作比較，從而使運算更簡單。

-1L補碼： 1111 1111
左移五位：1110 0000
異或操作：0001 1111
也就是最終的結果31

twitter id生成演算法snowflake詳解

1 概述分散式系統中，有一些需要使用全域性唯一ID的場景，這種時候為了防止ID衝突可以使用36位的UUID，但是UUID有一些缺點，首先他相對比較長，另外UUID一般是無序的。為了滿足Twitter每秒上萬條訊息的請求，每條訊息都必須分配一條唯一的id，這些id還需要一

C語言實現分散式自增有序的唯一ID生成演算法-snowflake演算法

轉自:http://blog.csdn.net/wallwind/article/details/49701397 之前有人問我設計一個分散式的遞增的唯一id生成。想了半天不知道，偶然一個同事說起snowflake演算法，我百度了一下，很簡單高效。參考 https

SnowFlake --- 分散式id生成演算法工具類

package util; import java.lang.management.ManagementFactory; import java.net.InetAddress; import java.net.NetworkInterface; /** *

【Zanuck 鎮】編寫php高效能snowflake演算法外掛(分散式64位唯一性自增id生成演算法)

好了，現在開始，先用C語言實現snowflake演算法，用C語言實現非常簡單，只要按照snowflake演算法的規則來就行了，我摘抄了csdn上一個比較好的演算法，地址如下：http://blog.csdn.net/wallwind/article/details/49701397，但是博主沒有做註釋，但是我

Twitter的分散式自增ID雪花演算法snowflake (Java版)

概述分散式系統中，有一些需要使用全域性唯一ID的場景，這種時候為了防止ID衝突可以使用36位的UUID，但是UUID有一些缺點，首先他相對比較長，另外UUID一般是無序的。有些時候我們希望能使用一種簡單一些的ID，並且希望ID能夠按照時間有序生成。而twitter的s

SnowFlake --- 分散式id生成演算法

概述 SnowFlake演算法生成id的結果是一個64bit大小的整數，它的結構如下圖： 1位，不用。二進位制中最高位為1的都是負數，但是我們生成的id一般都使用整數，所以這個最高位固定是0 41位，用來記錄時間戳（毫秒）。 41位可以表示241

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之二（作者簡介）

AR aca rtu href beijing cert school start ica Brief Introduction of the AuthorChief Architect at 2Wave Technology Inc. (a startup company

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之一（簡介）

價值新書 The aar 生成 syn TE keras 第一章 A Gentle Introduction to Probabilistic Modeling and Density Estimation in Machine LearningAndA Detailed

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之五（第3章之 EM算法）

ado vpd dea bee OS deb -o blog Oz 機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之五（第3章之 EM算法）

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之六（第3章之 VI/VB算法）

dac term http 51cto -s mage 18C watermark BE ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之七（第4章之梯度估算）

.com 概率 roc 生成詳解 time 學習 style BE ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?機器學習中的概率模型和概率密度估計方法及V

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之八（第4章之 AEVB和VAE）

RM mes 9.png size mar evb DC 機器 DG ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之九（第5章總結）

ces mark TP 生成機器分享 png ffffff images ? ?機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之九（第5章總結）

web叢集全域性唯一request id生成演算法, 替代uuid等“通用”方案

如何為每一個web請求分配一個在全叢集範圍內都唯一的request id 卻又不想去實現一個複雜的集中式id序列生成器呢？ UUID？這或許是個辦法，但不覺得不太甘心麼？下面的這個方式可能可以幫到你： package test; import java.util.concur

深度學習——優化器演算法Optimizer詳解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

在機器學習、深度學習中使用的優化演算法除了常見的梯度下降，還有 Adadelta，Adagrad，RMSProp 等幾種優化器，都是什麼呢，又該怎麼選擇呢？在 Sebastian Ruder 的這篇論文中給出了常用優化器的比較，今天來學習一下：https://arxiv.org/pdf/160

js版裝置id生成演算法分析

前言 1、網際網路業務經常會有送券、領紅包等活動，通常禮品發放是基於單個使用者ID只發放一次原則，同時還會結合是否新使用者、是否非常客(熟客不給優惠)等策略。羊毛黨薅羊毛場景：1、編寫領禮品（券和紅包統稱禮品）指令碼；2、匯入批量使用者cookie或手機號，匯入批量網路代理(繞基於IP的風

R語言 apriori演算法案例詳解

轉載自http://blog.csdn.net/gjwang1983/article/details/45015203 1.概念 1.1 引論關聯規則（AssociationRules）是無監督的機器學習方法，用於知識發現，而非預測。關聯規則的學習器（learner）無

HanLP 關鍵詞提取演算法分析詳解

參考論文：《TextRank: Bringing Order into Texts》 TextRank演算法提取關鍵詞的Java實現 TextRank演算法自動摘要的Java實現這篇文章中作者大概解釋了一下TextRank公式 1. 論文 In thi

優化器演算法Optimizer詳解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

轉自：https://www.cnblogs.com/guoyaohua/p/8542554.html 在機器學習、深度學習中使用的優化演算法除了常見的梯度下降，還有 Adadelta，Adagrad，RMSProp 等幾種優化器，都是什麼呢，又該怎麼選擇呢？在 Sebastian Rud

各大公司廣泛使用的線上學習演算法FTRL詳解

現在做線上學習和CTR常常會用到邏輯迴歸（ Logistic Regression），而傳統的批量（batch）演算法無法有效地處理超大規模的資料集和線上資料流，google先後三年時間（2010年-2013年）從理論研究到實際工程化實現的FTRL（Follow-the-re

twitter id生成演算法snowflake詳解

相關推薦