分散式ID系列(2)——UUID適合做分散式ID嗎
UUID的生成策略:
UUID的方式能生成一串唯一隨機32位長度資料,它是無序的一串資料,按照開放軟體基金會(OSF)制定的標準計算,UUID的生成用到了乙太網卡地址、納秒級時間、晶片ID碼和許多可能的數字。UUID的底層是由一組32位數的16進位制數字構成,是故 UUID 理論上的總數為 ,約等於 ,也就是說若每納秒產生1百萬個 UUID,要花100億年才會將所有 UUID 用完(100億年啊,地球都沒了),所以這足夠我們的使用了,也能夠保證唯一性。
UUID的格式:
UUID 的十六個八位位元組被表示為 32個十六進位制數字,以連字號分隔的五組來顯示,形式為 8-4-4-4-12,總共有 36個字元(即三十二個英數字母和四個連字號)。例如:
123e4567-e89b-12d3-a456-426655440000
xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx
上面的以數字 M開頭的四位表示 UUID 版本,目前UUID的規範有5個版本,M可選值為1, 2, 3, 4, 5 ;各個版本的具體介紹如下所示:
version 1:0001。基於時間和 MAC 地址。由於使用了 MAC 地址,因此能夠確保唯一性,但是同時也暴露了 MAC 地址,私密性不夠好。
version 2:0010。DCE 安全的 UUID。該版本在規範中並沒有仔細說明,因此並沒有具體的實現。
version 3:0011。基於名字空間 (MD5)。使用者指定一個名字空間和一個字串,通過 MD5 雜湊,生成 UUID。字串本身需要是唯一的。
version 4:0100。基於隨機數。雖然是基於隨機數,但是重複的可能性可以忽略不計,因此該版本也是被經常使用的版本。
version 5:0101。基於名字空間 (SHA1)。跟 Version 3 類似,但是雜湊函式程式設計了 SHA1。
上面以數字 N開頭的四個位表示 UUID 變體( variant ),變體是為了能相容過去的 UUID,以及應對未來的變化,目前已知的變體有如下幾種,因為目前正在使用的 UUID 都是 variant1,所以取值只能是 8,9,a,b 中的一個(分別對應1000,1001,1010,1011)。
variant 0:0xxx。為了向後相容預留。
variant 1:10xx。當前正在使用的。
variant 2:11xx。為早期微軟 GUID 預留。
variant 3:111x。為將來擴充套件預留。目前暫未使用。
Java實現UUID:
Java已經寫好一個UUID類供我們使用,如下所示
package com.one.util; import java.util.UUID; public class Test { public static void main(String[] args) { String uuid= UUID.randomUUID().toString().replace("-", "").toLowerCase(); System.out.println(uuid); } }
結果如下所示
UUID是否適合做分散式id:
如果需求是隻保證唯一性,那麼UUID也是可以使用的,但是按照上面的分散式id的要求, UUID其實是不能做成分散式id的,原因如下:
- 首先分散式id一般都會作為主鍵,但是安裝mysql官方推薦主鍵要儘量越短越好,UUID每一個都很長,所以不是很推薦
- 既然分散式id是主鍵,然後主鍵是包含索引的,然後mysql的索引是通過b+樹來實現的,每一次新的UUID資料的插入,為了查詢的優化,都會對索引底層的b+樹進行修改,因為UUID資料是無序的,所以每一次UUID資料的插入都會對主鍵地城的b+樹進行很大的修改,這一點很不好
- 資訊不安全:基於MAC地址生成UUID的演算法可能會造成MAC地址洩露,這個漏洞曾被用於尋找梅麗莎病毒的製作者位置。
那麼UUID可以用到哪些方面呢
比如阿里雲每一條簡訊傳送的唯一id,這個是可以的,比如從阿里雲官網截圖所示:
看到這裡的同學,覺得好的話就幫忙推薦下吧,Thanks♪(・ω・)ノ
大佬網址:
https://tech.meituan.com/2017/04/21/mt-leaf.html
https://segmentfault.com/a/1190000011282426
https://www.jianshu.com/p/9d7ebe37215e
https://www.jianshu.com/p/da6dae36c290