PHP 的 uniqid 函式產生的 id 真的是唯一的麼?
最近使用到了 uniqid,就產生了疑問?uniqid 生成的 id 由什麼組成?真的是唯一的麼?什麼情況下會產生衝突?
從文件中看到 uniqid 函式有兩個引數
uniqid 的結構
看原始碼:
PHP_FUNCTION(uniqid) { ... gettimeofday((struct timeval *) &tv, (struct timezone *) NULL); sec = (int) tv.tv_sec; usec = (int) (tv.tv_usec % 0x100000); ... if (more_entropy) { uniqid = strpprintf(0, "%s%08x%05x%.8F", prefix, sec, usec, php_combined_lcg() * 10); } else { uniqid = strpprintf(0, "%s%08x%05x", prefix, sec, usec); } RETURN_STR(uniqid); }
基本就瞭解清楚了。uniqid 是由四個部分組成:
prefix + sec + usec + “.” + php_combined_lcg
其中 prefix 就是 uniqid 函式的第一個引數。它是一個字串,傳遞進來什麼,就直接返回什麼。
sec 是當前時鐘的秒,usec 是毫秒,這兩個值都是從 gettimeofday 獲取的。換句話說,只要在一臺機器上,兩個 php 程式在同一個毫秒內獲取的 sec 和 usec 是一樣的。
php_combined_lcg 是 uniqid 的第二個引數決定的,它是一個墒值,它是使用線性同餘生成一個 0 ~ 1 之間的隨機數。如果第二個引數為 true,就有這個值,如果第二個引數為 false,就沒有這個值。
比如:
➜ ~ php -r 'echo uniqid("my_", true);'
my_5afe9b414c2141.76621929
結論
所以說,如果我們單純使用 uniqid() 這個方法,不帶任何引數的話,這個方法只能保證單個程序,在同一個毫秒內是唯一的。如果使用uniqid("", true)。 帶了一個墒值,自身已經有一個隨機的方式能保證生成的id的隨機性了。但是由於線性同餘是比較簡單的生成隨機數的演算法,隨機性有可能還不夠,所以,網上流傳的一種更隨機數值的方式是:
uniqid(mt_rand(), true)
其中 mt_rand() 生成隨機數就不是使用線性同餘生成隨機數的方式了,而是使用 Mersenne Twister Random Number Generator (梅森旋轉演算法)。換句話說,上面這個 id 由兩種隨機演算法 + 時間戳生成。基本上,這個演算法在很大程度上能保證唯一性了(如果要問衝突率的話,估計只有數學系學生能研究出來了...)。
上面的這個給出的id會有一個點號,而且長度並不是128bit。如果希望生成uuid,就需要一個hash,不管是md5,sha1 都是可以選擇的。所以網上又有一種生成唯一碼的方式。
md5(uniqid(mt_rand(), true))
但是,本質上,這兩種方式的隨機性是相等的。
md5(uniqid(mt_rand(), true))--------親證這個效果好,不會重,就是沒規律----我自己的