1. 程式人生 > >PHP 的 uniqid 函式產生的 id 真的是唯一的麼?

PHP 的 uniqid 函式產生的 id 真的是唯一的麼?

最近使用到了 uniqid,就產生了疑問?uniqid 生成的 id 由什麼組成?真的是唯一的麼?什麼情況下會產生衝突?

從文件中看到 uniqid 函式有兩個引數

uniqid 的結構

看原始碼:

PHP_FUNCTION(uniqid)
{
    ...
    gettimeofday((struct timeval *) &tv, (struct timezone *) NULL);
    sec = (int) tv.tv_sec;
    usec = (int) (tv.tv_usec % 0x100000);

    ...
    if (more_entropy) {
        uniqid = strpprintf(0, "%s%08x%05x%.8F", prefix, sec, usec, php_combined_lcg() * 10);
    } else {
        uniqid = strpprintf(0, "%s%08x%05x", prefix, sec, usec);
    }

    RETURN_STR(uniqid);
}

基本就瞭解清楚了。uniqid 是由四個部分組成:

prefix + sec + usec + “.” + php_combined_lcg

其中 prefix 就是 uniqid 函式的第一個引數。它是一個字串,傳遞進來什麼,就直接返回什麼。

sec 是當前時鐘的秒,usec 是毫秒,這兩個值都是從 gettimeofday 獲取的。換句話說,只要在一臺機器上,兩個 php 程式在同一個毫秒內獲取的 sec 和 usec 是一樣的。

php_combined_lcg 是 uniqid 的第二個引數決定的,它是一個墒值,它是使用線性同餘生成一個 0 ~ 1 之間的隨機數。如果第二個引數為 true,就有這個值,如果第二個引數為 false,就沒有這個值。

比如:

➜  ~ php -r 'echo uniqid("my_", true);'
my_5afe9b414c2141.76621929

結論

所以說,如果我們單純使用 uniqid() 這個方法,不帶任何引數的話,這個方法只能保證單個程序,在同一個毫秒內是唯一的。如果使用uniqid("", true)。 帶了一個墒值,自身已經有一個隨機的方式能保證生成的id的隨機性了。但是由於線性同餘是比較簡單的生成隨機數的演算法,隨機性有可能還不夠,所以,網上流傳的一種更隨機數值的方式是:

uniqid(mt_rand(), true)

其中 mt_rand() 生成隨機數就不是使用線性同餘生成隨機數的方式了,而是使用 Mersenne Twister Random Number Generator (梅森旋轉演算法)。換句話說,上面這個 id 由兩種隨機演算法 + 時間戳生成。基本上,這個演算法在很大程度上能保證唯一性了(如果要問衝突率的話,估計只有數學系學生能研究出來了...)。

上面的這個給出的id會有一個點號,而且長度並不是128bit。如果希望生成uuid,就需要一個hash,不管是md5,sha1 都是可以選擇的。所以網上又有一種生成唯一碼的方式。

md5(uniqid(mt_rand(), true))

但是,本質上,這兩種方式的隨機性是相等的。

md5(uniqid(mt_rand(), true))--------親證這個效果好,不會重,就是沒規律----我自己的