一個偽隨機數生成演算法
這幾天逛程式設計師論壇,發現了不少好帖子,增長了不少知識,現拿其中一則為例說明。
某人提出一個問題,說怎麼樣能生成一億個不重複的隨機數呢?
問題表述起來很簡單,似乎只要弄明白什麼叫隨機數以及怎樣用電腦生成隨機數,就能解決問題了。這倆問題大多數程式設計師都會,我在這裡再表述一番。
隨機數,個人理解為一定範圍內出現的毫無規律的數,比如扔一個骰子,落在桌面上時朝上的一面所表示的數就是隨機數,這個數只能是從1到6這個範圍內的數,但是具體是什麼數,誰也不能肯定,因為它沒有規律。一組不重複的隨機數,對扔骰子來說就是扔出六個不一樣的數來,再比如洗一次撲克牌,洗完了之後就是54張不重複的隨機數。
第二個問題,怎麼樣用電腦生成隨機數,只要呼叫某個語言的某個函式就行了。其實電腦是沒辦法生成一個真正的隨機數的,因為電腦是高度有規律的機器,讓它生成一個沒規律的數,根本辦不到。平時程式設計師用某個函式生成的隨機數只是利用某個演算法弄出來的偽隨機數。看起來像,其實不是。能解決問題就行了。
回到這個帖子所描述的問題上來,生成一億個不重複的隨機數。那麼最直接的演算法就是每用函式生成一個數,就把它放在一個筐裡,第一個數直接放到筐裡,以後生成的數在放到筐裡之前和筐裡的每一個數比較一番,一旦發現筐裡有和新生成的數一樣的數時,丟掉這個新生成的數,再接著生成數。
毫無疑問,這種演算法的效率是非常低的,看看其中的比較數的次數就知道了,最差的次數趨於無窮次。也就是說到後來,我幾乎生成不了和以往不同的數。
當然還可以將這個演算法升級為效率高得多的演算法,每生成一個數,就把這個數從隨機數生成器取的範圍中去掉,比如我要生成10個隨機數,第一次生成了一個3,我就把3從隨機數的範圍中去掉,第二次只從1到9這個範圍內找。3對應4,4對應5……9對應10。這樣就不存在比較這個環節了,然而又多出一個對應的環節,每生成一個數之後就要把剩下的數重新對應一遍,效率也不容樂觀。
目前以我為代表的普通程式設計師的想象力也就到此為止了,想不出什麼高階解決辦法了,就當扔了一塊磚頭出來。下面就把真正的碧玉,一個數學家級程式設計師的演算法,請出來。
我們先用另一種眼光來看不重複的隨機數:加密。把一個能看懂的英文字串打亂字母的順序,變成不可讀的,這就是加密。但是必須得有規律地打亂,字母a對應另外一個固定的字母Ax,字母b對應另外一個固定的字母Bx,以此類推,而且必須是一一對應的。那麼字串“ab……z”這26個字母對應的26個加密字母“AxBx……Zx”就可以看成是對應範圍a到z的不重複的偽隨機數,這就是數學家的演算法的來源。
看看回帖者的原文:
可以採用32bit RSA演算法
設A從2~(N-1)
C=(A EXP D) mod N
滿足如下條件:
D是素數,N是兩個素數(P,Q)之積,
(D * E) mod ((P-1) * (Q-1))=1
因為:若
C=(A EXP D)mod N
有:
A=(C EXP E) mod N
所以,C與A 一一對應。
所以,對於A=2~(N-1),有不重複,無遺漏的偽隨機碼C。
凡是稍微扯上一點數學,尤其是高等數學的問題,我等泛泛之輩看起來就有點費勁,這裡雖然文字不長,但是還得慢慢來看。
這裡面RSA演算法是密碼學三大演算法之一(RSA、MD5、DES),是一種不對稱密碼演算法。說如果滿足條件:D是素數,N是兩個素數(P,Q)之積,(D * E) mod ((P-1) * (Q-1))=1,那麼存在C與A(範圍從2到N-1)一一對應,且C=(A EXP D)mod N。A是一個有順序的數,C就是一個看似無規律的偽隨機數。Mod運算表示求模,例如7Mod3=1。意思是7除以3餘1。類似地8Mod3=2,9Mod3=0。EXP表示前面數的後面數次方,AEXPD表示A的D次方。這兩個運算清楚了,其它的也就沒什麼困難的了,*是乘法的意思,大多數理科生都清楚。
搜了一下網路,還得加上一些條件,1,P和Q不能一樣。2,e<(P-1)(Q-1)且e與(P-1)(Q-1)的最大公因數為1。
下面用一個例子來試驗一下,看看這個演算法有多神奇。
設N=15,P=5,Q=3,則A為2到14的數。現在要產生2到14的偽隨機數。取D為3,E為3,C2=(2EXP3)mod15 = 8,
C3=(3EXP3)mod 15 = 12,
C4 = (4EXP3)mod 15= 4,
C5 = (5EXP3)mod 15= 5,
C6 = (6EXP3)mod 15= 6,
C7 = (7EXP3)mod 15= 13,
C8 = (8EXP3)mod 15= 2,
C9 = (9EXP3)mod 15= 9,
C10 = (10EXP3)mod 15= 10,
C11 = (11EXP3)mod 15= 11,
C12 = (12EXP3)mod 15= 3,
C13 = (13EXP3)mod 15= 7,
C14 = (14EXP3)mod 15= 14。
比較完美。如果數再大一點,可能看起來更隨機一些。
由這個演算法產生的1億的偽隨機數,效率那可是相當的高,只不過運算時要用到大數運算庫。在一些講求效率的場合應用的話,再做一些對應上的處理,升級一下演算法,那定是相當的完美。
由此可以看出,演算法的優化,如果僅僅停留在大腦能夠想象到的小學數學的階段,那是遠遠達不到要求的。一個優秀的程式設計師,還需要加深對離散數學的理解,雖然,這次提到的演算法已經深入到了數論的層次上了,但是RSA演算法已經是應用非常廣泛的演算法了,對其稍加變通,便可以發揮出更加不可思議的作用。程式設計師還是需要多學習演算法,多學習數學,才能發揮出超出一般程式設計師的不可思議的能力。