一個生成偽隨機數的超級演算法
最近瀏覽“程式設計師論壇”時發現不少好帖,增長了不少知識,現拿其中一則為例與大家共同分享心得。
某人提出一個問題:怎樣才能生成一億個不重複的隨機數?
問題表述起來很簡單,似乎只要弄明白什麼叫隨機數以及怎樣用電腦生成隨機數,就能解決問題。
隨機數,個人理解為一定範圍內出現的毫無規律的數,比如扔一個骰子,落在桌面上時朝上的一面所表示的數就是隨機數,這個數只能在1到6的範圍內,但具體是什麼數,誰也不能肯定,因為它沒有規律。一組不重複的隨機數,對扔骰子來說就是扔出六個不一樣的數來,再比如洗一次撲克牌,洗完後就是54張不重複的隨機數。
第二個問題,怎麼樣用電腦生成隨機數?只要呼叫某個語言的某個函式即可。其實電腦是沒辦法生成真正的隨機數,因為電腦是高度有規律的機器,讓它生成一個沒規律的數,根本辦不到。平時程式設計師用某個函式生成的隨機數,只是利用某個演算法弄出來的偽隨機數,看起來像,其實不是,能解決問題就行。
回到這個帖子所描述的問題上來。生成一億個不重複的隨機數,最直接的演算法就是每用函式生成一個數,就把它放在一個筐裡,第一個數直接放到筐裡,以後生成的數在放到筐裡之前和筐裡的每一個數比較一番,一旦發現筐裡有和新生成的數一樣的數時,丟掉這個新生成的數,再接著生成數。
毫無疑問,這種演算法的效率非常低,看看其中的比較次數就知道了,最差的次數趨於無窮次。也就是說到後來,幾乎生成不了和以往不同的數。
當然還可以將這個演算法升級為效率高得多的演算法,每生成一個數,把這個數從隨機數生成器取的範圍中去掉,比如要生成10個隨機數,第一次生成一個3,我把3從隨機數的範圍中去掉,第二次只從1到9這個範圍內找。3對應4,4對應5……9對應10。這樣就不存在比較的環節,然而又多出一個對應的環節,每生成一個數之後就要把剩下的數重新對應一遍,效率也不容樂觀。
目前以我為代表的普通程式設計師的想象力也就到此為止,想不出什麼高階解決辦法,就當扔一塊磚頭出來,下面就把真正的碧玉——數學家級程式設計師的演算法隆重介紹請出來。
我們先用另一種眼光來看不重複的隨機數:加密。把一個能看懂的英文字串打亂字母的順序,變成不可讀,這就是加密。但必須得有規律地打亂,字母a對應另外一個固定的字母Ax,字母b對應另外一個固定的字母Bx,以此類推,而且必須一一對應的。那麼字串“ab…z”這26個字母對應的26個加密字母“AxBx和Zx”就可以看成是對應範圍a到z的不重複的偽隨機數,這就是數學家的演算法的來源。
看看回帖者的原文:
“可以採用32bit RSA演算法 設A從2~(N-1) C=(A EXP D) mod N 滿足如下條件: D是素數,N是兩個素數(P,Q)之積, (D * E) mod ((P-1) * (Q-1))=1 因為:若 C=(A EXP D)mod N 有: A=(C EXP E) mod N 所以,C與A 一一對應。 所以,對於A=2~(N-1),有不重複,無遺漏的偽隨機碼C。”
凡是稍微扯上一點數學,尤其是高等數學的問題,我等泛泛之輩看起來就有點費勁,這裡雖然文字不長,但是還得慢慢來看。
這裡面RSA演算法是密碼學三大演算法之一(RSA、MD5、DES),是一種不對稱密碼演算法。說如果滿足條件:D是素數,N是兩個素數(P,Q)之積,(D * E) mod ((P-1) * (Q-1))=1,那麼存在C與A(範圍從2到N-1)一一對應,且C=(A EXP D)mod N。A是一個有順序的數,C就是一個看似無規律的偽隨機數。Mod運算表示求模,例如7Mod3=1。意思是7除以3餘1。類似地8Mod3=2,9Mod3=0。EXP表示前面數的後面數次方,AEXPD表示A的D次方。這兩個運算清楚了,其它的也就沒什麼困難的了,*是乘法的意思,大多數理科生都清楚。
搜了一下網路,還得加上一些條件,1,P和Q不能一樣。2,e< --e--p>
下面用一個例子來試驗一下,看看這個演算法有多神奇。
設N=15,P=5,Q=3,則A為2到14的數。現在要產生2到14的偽隨機數。取D為3,E為3,
C2=(2EXP3)mod15 = 8,
C3=(3EXP3)mod 15 = 12,
C4 = (4EXP3)mod 15= 4,
C5 = (5EXP3)mod 15= 5,
C6 = (6EXP3)mod 15= 6,
C7 = (7EXP3)mod 15= 13,
C8 = (8EXP3)mod 15= 2,
C9 = (9EXP3)mod 15= 9,
C10 = (10EXP3)mod 15= 10,
C11 = (11EXP3)mod 15= 11,
C12 = (12EXP3)mod 15= 3,
C13 = (13EXP3)mod 15= 7,
C14 = (14EXP3)mod 15= 14。
比較完美,如果數再大一點,可能看起來更隨機一些。
由這個演算法產生的1億的偽隨機數,效率那可是相當的高,只不過運算時要用到大數運算庫。在一些講求效率的場合應用的話,再做一些對應上的處理,升級一下演算法,那定是相當的完美。
由此可以看出,演算法的優化,如果僅僅停留在大腦能夠想象到的小學數學的階段,那是遠遠達不到要求。一個優秀的程式設計師,還需要加深對離散數學的理解,雖然,這次提到的演算法已經深入到了數論的層次上了,但是RSA演算法已經是應用非常廣泛的演算法,對其稍加變通,便可以發揮出更加不可思議的作用。程式設計師還是需要多學習演算法,多學習數學,才能發揮出超出一般程式設計師的不可思議的能力。