1. 程式人生 > >一個生成偽隨機數的超級演算法

一個生成偽隨機數的超級演算法

最近瀏覽“程式設計師論壇”時發現不少好帖,增長了不少知識,現拿其中一則為例與大家共同分享心得。

  某人提出一個問題:怎樣才能生成一億個不重複的隨機數?

  問題表述起來很簡單,似乎只要弄明白什麼叫隨機數以及怎樣用電腦生成隨機數,就能解決問題。

  隨機數,個人理解為一定範圍內出現的毫無規律的數,比如扔一個骰子,落在桌面上時朝上的一面所表示的數就是隨機數,這個數只能在1到6的範圍內,但具體是什麼數,誰也不能肯定,因為它沒有規律。一組不重複的隨機數,對扔骰子來說就是扔出六個不一樣的數來,再比如洗一次撲克牌,洗完後就是54張不重複的隨機數。

  第二個問題,怎麼樣用電腦生成隨機數?只要呼叫某個語言的某個函式即可。其實電腦是沒辦法生成真正的隨機數,因為電腦是高度有規律的機器,讓它生成一個沒規律的數,根本辦不到。平時程式設計師用某個函式生成的隨機數,只是利用某個演算法弄出來的偽隨機數,看起來像,其實不是,能解決問題就行。

  回到這個帖子所描述的問題上來。生成一億個不重複的隨機數,最直接的演算法就是每用函式生成一個數,就把它放在一個筐裡,第一個數直接放到筐裡,以後生成的數在放到筐裡之前和筐裡的每一個數比較一番,一旦發現筐裡有和新生成的數一樣的數時,丟掉這個新生成的數,再接著生成數。

  毫無疑問,這種演算法的效率非常低,看看其中的比較次數就知道了,最差的次數趨於無窮次。也就是說到後來,幾乎生成不了和以往不同的數。

  當然還可以將這個演算法升級為效率高得多的演算法,每生成一個數,把這個數從隨機數生成器取的範圍中去掉,比如要生成10個隨機數,第一次生成一個3,我把3從隨機數的範圍中去掉,第二次只從1到9這個範圍內找。3對應4,4對應5……9對應10。這樣就不存在比較的環節,然而又多出一個對應的環節,每生成一個數之後就要把剩下的數重新對應一遍,效率也不容樂觀。

  目前以我為代表的普通程式設計師的想象力也就到此為止,想不出什麼高階解決辦法,就當扔一塊磚頭出來,下面就把真正的碧玉——數學家級程式設計師的演算法隆重介紹請出來。

  我們先用另一種眼光來看不重複的隨機數:加密。把一個能看懂的英文字串打亂字母的順序,變成不可讀,這就是加密。但必須得有規律地打亂,字母a對應另外一個固定的字母Ax,字母b對應另外一個固定的字母Bx,以此類推,而且必須一一對應的。那麼字串“ab…z”這26個字母對應的26個加密字母“AxBx和Zx”就可以看成是對應範圍a到z的不重複的偽隨機數,這就是數學家的演算法的來源。

  看看回帖者的原文:

  “可以採用32bit RSA演算法  設A從2~(N-1)   C=(A EXP D)  mod N   滿足如下條件:   D是素數,N是兩個素數(P,Q)之積,   (D * E) mod ((P-1) * (Q-1))=1   因為:若   C=(A EXP D)mod N   有:   A=(C EXP E) mod N   所以,C與A 一一對應。   所以,對於A=2~(N-1),有不重複,無遺漏的偽隨機碼C。”

  凡是稍微扯上一點數學,尤其是高等數學的問題,我等泛泛之輩看起來就有點費勁,這裡雖然文字不長,但是還得慢慢來看。

  這裡面RSA演算法是密碼學三大演算法之一(RSA、MD5、DES),是一種不對稱密碼演算法。說如果滿足條件:D是素數,N是兩個素數(P,Q)之積,(D * E) mod ((P-1) * (Q-1))=1,那麼存在C與A(範圍從2到N-1)一一對應,且C=(A EXP D)mod N。A是一個有順序的數,C就是一個看似無規律的偽隨機數。Mod運算表示求模,例如7Mod3=1。意思是7除以3餘1。類似地8Mod3=2,9Mod3=0。EXP表示前面數的後面數次方,AEXPD表示A的D次方。這兩個運算清楚了,其它的也就沒什麼困難的了,*是乘法的意思,大多數理科生都清楚。

  搜了一下網路,還得加上一些條件,1,P和Q不能一樣。2,e< --e--p>

  下面用一個例子來試驗一下,看看這個演算法有多神奇。

  設N=15,P=5,Q=3,則A為2到14的數。現在要產生2到14的偽隨機數。取D為3,E為3,

  C2=(2EXP3)mod15 = 8,  

  C3=(3EXP3)mod 15 = 12,
  C4  = (4EXP3)mod 15= 4,
  C5  = (5EXP3)mod 15= 5,
  C6  = (6EXP3)mod 15= 6,
  C7  = (7EXP3)mod 15= 13,
  C8  = (8EXP3)mod 15= 2,
  C9  = (9EXP3)mod 15= 9,
  C10  = (10EXP3)mod 15= 10,
  C11  = (11EXP3)mod 15= 11,
  C12  = (12EXP3)mod 15= 3,
  C13  = (13EXP3)mod 15= 7,
  C14  = (14EXP3)mod 15= 14。

  比較完美,如果數再大一點,可能看起來更隨機一些。

  由這個演算法產生的1億的偽隨機數,效率那可是相當的高,只不過運算時要用到大數運算庫。在一些講求效率的場合應用的話,再做一些對應上的處理,升級一下演算法,那定是相當的完美。

  由此可以看出,演算法的優化,如果僅僅停留在大腦能夠想象到的小學數學的階段,那是遠遠達不到要求。一個優秀的程式設計師,還需要加深對離散數學的理解,雖然,這次提到的演算法已經深入到了數論的層次上了,但是RSA演算法已經是應用非常廣泛的演算法,對其稍加變通,便可以發揮出更加不可思議的作用。程式設計師還是需要多學習演算法,多學習數學,才能發揮出超出一般程式設計師的不可思議的能力。