深度分析遊戲中的隨機概率
這段時間公司開發的遊戲上線測試,許多玩家在抽卡時抱怨臉黑,很難抽到所需要的卡牌,而又有一部分玩家反應運氣好能連著抽到紫卡,檢查了下隨機相關邏輯程式碼,並沒有找出問題所在,玩家運氣好與壞只是覺得真有可能是概率原因。
測試開服了幾天之後,需要開放某個限時抽卡活動,在內部測試時,我們發現玩家反應的問題在限時抽卡中格外明顯,尤其是其中最主要的一張稀有卡牌,猜測因為限時抽卡庫配置的種類較少,然後就拿該活動來檢查了下我們遊戲隨機機制問題。
5%概率?20次出現一次?
大部分遊戲策劃使用權值來配置隨機概率,因為權值有個好處就是可以在增加隨機物品時,可以不對之前的配置進行更改,比如:白卡 30,藍卡 10,紫卡 10,轉為概率即是:白卡 60%,藍卡 20%,紫卡 20%。
而上述限時抽卡的例子中,我們的權值配置是5和95,模擬50000次隨機(使用系統隨機函式,如C的rand函式,Python的random庫)得到如下結果:
上圖繪製的是權值為5的卡牌的隨機狀態,紅色的圖是分佈圖,X軸是出現的次數,Y軸是相同卡牌再次出現的間隔。綠色的圖是分佈概率圖,X軸是間隔數,Y軸是概率。按策劃的想法,5%概率應該等同於20次出現一次,那上圖很明顯並不滿足20次出現一次出現規則,實際間隔從近到遠呈下坡形狀分佈,就是說相鄰的概率最大,間隔最大超過160,這與玩家所吐槽的抽卡體驗是一致的。但50000次隨機總共出現了2508次,從統計的意義上來說又是符合5%概率的。所以這個問題,究其原因就是所謂的概率是統計意義上的還是分佈意義上的問題。
最原始的實現
我用列表裡取元素的方式來模擬20次出現一次,為了方便比較異同,直接隨機的方式我也貼上相關程式碼。
1 2 |
pool = [0]*5 + [1]*95
result = [random.choice(a) for i in xrange(N)]
|
上面是直接隨機的方式,只保證5%概率。
1 2 3 4 5 6 7 8 |
pool = []
result = []
for i in xrange(N):
if not pool:
pool = [0]*1 + [1]*19
random.shuffle(pool)
result.append(pool[-1]) del pool[-1]
|
上面是打亂列表,然後依次取元素的方式,保證20次出現一次,而5%概率則是隱含在內的,生成效果如下圖。
該圖明顯跟第一個實現的圖不一樣,上圖表明瞭間隔基本上是落在[0, 40]的區間內,並且均勻分佈在20那條藍色對稱線附近。這個才是最終想要的隨機的效果。紅色的線是正態分佈曲線,是不是很相似?後面我會講到。
眼尖的會發現在第一個實現中我用的pool是[0]*5 + [1]*95,而第二個實現中我用的是[0]*1 + [1]*19。
這裡20次出現一次並不等同於100次出現五次,也是從分佈的意義上來說的,100次出現五次是存在5次連續出現的可能。
針對策劃的配置,我們需要進行預處理,怎麼處理?GCD啊~,5和95的最大公約數是5,所以在第二個實現的程式碼中我直接使用了1和19。
但這裡有個問題,一般策劃配置的隨機庫中肯定有多個物品。權值如果配置的比較隨意的話,很可能就導致GCD為1,這樣想要實現XX次出現一次就不可行了。比如剛才的權值配置5和95,再加一個權值為11的話,就只能實現111次出現5次。
所以這兩種依賴列表的隨機方式並不適用,一是需要維護的列表記憶體會比較大,二是對策劃配置方式有過多約束。
更通用更優美的實現
20次出現一次是以20為標準週期,當然不能每次都是間隔20出現,這樣就太假了,根本沒有隨機感受可言,為了模擬隨機並可以控制一定的出現頻率,我選擇正態分佈來進行偽隨機分佈生成,原因是分佈會更自然一些。
關於正態分佈這裡就不詳細描述了,只需關心分佈的兩個引數即可,位置引數為μ、尺度引數為σ。根據正態分佈,兩個標準差之內的比率合起來為95%;三個標準差之內的比率合起來為99%。
用上面的例子來定下引數,μ=20,σ=20/3,這樣每次按正態分佈隨機,就能得到一個理想的隨機分佈和概率區間。
C語言標準函式庫中只有rand,如何生成符合正態分佈的隨機數可以參見WiKi上的介紹。這裡我直接使用Python中random庫中的normalvariate函式,當然gauss函式也是一樣的,官方文件上說gauss函式會快些,StackOverFlow上說gauss是非執行緒安全函式,所以會快。我自己簡單測試了下,在單執行緒情況下,gauss是會快些,但只是快了一點點而已。
首先,我直接生成權值為5的卡牌的間隔,檢驗下正態分佈的隨機效果。
1 2 3 |
NN = int(N*0.05)
mu, sigma = 20, 20/3.
delta = [int(random.normalvariate(mu, sigma)) for i in xrange(NN)]
|
這圖是不是比第二個實現的圖更好看一些,分佈也更平滑一些呢。OK,接下來就是替換舊的隨機演算法了。
細節和優化
剛才說了隨機庫中會有很多物品,都需要按照各自的權值隨機,並各自出現頻率符合正態分佈。下面我們來說說細節。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
wtp = [1.*x/sum(wt) for x in wt]
result = []
p = [random.normalvariate(1./x, 1./x/3.) for x in wtp]
for i in xrange(N):
minp = 1.e9
minj = -1
for j, pp in enumerate(p):
if pp < minp:
minp = pp
minj = j
result.append(minj)
for j, pp in enumerate(p):
p[j] -= minp
p[minj] = random.normalvariate(1./wtp[minj], 1./wtp[minj]/3.)
|
這裡我使用了統一的隨機種子,隨機測試了500萬次後,所得的結果與多個隨機種子差別不大。
簡單解釋下程式碼:初始化對所有物品按權值進行正態分佈隨機,每次取位置最小值的物品(也就是最先出現的),然後其它物品均減去該值,被取出的物品再單獨進行一次正態分佈隨機,再次迴圈判斷位置最小值。
這裡,每次都需要對所有物品進行求最小值和減法,都是需要遍歷的運算,我們可以有如下優化。
例如:(1,3,4) -> 取1減1, (0,2,3) -> 隨機1, (1,2,3),其實我們只是為了保持各物品之間位置的相對順序即可,將對其它物品的減法變成對自己的加法,操作量級立馬從O(N)縮為O(1) 。
如上面的例子:(1,3,4) -> 取1, (0,3,4) -> 隨機1加1, (2,3,4),這樣的操作不會改變物品序列的正確性。
熟悉最小堆的朋友,將查詢最小值優化到O(1)應該也沒啥問題吧。
1 2 3 4 5 6 7 8 |
wtp = [1.*x/sum(wt) for
|