1. 程式人生 > >兩人零和博弈的納什均衡

兩人零和博弈的納什均衡

情況 如果 問題 一位 博弈 如何 解決 改變 簡單的

納什均衡簡單的理解:在這種策略下,任何一位玩家都不願意單方面的改變自己的策略。

本系列討論:如何用代碼計算兩人零和博弈的納什均衡

例如這樣一個賭局

規則:兩人各自亮出硬幣的一面。如果兩人都是正面,那麽A給B3元,如果兩人都是反面,A給B1元,剩下的情況B給A2元。

這個賭局看似公平,但其實非也。

分析:假設A以p1、p2的概率出正面、反面。

當B出正面時,A的收益為:w1=-3元*p1+2元*p2

當B出反面時,A的收益為:w2=2元*p1-1元*p2

令w1=w2

得p1=3/8,w1=w2=1/8

可見,A可以通過合理的策略獲得優勢。

當然,我們也可以用代碼來解決問題。

兩人零和博弈的納什均衡