1. 程式人生 > >博弈論 納什均衡 囚徒困境 智豬博弈

博弈論 納什均衡 囚徒困境 智豬博弈

1.博弈論是什麼

博弈論(game theory),又譯為對策論,或者賽局理論,經濟學的一個分支,1944年馮·諾伊曼與奧斯卡·摩根斯特恩合著《博弈論與經濟行為》,標誌著現代系統博弈理論的的初步形成,因此他被稱為“博弈論之父”。博弈論被認為是20世紀經濟學最偉大的成果之一。目前在生物學、經濟學、國際關係、電腦科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈)間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。 具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,併力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中鬥爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。

2.納什均衡(Nash equilibrium)

納什平衡(Nash equilibrium),又稱為非合作博弈均衡,是在非合作博弈(Non-cooperative game)狀況下的一個概念解,在博弈論中有重要地位,以約翰·納什命名。 如果某情況下無一參與者可以通過獨自行動而增加收益,則此策略組合被稱為納什均衡點。 納什均衡的定義:在博弈G=S1, ,Sn:u1, ,unG={S_1,\cdots,S_n:u_1,\cdots,u_n}中,如果由各個博弈方的各一個策略組成的某個策略組合(s

1, ,sn)(s_1^*,\cdots, s_n^*)中,任一博弈方i的策論sis_i^*,都是對其餘博弈方策略的組合(s1, ,si1,si+1,sn)(s_1^*,\cdots,s_{i-1}^*,s_{i+1}^*,…,s_n^*)的最佳對策,也即ui(s1, ,si1,si,si+1, ,snui(s1, ,
si1,sij,si+1, ,sn)u_i(s_1^*,\cdots,s_{i-1}^*,s_i^*,s_{i+1}^*,\cdots,s_n^*)≥u_i(s_1^*,\cdots,s_{i-1}^*,s_{ij}^*,s_{i+1}^*,\cdots,s_n^*)
對任意sijSis_{ij}∈S_i都成立,則稱(s1, ,sn)(s_1^*,\cdots,s_n^*)為G的一個納什均衡。 一場博弈用G表示,SiS_i表示博弈方i的策略,uiu_i表示收益。因此,納什均衡的意思是:任何一方採取的策略都是對其餘所有方採取策略組合下的最佳對策;當所有其他人都不改變策略時,為了讓自己的收益最大,任何一方都不會(或者無法)改變自己的策略,這個時候的策略組合就是一個納什均衡。

3.囚徒困境(Prisoner’s Dilemma)