博弈論 斯坦福game theory stanford week 4.0_
title: 博弈論 斯坦福game theory stanford week 4-0
tags: note
notebook: 6- 英文課程-15-game theory
---
博弈論 斯坦福game theory stanford week 4-0
perfect information extensive form: taste 完美的信息廣泛的形式:品味
包含時間的博弈形式
一般的博弈的形式中並不包括序列的變量,比如時間變量,或者博弈者的動作序列
所以現在我們可以引入拓展形式來描述上述這些問題
這種形式分為兩種:
- 完美信息形式
- 不完美信息形式
完美信息博弈
我們這樣定義通過一個結構:
- N 代表博弈者的集合
- A 代表行為的集合
- 剩下的部份是選擇點和這些點的標簽
- H 代表無終端的選擇點
- x 所有的可能的行為的集合
- 行為的選擇
- Z 終端點,終結點,與無終端點相排斥的點
- 收益函數,
完美信息博弈的例子
這是一個關於分錢的博弈,兩個人分兩塊錢
第一個博弈者有三個選項,2-0,1-1,0-2這三種分錢的方式。
對於這三個選擇,博弈者二都有兩個選擇。
同意和不同意
例子中的純策略
這個例子中有多少的純策略呢?
1 有一個選擇點,但是這個點有三個分支。
2 有三個選擇點,每個選擇點有兩個分支。
但是我們的純策略有八種,這是所以是8.也就是說節點二不是選擇一個決策,而是應對1 的每一個決策選擇一個決策。
我們定義: 在一個完美信息拓展決策中,一個人的純策略的個數通過上述公式確定。
一個更加復雜的例子是這樣的
玩家2 的選擇有多少種呢?
答案是4種:
玩家一的呢?
同樣是四種,因為即使有的時候他的第二次決策是並沒有實際效果的,但是在決策開始前他也必須做出。
在我們定義了純策略的定義後,我們就可以輕易的得到下面定義:
混合策略
最優響應
納什均衡
標準的形式和拓展的形式
對於有些的拓展形式是可以轉化成一般形式的,比如例子1.
如下圖所示。
我們可以發現,這種形式會產生冗余,比如左上角和右上角
定理:每一個完美信息博弈都有一個納什均衡
那麽這個博弈的純策略納什均衡是多少呢?
答案是我圈出的那個,具體的方法可以使用前面學到的方法進行求解。
subgame perfection 子博弈完美性
在這個博弈中
有一個納什均衡是(BH)(CE)
我們看到如果 1 有機會進行第二次選擇,對他來說,他一定不會選擇H,而是會選擇G
不過他這樣做是在威脅2,從而讓他選擇F
在這樣的情境下,我們進行這樣的兩個定義
在h的根下的子遊戲G
這個問題就表明了,有的時候子博弈的納什均衡有的時候並不是完整博弈的完整性。
下面的那個納什均衡是子博弈完美的呢?
(AG)(CF)是子博弈完美的
因為他的子博弈的納什均衡和完整博弈的納什均衡是一致的。
其他的博弈都是不可信的
Backward induction 後向誘導
在這種的情況下,我們怎麽計算子博弈的完美均衡呢?
思路就是,先從最低端開始尋找,然後一點點的向上尋找。
對於這個問題,我們可以使用上面的算法來求解。
不過對於零和問題,我們可以將問題進行簡化。我們可以很輕易的衡量每一個節點的得失,因為是零和博弈,你的獲得就是我的失去。
博弈論 斯坦福game theory stanford week 4.0_