1. 程式人生 > >博弈論 斯坦福game theory stanford week 4.0_

博弈論 斯坦福game theory stanford week 4.0_

尋找 方法 得到 一個人 enter body 們的 UC 分享圖片


title: 博弈論 斯坦福game theory stanford week 4-0
tags: note
notebook: 6- 英文課程-15-game theory
---

博弈論 斯坦福game theory stanford week 4-0

perfect information extensive form: taste 完美的信息廣泛的形式:品味

包含時間的博弈形式

一般的博弈的形式中並不包括序列的變量,比如時間變量,或者博弈者的動作序列

所以現在我們可以引入拓展形式來描述上述這些問題

這種形式分為兩種:

  • 完美信息形式
  • 不完美信息形式

完美信息博弈

我們這樣定義通過一個結構:

技術分享圖片

  • N 代表博弈者的集合
  • A 代表行為的集合
  • 剩下的部份是選擇點和這些點的標簽
    • H 代表無終端的選擇點
    • x 所有的可能的行為的集合
    • 技術分享圖片行為的選擇
  • Z 終端點,終結點,與無終端點相排斥的點
  • 收益函數,技術分享圖片

完美信息博弈的例子

技術分享圖片

這是一個關於分錢的博弈,兩個人分兩塊錢

第一個博弈者有三個選項,2-0,1-1,0-2這三種分錢的方式。

對於這三個選擇,博弈者二都有兩個選擇。

同意和不同意

例子中的純策略

這個例子中有多少的純策略呢?

1 有一個選擇點,但是這個點有三個分支。

2 有三個選擇點,每個選擇點有兩個分支。

但是我們的純策略有八種,這是技術分享圖片所以是8.也就是說節點二不是選擇一個決策,而是應對1 的每一個決策選擇一個決策。

技術分享圖片

我們定義: 在一個完美信息拓展決策中,一個人的純策略的個數通過上述公式確定。

一個更加復雜的例子是這樣的

技術分享圖片

玩家2 的選擇有多少種呢?

答案是4種:技術分享圖片

玩家一的呢?

同樣是四種,因為即使有的時候他的第二次決策是並沒有實際效果的,但是在決策開始前他也必須做出。技術分享圖片

在我們定義了純策略的定義後,我們就可以輕易的得到下面定義:

混合策略

最優響應

納什均衡

標準的形式和拓展的形式

對於有些的拓展形式是可以轉化成一般形式的,比如例子1.

技術分享圖片

如下圖所示。

我們可以發現,這種形式會產生冗余,比如左上角和右上角

定理:每一個完美信息博弈都有一個納什均衡

那麽這個博弈的純策略納什均衡是多少呢?

技術分享圖片

答案是我圈出的那個,具體的方法可以使用前面學到的方法進行求解。

subgame perfection 子博弈完美性

在這個博弈中

技術分享圖片

有一個納什均衡是(BH)(CE)

我們看到如果 1 有機會進行第二次選擇,對他來說,他一定不會選擇H,而是會選擇G

不過他這樣做是在威脅2,從而讓他選擇F

在這樣的情境下,我們進行這樣的兩個定義

技術分享圖片

在h的根下的子遊戲G

這個問題就表明了,有的時候子博弈的納什均衡有的時候並不是完整博弈的完整性。

下面的那個納什均衡是子博弈完美的呢?

技術分享圖片

(AG)(CF)是子博弈完美的

因為他的子博弈的納什均衡和完整博弈的納什均衡是一致的。

其他的博弈都是不可信的

Backward induction 後向誘導

在這種的情況下,我們怎麽計算子博弈的完美均衡呢?

思路就是,先從最低端開始尋找,然後一點點的向上尋找。

技術分享圖片

對於這個問題,我們可以使用上面的算法來求解。

不過對於零和問題,我們可以將問題進行簡化。我們可以很輕易的衡量每一個節點的得失,因為是零和博弈,你的獲得就是我的失去。

博弈論 斯坦福game theory stanford week 4.0_