1. 程式人生 > >博弈論 斯坦福game theory stanford week 4.1_

博弈論 斯坦福game theory stanford week 4.1_

http not 什麽 原來 接下來 notebook 隨機 分析 信息


title: 博弈論 斯坦福game theory stanford week 4-1
tags: note
notebook: 6- 英文課程-15-game theory
---

博弈論 斯坦福game theory stanford week 4-1

最後通牒式議價

他的形式是這樣的,一個博弈者向另外一個博弈者提供一個價格,另一個決策者選擇是否接受,如果不接受那麽兩個人將會什麽都得不到。

如果接受,那麽1得到10-x,2得到x

技術分享圖片

在上述條件下,我們可以推論玩家2可能會接受所有的可能的x,如果玩家1讓x=0,他都有可能會接受。在這樣的條件下,玩家1會不會接受0主要取決於玩家2會不會接受0.

但是在實際的博弈中並非是這樣的,更多的人願意選擇和接受5

子遊戲的完美性也許有時候並不適應整個的現實,但是他會幫助我們深入的理解博弈的本質。

有些的情況是十分難以解決的:比如下棋。並且我們很難相信人類是完全通過邏輯來解決下期問題的。這需要經驗和靈感。

不完全信息博弈

我們考慮撲克遊戲,在玩撲克遊戲的時候,人們相互之間進行博弈,但是他們每個人都不能掌握完整的信息。

在撲克中:

我們有很多不同的手牌

有很多不同的策略

並且我們很難通過畫出樹狀圖的形式來描述這個遊戲,我們對於這種遊戲可以學習很多。

不完整信息形式--定義和策略

我們之前分析的情況是每個人都知道其他人的選擇,我們使用樹形結構來對這些情況進行描寫。但是在我們之前討論的棋牌遊戲中,我們無法知道別人可以進行的選擇。所以我們定義不完整信息博弈的情況如下。

技術分享圖片

可以看到,定義和之前的很像。

我們舉個例子:

技術分享圖片

在這樣的博弈中,我們看到博弈者1有兩個選擇節點。由於他的信息並不能提前得到,因此他在第二次選擇的時候只能選擇一種情況。l 和 r。

因此博弈者一只有四種選擇的可能分別是:

Ll,Lr,Rl,Rr

同樣的我們可以用這種形式描述任何的一般形式的博弈。

比如我們之前用過的TCP問題。

不完整信息問題的純策略

和之前的方法相同,我們可以為所有的博弈找到他們的純策略。

混合策略和純策略都可以用原來的定義進行描述,

在這樣的情況下,我們可以定義將一個深度很高的樹,轉化為一個很寬的樹,同樣的我們可以將一個很寬的樹轉化成一個深度很高的樹。

混合的和行為性的策略

我們在解決不完整信息博弈問題中有兩種主要的策略,一種是混合策略,一種是行為策略。

混合策略是隨機使用所有的純策略

行為策略,還是用這個博弈作為例子,我們來看下行為策略是什麽樣的。

行為策略這樣描述,選擇A的概率是0.5,選擇G的概率是0.3。

混合策略是這樣的:0.6選擇(AG),0.4選擇GH。

看起來這兩種策略的形式十分的相似,可以進行相互的轉化,

回顧

技術分享圖片

在這樣的一個博弈中,我們有以下幾點可以得到:

  1. 博弈者2的D是一個占優策略
  2. LR這個博弈是一個十分的有優勢的博弈,但是在混合策略中不能得到。

那麽在行為策略中的均衡在哪裏呢?

同樣的,我們可以知道,D是占優的。如果我們使用行為策略,我們可以使用列方程的形式進行衡量。

技術分享圖片

可以接觸

非完整信息博弈的解決

在不完整信息博弈中可能沒有合適的子問題,不過我們可以進行推理。

技術分享圖片

在這樣的問題中,我們帶入如下的情景:

  • 有一家公司想要進入某一領域和另外一家公司競爭。
  • 第一個N節點代表他是否強於另外一家公司。
  • 第一家公司會選擇是否進入這個領域,接下來原來這個領域的公司會選擇是否會與之競爭。

我們分析,無論公司是強是弱,他選擇進入領域,如果他的對手與之爭鬥他都會遭到損失,在這樣的情況下,他不會選擇進入這個領域,所以在這個情景內。公司不會進入這個領域。

因此均衡出現在:

技術分享圖片

這個條件下。

但是如果我們這樣考慮,考慮公司2的選擇,他選擇與之競爭一定會造成損失。那麽他如果選擇接受呢?

如果新的公司是強大的,那麽他會選擇進入,因為這有更大的收益,如果不強大,那麽他會選擇不進入。

這是另外一個納什均衡。

序列均衡和完美貝葉斯均衡

人們在很多情況是根據他們的估計和信念進行選擇的。就像前面的博弈,有兩個納什均衡,但是具體會走向那個納什均衡,要看他麽之間的估計和信念。

博弈論 斯坦福game theory stanford week 4.1_