1. 程式人生 > >讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計

lte down 保持 最優 化工 href 滿足 動態 rul

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計

機制設計(Mechanism Design)

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

機制設計的概念

機制設計的目標是設計一個可以達到期望收益的博弈。
由於這是根據博弈結果來推導博弈的形式,也被稱為反向博弈論(reverse game theory)。
這個理論明顯在經濟和政治方面有很多用途。
我們假象這樣一個例子:

某個政府需要設計一個關於化工廠的環保政策。
這個政策可能涉及到:幾個化工廠、政府和大眾。
大概的想法是:政府有一些排放許可;化工廠需要從政府那裏買排放許可;政府和大眾利用獲得的資金改善環境。

機制設計的核心是:制定玩家的行動和支付資金的關系。

從上面的例子可以看出一些新的元素:

  • 排放許可
    在理論中稱之為替代選擇(alternatives),或者叫做公共物品(public good)。
  • 資金的轉移(monetary transfer)

新的概念:

  • 機制設計者(mechanism designer)
    也稱為中央集權(central authority)。中央集權不一定是玩家。
  • 替代選擇(alternatives)或者公共物品(public good)
    中央集權提供的公共物品或者服務。
    將成為玩家的結果(outcome)的一部分。
  • 資金的轉移(monetary transfer)
    每個玩家獲得的資金。負數表示支付的資金,
    成為收益函數的一部分。
  • 收益函數
    在機制設計中,玩家的結果包含兩部分:公共物品和資金的轉移。
    另外,我們簡單地加上資金部分作為收益。
    所以收益函數變為:
    \[ v_i(x, m_i, \theta_i) = u(x, \theta_i) + m_i \]
  • 所有玩家的一個結果組合(outcomes)
    這裏用y來表示,以區分x。
    \[ y = (x, m_1, \cdots, m_n) : x \in X, m_i \in \mathbb{R} \ \forall i \in N, \sum_{i=1}^{n} m_i \leq 0 \y_i = (x_i, m_i) \]
  • 選擇規則(choice rule)
    根據類型\(\theta\)得到機制的結果\(y\)
    \[ f(\theta) = (x(\theta), m_1(\theta), \cdots, m_n(\theta)) \where \x(\theta) \text( : decision rule) \(m_1(\theta), \cdots, m_n(\theta)) \text( : transfer rule) \]
    選擇條件定義了每個類型想要的結果。

機制設計者面臨的問題和一個方向

機制設計者面臨的問題和一個方向

在不完整信息博弈中,私有信息(機制設計者不知道的信息):

  • 每個玩家的類型\(\theta\)
    公共知識:
  • 類型集合\(\Theta\)
  • 每種類型的選擇規則,也就是每種類型玩家傾向的結果
  • 每種類型的策略,就是每種類型玩家的傾向策略
  • 策略行動導致的結果。

機制設計的兩個方向之一,是在不知道玩家的類型(這是私有信息)的情況下,
設計出一個足夠聰明的博弈,能夠保證:

  • 對於每種類型的玩家組合,其選擇規則的結果,和博弈的貝葉斯納什均衡的結果一致。
    也就是說,其選擇規則結果和博弈的策略引起的結果一致。
    滿足上面條件的機制,則稱之實現了選擇規則。
    下面是相應的數學說明。
  • 機制(mechanism)
    機制規定了玩家的行動集合,以及行動結果與資金轉移的關系。
    \[ \Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle \where \g : A_1 \times \cdots A_n \to Y \\]
  • 玩家i的純策略
    \(s_i : \Theta_i \to A_i\)
  • 玩家i的收益函數
    \(v_i(g(s), \theta_i)\)

  • 貝葉斯納什均衡(Bayesian Nash Equilibrium)
    如果滿足下面條件,一個策略組合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)
    是一個機制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的貝葉斯納什均衡:
    \[ E_{\theta_{-1}} [v_i(g(s_i^*(\theta_i), s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(a_i, s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i], \forall a_i \in A_i, \forall i \in N, \forall \theta_i \in \Theta_i \]

    也就是說,對於每種類型組合,每個玩家,當對手的策略是這個策略組合時,這個玩家的這個策略組合的策略是最優的(其期望收益大於等於其它的所有策略的期望收益)。

  • 機制實現選擇規則
    如果滿足下面條件,則這個機制\(\Gamma\)實現了(implement)選擇規則\(f(\cdot)\):
    存在一個貝葉斯納什均衡\(s^*(s_1^*(\theta_1), \cdots, s_n^*(\theta_n))\),滿足:
    \[ g(s_1^*(\theta_1), \cdots, s_n^*(\theta_n)) = f(\theta), \forall \theta_i \in \Theta_i \]

  • 部分實現(partial implementation)和完全實現(full implementation)
    除了期望的貝葉斯納什均衡,如果允許存在其它的、不期望的均衡,成為部分實現;
    如果不允許存在其它的、不期望的均衡,成為完全實現;

揭露原理(the revelation principle)

機制設計的另外一個方向:玩家意識到機制設計者會實現他的選擇條件\(f(\cdot)\)時,玩家會透露自己的類型。

  • 直接揭露機制(direct revelation mechanism)
    一個選擇規則\(f(\cdot)\)的直接揭露機制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)是:
    \[ A_i = \Theta_i, \forall i \in N \g(\theta) = f(\theta), \forall \theta \in \Theta \]
    解釋:

    對於每個玩家,其行動集合\(\Theta\)是選擇規則\(\Theta_i\)對應的行動集合(想象一下,每個類型對應一個策略,一個策略對應一個行動)。
    對於每個類型\(\theta\),它的選擇規則(想要的)結果\(f(\theta)\)和機制設計的結果\(g(\theta)\)一致。

  • 在貝葉斯納什均衡中誠實地可實現的(truthfully implementable in Bayesian Nash equilibrium)
    一個選擇規則\(f(\cdot)\)是在貝葉斯納什均衡中誠實地可實現的,
    如果這個選擇規則的直接揭露機制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)有一個貝葉斯納什均衡\(s_i^*(\theta_i) = \theta_i\),
    也就是說,滿足:
    \[ E_{\theta_{-1}} [v_i(f(\theta_i, \theta_{-i}), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(\theta_i', \theta_{-i}), \theta_i) | \theta_i], \forall \theta_i' \in \Theta_i \]
    解釋:

    當解釋規則的直接揭露機制有有一個貝葉斯納什均衡解,則其實完全可滿足的。

推論 14.1 : 對於貝葉斯納什實現的揭露原理
一個選擇規則\(f(\cdot)\)在貝葉斯納什均衡中是可實現的,當且僅當它在貝葉斯納什均衡中誠實地可實現的(truthfully implementable in Bayesian Nash equilibrium)。

揭露原理的想法:

在均衡中,玩家知道這個機制實現了選擇規則\(f(\cdot)\),所以會何其保持一致。
因此他們可能會誠實地述說他們的類型,讓機制設計者直接實現選擇規則\(f(\cdot)\)

優勢策略和Vickrey-Clarke-Groves機制

  • 優勢策略
    如果滿足以下條件,則策略組合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)是一個機制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的優勢策略:
    \[ v_i(g(s_i^*(\theta), a_{-i}), \theta_i) \geq v_i(g(a_i', a_{-i}), \theta_i), \forall a_i \in A_i, \forall a_{-i} \in A_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i \]
    同時,揭露原理意味著如果選擇法則\(f(\cdot)\)如果一個選擇規則可以被一個優勢策略實現,我們只要檢測這個選擇法則是在優勢策略中誠實地可實現的。
    即:
    \[ v_i(f(\theta_i, \theta_{-i}), \theta_i) \geq v_i(f(\theta_i', \theta_{-i}), \theta_i), \forall \theta_i \in \Theta_i, \forall \theta_{-i} \in \Theta_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i \]

推論 14.2
在一個準線性(quasilinear)環境中,給定一個實例狀態\(\theta \in \Theta\)
一個替代物(alternative)\(x^* \in X\)是一個帕累托優化,當且僅當下面有一個解:
\[ \max_{x \in X} \sum_{i=1}^I u_i(x_i, \theta_i) \]

  • First-best decision rule
    如果對於\(\forall \ \theta \in \Theta\), \(x^*(\theta)\)都是帕累托優化的,則\(x^*(\cdot)\)為First-best decision rule。

  • Vickrey-Clarke-Groves機制
    給定一個宣布的類型\(\theta'\)
    這個選擇規則\(f(\theta') = (x(\theta'), m_1(\theta'), \cdots, m_n(\theta') )\)是一個Vickrey-Clarke-Groves機制,
    如果\(x^*(\cdot)\)是一個第一好決定規則(first-best decision rule),並且:
    \[ m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) + h_i(\theta'_{-i}) \where \h_i(\theta'_{-i}) \text{ is an arbitrary function of } \theta'_{-i} \]

解釋:

沒有完全看懂。大概的意思是對於First-best decision rule \(x^*(\cdot)\)
可以找到一個轉移規則\((m_1(\cdot), \cdots, m_n(\cdot))\)
讓選擇規則成為一個在優勢策略中可實現。

下面是一個解:

  • Pivotal Mechanism - a particular form of Vickrey-Clarke-Groves機制
    \[ h_i(\theta'_{-i}) = - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \where \x_{-i}^*(\theta'_{-i}) \in \arg \max_{x \in X} \sum_{j \neq i} u_j(x, \theta'_j) \Thus \m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \\]

參照

  • Game Theory An Introduction (by Steven Tadelis)
  • 讀書筆記: 博弈論導論 - 01 - 單人決策問題
  • 讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間
  • 讀書筆記: 博弈論導論 - 03 - 預備知識
  • 讀書筆記: 博弈論導論 - 04 - 理性和公共知識
  • 讀書筆記: 博弈論導論 - 05 - 納什均衡
  • 讀書筆記: 博弈論導論 - 06 - 混合的策略
  • 讀書筆記: 博弈論導論 - 07 - 完美信息的動態博弈 預備知識
  • 讀書筆記: 博弈論導論 - 08 - 完美信息的動態博弈 可信性和順序合理性
  • 讀書筆記: 博弈論導論 - 09 - 完美信息的動態博弈 多階段博弈
  • 讀書筆記: 博弈論導論 - 10 - 完美信息的動態博弈 重復的博弈
  • 讀書筆記: 博弈論導論 - 11 - 完美信息的動態博弈 戰略協議
  • 讀書筆記: 博弈論導論 - 12 - 不完整信息的靜態博弈 貝葉斯博弈
  • 讀書筆記: 博弈論導論 - 13 - 不完整信息的靜態博弈 拍賣和競標
  • 讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計
  • Nash bargaining solution
  • Mechanism design

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計