讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

阿新 • • 發佈：2018-01-28

lte down 保持最優化工 href 滿足動態 rul

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

機制設計(Mechanism Design)

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

機制設計的概念

機制設計的目標是設計一個可以達到期望收益的博弈。
由於這是根據博弈結果來推導博弈的形式，也被稱為反向博弈論(reverse game theory)。
這個理論明顯在經濟和政治方面有很多用途。
我們假象這樣一個例子：

某個政府需要設計一個關於化工廠的環保政策。
這個政策可能涉及到：幾個化工廠、政府和大眾。
大概的想法是：政府有一些排放許可；化工廠需要從政府那裏買排放許可；政府和大眾利用獲得的資金改善環境。

機制設計的核心是：制定玩家的行動和支付資金的關系。

從上面的例子可以看出一些新的元素：

排放許可
在理論中稱之為替代選擇(alternatives)，或者叫做公共物品(public good)。
資金的轉移(monetary transfer)

新的概念：

機制設計者(mechanism designer)
也稱為中央集權(central authority)。中央集權不一定是玩家。
替代選擇(alternatives)或者公共物品(public good)
中央集權提供的公共物品或者服務。
將成為玩家的結果(outcome)的一部分。
資金的轉移(monetary transfer)

每個玩家獲得的資金。負數表示支付的資金，
成為收益函數的一部分。
收益函數
在機制設計中，玩家的結果包含兩部分：公共物品和資金的轉移。
另外，我們簡單地加上資金部分作為收益。
所以收益函數變為:
\[ v_i(x, m_i, \theta_i) = u(x, \theta_i) + m_i \]
所有玩家的一個結果組合(outcomes)
這裏用y來表示，以區分x。
\[ y = (x, m_1, \cdots, m_n) : x \in X, m_i \in \mathbb{R} \ \forall i \in N, \sum_{i=1}^{n} m_i \leq 0 \y_i = (x_i, m_i) \]
選擇規則(choice rule)
根據類型\(\theta\)得到機制的結果\(y\)。
\[ f(\theta) = (x(\theta), m_1(\theta), \cdots, m_n(\theta)) \where \x(\theta) \text( : decision rule) \(m_1(\theta), \cdots, m_n(\theta)) \text( : transfer rule) \]
選擇條件定義了每個類型想要的結果。

機制設計者面臨的問題和一個方向

機制設計者面臨的問題和一個方向

在不完整信息博弈中，私有信息（機制設計者不知道的信息）：

每個玩家的類型\(\theta\)。
公共知識：

類型集合\(\Theta\)

每種類型的選擇規則，也就是每種類型玩家傾向的結果

每種類型的策略，就是每種類型玩家的傾向策略

策略行動導致的結果。

機制設計的兩個方向之一，是在不知道玩家的類型（這是私有信息）的情況下，
設計出一個足夠聰明的博弈，能夠保證：

對於每種類型的玩家組合，其選擇規則的結果，和博弈的貝葉斯納什均衡的結果一致。
也就是說，其選擇規則結果和博弈的策略引起的結果一致。
滿足上面條件的機制，則稱之實現了選擇規則。
下面是相應的數學說明。

機制(mechanism)
機制規定了玩家的行動集合，以及行動結果與資金轉移的關系。
\[ \Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle \where \g : A_1 \times \cdots A_n \to Y \\]
玩家i的純策略
\(s_i : \Theta_i \to A_i\)
玩家i的收益函數
\(v_i(g(s), \theta_i)\)
貝葉斯納什均衡(Bayesian Nash Equilibrium)
如果滿足下面條件，一個策略組合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)
是一個機制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的貝葉斯納什均衡：
\[ E_{\theta_{-1}} [v_i(g(s_i^*(\theta_i), s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(a_i, s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i], \forall a_i \in A_i, \forall i \in N, \forall \theta_i \in \Theta_i \]

也就是說，對於每種類型組合，每個玩家，當對手的策略是這個策略組合時，這個玩家的這個策略組合的策略是最優的（其期望收益大於等於其它的所有策略的期望收益）。
機制實現選擇規則
如果滿足下面條件，則這個機制\(\Gamma\)實現了(implement)選擇規則\(f(\cdot)\):
存在一個貝葉斯納什均衡\(s^*(s_1^*(\theta_1), \cdots, s_n^*(\theta_n))\)，滿足：
\[ g(s_1^*(\theta_1), \cdots, s_n^*(\theta_n)) = f(\theta), \forall \theta_i \in \Theta_i \]
部分實現(partial implementation)和完全實現(full implementation)
除了期望的貝葉斯納什均衡，如果允許存在其它的、不期望的均衡，成為部分實現；
如果不允許存在其它的、不期望的均衡，成為完全實現；

揭露原理(the revelation principle)

機制設計的另外一個方向：玩家意識到機制設計者會實現他的選擇條件\(f(\cdot)\)時，玩家會透露自己的類型。

直接揭露機制(direct revelation mechanism)
一個選擇規則\(f(\cdot)\)的直接揭露機制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)是:
\[ A_i = \Theta_i, \forall i \in N \g(\theta) = f(\theta), \forall \theta \in \Theta \]
解釋：

對於每個玩家，其行動集合\(\Theta\)是選擇規則\(\Theta_i\)對應的行動集合（想象一下，每個類型對應一個策略，一個策略對應一個行動）。
對於每個類型\(\theta\)，它的選擇規則（想要的）結果\(f(\theta)\)和機制設計的結果\(g(\theta)\)一致。
在貝葉斯納什均衡中誠實地可實現的(truthfully implementable in Bayesian Nash equilibrium)
一個選擇規則\(f(\cdot)\)是在貝葉斯納什均衡中誠實地可實現的，
如果這個選擇規則的直接揭露機制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)有一個貝葉斯納什均衡\(s_i^*(\theta_i) = \theta_i\),
也就是說，滿足：
\[ E_{\theta_{-1}} [v_i(f(\theta_i, \theta_{-i}), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(\theta_i', \theta_{-i}), \theta_i) | \theta_i], \forall \theta_i' \in \Theta_i \]
解釋：

當解釋規則的直接揭露機制有有一個貝葉斯納什均衡解，則其實完全可滿足的。

推論 14.1 : 對於貝葉斯納什實現的揭露原理
一個選擇規則\(f(\cdot)\)在貝葉斯納什均衡中是可實現的，當且僅當它在貝葉斯納什均衡中誠實地可實現的(truthfully implementable in Bayesian Nash equilibrium)。

揭露原理的想法：

在均衡中，玩家知道這個機制實現了選擇規則\(f(\cdot)\)，所以會何其保持一致。
因此他們可能會誠實地述說他們的類型，讓機制設計者直接實現選擇規則\(f(\cdot)\)。

優勢策略和Vickrey-Clarke-Groves機制

優勢策略
如果滿足以下條件，則策略組合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)是一個機制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的優勢策略：
\[ v_i(g(s_i^*(\theta), a_{-i}), \theta_i) \geq v_i(g(a_i', a_{-i}), \theta_i), \forall a_i \in A_i, \forall a_{-i} \in A_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i \]
同時，揭露原理意味著如果選擇法則\(f(\cdot)\)如果一個選擇規則可以被一個優勢策略實現，我們只要檢測這個選擇法則是在優勢策略中誠實地可實現的。
即：
\[ v_i(f(\theta_i, \theta_{-i}), \theta_i) \geq v_i(f(\theta_i', \theta_{-i}), \theta_i), \forall \theta_i \in \Theta_i, \forall \theta_{-i} \in \Theta_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i \]

推論 14.2
在一個準線性(quasilinear)環境中，給定一個實例狀態\(\theta \in \Theta\)，
一個替代物(alternative)\(x^* \in X\)是一個帕累托優化，當且僅當下面有一個解：
\[ \max_{x \in X} \sum_{i=1}^I u_i(x_i, \theta_i) \]

First-best decision rule
如果對於\(\forall \ \theta \in \Theta\), \(x^*(\theta)\)都是帕累托優化的，則\(x^*(\cdot)\)為First-best decision rule。
Vickrey-Clarke-Groves機制
給定一個宣布的類型\(\theta'\)，
這個選擇規則\(f(\theta') = (x(\theta'), m_1(\theta'), \cdots, m_n(\theta') )\)是一個Vickrey-Clarke-Groves機制，
如果\(x^*(\cdot)\)是一個第一好決定規則(first-best decision rule)，並且：
\[ m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) + h_i(\theta'_{-i}) \where \h_i(\theta'_{-i}) \text{ is an arbitrary function of } \theta'_{-i} \]

解釋：

沒有完全看懂。大概的意思是對於First-best decision rule \(x^*(\cdot)\)，
可以找到一個轉移規則\((m_1(\cdot), \cdots, m_n(\cdot))\)，
讓選擇規則成為一個在優勢策略中可實現。

下面是一個解：

Pivotal Mechanism - a particular form of Vickrey-Clarke-Groves機制
\[ h_i(\theta'_{-i}) = - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \where \x_{-i}^*(\theta'_{-i}) \in \arg \max_{x \in X} \sum_{j \neq i} u_j(x, \theta'_j) \Thus \m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \\]

參照

Game Theory An Introduction (by Steven Tadelis)
讀書筆記: 博弈論導論 - 01 - 單人決策問題
讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間
讀書筆記: 博弈論導論 - 03 - 預備知識
讀書筆記: 博弈論導論 - 04 - 理性和公共知識
讀書筆記: 博弈論導論 - 05 - 納什均衡
讀書筆記: 博弈論導論 - 06 - 混合的策略
讀書筆記: 博弈論導論 - 07 - 完美信息的動態博弈預備知識
讀書筆記: 博弈論導論 - 08 - 完美信息的動態博弈可信性和順序合理性
讀書筆記: 博弈論導論 - 09 - 完美信息的動態博弈多階段博弈
讀書筆記: 博弈論導論 - 10 - 完美信息的動態博弈重復的博弈
讀書筆記: 博弈論導論 - 11 - 完美信息的動態博弈戰略協議
讀書筆記: 博弈論導論 - 12 - 不完整信息的靜態博弈貝葉斯博弈
讀書筆記: 博弈論導論 - 13 - 不完整信息的靜態博弈拍賣和競標
讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計
Nash bargaining solution
Mechanism design

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

lte down 保持最優化工 href 滿足動態 rul 讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計機制設計(Mechanism Design) 本文是Game Theory An Introduction (by Steven Tade

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

機制設計(Mechanism Design)

機制設計的概念

機制設計者面臨的問題和一個方向

揭露原理(the revelation principle)

優勢策略和Vickrey-Clarke-Groves機制

參照

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

讀書筆記: 博弈論導論 - 12 - 不完整信息的靜態博弈貝葉斯博弈

讀書筆記: 博弈論導論 - 16 - 不完整信息的動態博弈信號傳遞博弈

讀書筆記: 博弈論導論 - 07 - 完美信息的動態博弈預備知識

讀書筆記: 博弈論導論 - 06 - 混合的策略

《javascript設計模式》讀書筆記二（封裝和隱藏信息）

《Java編程思想》筆記14.類型信息

《編寫可維護的JavaScript》讀書筆記之程式設計實踐-不是你的物件不要動

【讀書筆記】《你不知道的JS-上》

[RK3288][Android6.0] 除錯筆記 --- 螢幕畫面顯示不完整問題

【讀書筆記】致加西亞的信（一）

【讀書筆記】讀《重構改善既有代碼的設計》有感

odoo開發筆記 -- 安裝Backend debranding去除odoo信息模塊後隱藏開發者模式

Chrome控制臺毫無反應，打印不出信息了？

[學習筆記]Python網絡爬蟲與信息提取

Linux學習筆記（2）linux系統信息與進程相關命令

深入理解JVM虛擬機器讀書筆記【第七章】虛擬機器類載入機制

Android群英傳讀書筆記——第九章：Android系統資訊與安全機制

Use MusicBrainz in iOS（三）查詢專輯的完整信息

# 2017-2018-1 20155224 《信息安全系系統設計基礎》實驗四

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計

機制設計(Mechanism Design)

機制設計的概念

機制設計者面臨的問題和一個方向

揭露原理(the revelation principle)

優勢策略和Vickrey-Clarke-Groves機制

參照

相關推薦

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計

讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈機制設計