1. 程式人生 > >01單人決策問題

01單人決策問題

tar garbage math 排序 參與 sim 嚴格 輸入 完全

本文是根據 Game Theory An Introduction (Steven Tadelis) 一書第一章整理的學習筆記。

博弈問題的本質是決策問題。因此,本書中作者從決策問題開始講述,並根據決策問題中的一些合理假設來逐步演化得到博弈論問題以及相關理論。由於博弈理論是基於一些假設的框架下建立的,所以這些假設的合理性直接決定了基於這些假設所導出的理論的價值。一個假設如果不合理,基於這樣的假設所得出的結論也是沒有價值的。計算機科學中有一句名言“garbage in, garbage out”,這句話是說無效數據被輸入系統後得到的輸出也將是無效的。

決策問題

一個決策問題包含以下三個特征:

  1. Actions 參與者可以選擇的所有選項;
  2. Outcomes 參與者選擇一個動作後可能導致的結果,也即回報;
  3. Preferences 參與者對每個可能的結果都有自己的偏好排序,也即偏好關系,其中符號“\(x \succsim y\)”表示對於參與者來說,得到的回報 \(x\) 至少和回報 \(y\) 一樣好(也可能更好), \(\succ\) 表示嚴格的偏好關系。

The completeness Axiom:一個偏好關系 \(\succsim\) 是完備的是指對所有的回報 \(x,y \in X\) 能夠用偏好關系來排序,也即要麽 \(x \succsim y\) 或者 \(y \succsim x\)

The Transitivity Axiom

:一個偏好關系 \(\succsim\) 是傳遞的是指對於任意的回報 \(x, y, z \in X\),如果 \(x \succsim y\)\(y \succsim z\) ,則有 \(x \succsim z\)

同時滿足完備性、傳遞性的偏好關系被稱為理性偏好關系

在一個集體決策問題中,所有的個體具有理性偏好關系並不一定能保證集體也具備理性的偏好關系。例如:對於 Play 1: \(a \succsim b \succsim c\) ;對於 Play 2: \(b \succsim c \succsim a\) ;對於 Play 3: \(c \succsim a \succsim b\)

。那麽對於集體{Play 1, Play 2, Play 3} 來說無法確定 \(a, b, c\) 的偏好關系。

收益函數(payoff function)與偏好關系之間的關系:一個收益函數 \(u: \rightarrow \mathbb{R}\) ,以及對於任意的 \(x, y \in X, x \succsim y\), 如果滿足 \(u(x) \geq u(y)\),那麽 \(u\) 可以代表偏好關系 \(\succsim\)

理性選擇假設是指參與者完全知曉決策問題的以下四個方面的信息:

  1. 所有可能的 actions, A;
  2. 所有可能的 outcome, X;
  3. 每個 action 是如何影響 outcome 的不同的;
  4. 參與者對於不同的 outcome 的理性偏好。

理性行動的定義:一個參與者在面對一個決策問題時,如果他采取了使得他的收益最大化的行動 \(a \in A\) ,那麽他的行動被稱為是理性的。

01單人決策問題