1. 程式人生 > 其它 >鞅與停時定理學習筆記

鞅與停時定理學習筆記

本文主要用於作者自己理解,所以很不嚴謹。

還有很多是抄的別人的部落格。

定義:

隨機過程:

隨機過程 \(X\)\(\{X_0, X_1, X_2...X_n\}\) , \(X_n\) 為隨機變數。

可以理解為 \(X_n\) 為隨機的過程中第 \(n\) 個時刻的局面,而隨機過程就是這些局面所構成的序列。

鞅:

稱隨機過程 \(X\) 為鞅當且僅當:

  1. \(\forall n \geq 0 , E(|X_n|) < +\infty\)
  2. \(\forall n \geq 0, E(X_{n+1}|X_0,...,X_n) = X_n\)

稱隨機過程 \(Y\) , 是隨機過程 \(X\)

的鞅當且僅當:

  1. \(\forall n \geq 0 , E(|Y_n|) < +\infty\)
  2. \(\forall n \geq 0, E(Y_{n+1}|X_0,...,X_n) = Y_n\)

第一個條件即期望有限,第二個條件即下一次的觀測值的期望等於這次觀測值。

隨機時刻:

設隨機變數 \(T\) , 如果 \(T \in N \cup \{+\infty\}\) , 且 \(T=n\) 的示性函式 \(I_{T=n}\)\(X_0,X_1...,X_n\) 的函式,則稱 \(T\)\(X\) 的隨機時刻.

停時 :

\(T\)\(X\) 的隨機時刻且 \(P(T < +\infty) = 1\)

則稱 \(T\)\(X\) 的停時。

停止過程:

\(T\)\(X\) 的隨機時刻。定義 \(X\) 的停止過程 \(\overline X\)

\[\overline X_n = \begin{cases} X_n \quad(n\leq T)\\ X_T \quad(n > T) \end{cases} \]

顯然若 \(X\) 為鞅則 \(\overline X\) 為關於 \(X\) 的鞅。

停時定理

若隨機過程 \(X\) 和隨機時刻 \(T\) 滿足以下條件之一:

  1. \(\overline X_n\) 都有界。
  2. \(T\) 有界
  3. \(E(T) < +\infty\)
    , 且 \(E(|X_{n + 1} - X_n|\;|X_0,...,X_n)\) 有界.

那麼 \(E(X_T) = E(X_0)\)

套路:

構造勢函式 \(\phi(X)\) , 使得 \(E(\phi(X_{n+1})|X_0, ...,X_n) = \phi(X_n) + 1\) , 這樣的話 \(\phi(X_n) - n\) 就是一個鞅, 利用停時定理有 \(E(\phi(X_T)-T) = E(\phi(X_0))=E(\phi(X_T))-E(T)\) , 即 \(E(T)=E(\phi(X_T)) - E(\phi(X_0))\)

這樣求出 \(E(\phi(X_0))\)\(E(\phi(X_T))\) 就可以求出 \(E(T)\) 了。

例題:

戰爭

code

設勢函式 \(f(n)\) 表示大小為 \(n\) 的國家的勢函式。設整個局面的勢函式 \(\sum_{i=1}^{n}f(a_i)\) , 即所有國家的勢函式的和.

對於一次戰爭,設戰爭雙方大小為 \(a\)\(b\) . 另:

\[\begin{aligned} &\quad p(f(a+1)+(b-1)f(1)-f(a)-f(b))+p(f(b+1)+(a-1)f(1)-f(a)-f(b)) + (1-2p)((a+b)f(1)-f(a)-f(b))\\ &=-f(a)-f(b)+pf(a+1)+pf(b+1) + (pb-p+pa-p+a+b-2pa-2pb)f(1)\\ &=1 \end{aligned} \]

\(f(1)=0\) 就可以把後面的一坨都刪掉。得到:

\[pf(a+1)-f(a)+p(b+1)-f(b)=1 \]

只需要對於任意的 \(n\) , 讓 \(pf(n+1)-f(n)=\frac{1}{2}\) 就行了.

於是有 \(f(n)=\frac{1}{p}f(n-1)+\frac{1}{2p}\)

解這個遞迴式,有

\[\begin{aligned} f(n)&=p^{1-n}(f(1)-(\frac{\frac{1}{2p}}{\frac{1}{p}-1}))-\frac{\frac{1}{2p}}{\frac{1}{p}-1}\\ &= p^{1-n}(\frac{\frac{1}{2p}}{1-\frac{1}{p}})+\frac{\frac{1}{2p}}{1-\frac{1}{p}}\\ & = (p^{1-n}+1)\frac{1}{2p-2} \end{aligned} \]

可以很容易求出 \(E(\phi(X_0))\)\(E(\phi(X_T))\)

然後這道題要用光速冪.