PRML-公式推導 - 2.21-2.24
阿新 • • 發佈:2022-03-15
我們用頻率學角度證明這點。考慮一個貝葉斯推斷,引數為\(\theta\)並且觀測了一個數據集D,由聯合分佈\(p(\theta,D)\)表示.
\[\mathbb{E}_\theta[\theta] = \mathbb{E}_D[\mathbb{E}_\theta[\theta|D]] \tag{2.21} \]其中
$ \mathbb{E}_\theta[\theta] = \int p(\theta)\theta d\theta \tag{2.22}$
\(\theta\)
\(\mathbb{E}_D[\mathbb{E}_{\theta}[\theta]D]]=\mathbb{E}_D[\int \theta p(\theta|D)d\theta]\)
\(=\mathbb{E}_D[\int \theta \frac{p(\theta,D)}{p(D)}d\theta]\)
\(=\int(\int\theta \frac{p(\theta,D)}{p(D)}d\theta)p(D)dD,-----p(D)可以約去\)
\(=\int\int_{\theta} p(\theta,D)d\theta dD\)
\(=\int_{\theta} \int p(\theta,D)dDd\theta\)
\(=\int_{\theta} p(\theta)d\theta\)
\(=\mathbb{E}_{\theta}[\theta]\)
\(\mathbb{E}_D[var_{\theta}[\theta|D]]+var_D[\mathbb{E}_{\theta}[\theta|D]]\)
\(=\mathbb{E}_D[\mathbb{E}_{\theta}[\theta^2|D] - \mathbb{E}_{\theta}^2[\theta|D]]+\mathbb{E}_D[\mathbb{E}_{\theta}^2[\theta|D]]- \mathbb{E}_D^2[\mathbb{E}_{\theta}[\theta|D]]\)
\(=\mathbb{E}_D[\mathbb{E}_{\theta}[\theta^2|D]] - \mathbb{E}_D[\mathbb{E}_{\theta}^2[\theta|D]]+\mathbb{E}_D[\mathbb{E}_{\theta}^2[\theta|D]]- \mathbb{E}_D^2[\mathbb{E}_{\theta}[\theta|D]]\)
\(=\mathbb{E}_D[\mathbb{E}_{\theta}[\theta^2|D]] - \mathbb{E}_D^2[\mathbb{E}_{\theta}[\theta|D]]\)
\(利用\mathbb{E}_D[\mathbb{E}_{\theta}[\theta|D]] =\mathbb{E}_{\theta}[\theta],得到\mathbb{E}_D[\mathbb{E}_{\theta}[\theta^2|D]] =\mathbb{E}_{\theta}[\theta^2]\)
\(繼續=\mathbb{E}_{\theta}[\theta^2]-\mathbb{E}_{\theta}^2[\theta]\)
\(=var_{\theta}[\theta]\)