1. 程式人生 > >缺失資料的極大似然估計:《Statistical Analysis with Missing Data》習題7.16

缺失資料的極大似然估計:《Statistical Analysis with Missing Data》習題7.16

一、題目

a)極大似然估計

X X 為伯努利分佈,並且 Pr ( X = 1 )

= 1 Pr ( X = 0 ) = π
\text{Pr}(X = 1) = 1 - \text{Pr}(X = 0) = \pi ,並且在給定 X = j    ( j
= 0 1 ) X = j\ \ (j=0,1)
時, Y Y 的分佈為均值 μ j \mu_j ,方差 σ 2 \sigma^2

針對一份完整隨機樣本 ( x i y i ) i = 1 . . . n (x_i,y_i),i=1,...,n ,計算 ( π μ 0 μ 1 σ 2 ) (\pi,\mu_0,\mu_1,\sigma^2) 的極大似然估計並計算 Y Y 的邊際均值與方差。

b)缺失資料的極大似然估計

假設現在 X X 是完整的觀測,但 Y Y n r n-r 個值缺失,請使用第七章的方法,計算 Y Y 的邊際均值與方差。

c)從後驗分佈中生成引數

當先驗分佈表現為 p ( π μ 0 μ 1 log σ 2 ) π 1 / 2 ( 1 π ) 1 / 2 p(\pi,\mu_0,\mu_1,\text{log}\sigma^2) \propto \pi^{1/2}(1-\pi)^{1/2} 的形式,描述如何從引數為 ( π μ 0 μ 1 σ 2 ) (\pi,\mu_0,\mu_1,\sigma^2) 的後驗分佈中抽出引數。

(注:前面的逗號均使用全形,後面公式中的逗號為半形,中文字中間的逗號為全形。)

二、解答

a)極大似然估計

寫出聯合密度函式,首先列出一個樣本時的密度:
f ( x i , y i μ 0 , μ 1 , σ 2 , π ) = f ( x i π ) f ( y i x i , μ 0 , μ 1 , σ 2 , π ) = π x i ( 1 π ) 1 x i ( 1 2 π σ 2 exp { ( y i μ 1 ) 2 2 σ 2 } ) x i ( 1 2 π σ 2 exp { ( y i μ 0 ) 2 2 σ 2 } ) 1 x i \begin{aligned} & f(x_i,y_i|\mu_0,\mu_1,\sigma^2,\pi) \\ = & f(x_i | \pi) \cdot f(y_i|x_i, \mu_0,\mu_1,\sigma^2,\pi) \\ = & \pi^{x_i} \cdot (1 - \pi)^{1 - x_i} \cdot (\frac{1}{\sqrt{2\pi\sigma^2}}\text{exp}\{-\frac{(y_i - \mu_1)^2}{2\sigma^2}\})^{x_i} \cdot (\frac{1}{\sqrt{2\pi\sigma^2}}\text{exp}\{-\frac{(y_i - \mu_0)^2}{2\sigma^2}\})^{1 - x_i} \\ \end{aligned}

n n 個樣本的聯合密度函式:
f ( X , Y μ 0 , μ 0 , σ 2 , π ) = i = 1 n f ( x i π ) f ( y i x i , μ 0 ,