PRML讀書筆記——取樣方法
本章中,我們希望解決的基本的問題涉及到關於⼀個概率分佈p(z)尋找某個函式
我們假設,使⽤解析的⽅法精確地求出這種期望是⼗分複雜的。因此,我們採用取樣的方法抽取出樣本,計算出對應的值
本章的取樣方法主要包括:重要取樣、拒絕取樣、蒙特卡羅取樣、吉布斯取樣、切片取樣和混合蒙特卡羅取樣等
基本取樣方法
這裡,我們研究從一個給定的概率分佈中生成隨機樣本的方法
標準概率分佈
這考慮如何從簡單的非均勻分佈中生成隨機數。可以從均勻分佈開始,利用變換的方法,形成所需要計算的概率分佈,並求出這個概率分佈的不定積分的反函式。
假設
這裡,y所具有的分佈是我們希望的得到的分佈形式。對上式積分,有:
它就是
這裡存在兩個難點:(1)變換
為了對非均勻分佈取樣,考慮另外的方法:拒絕取樣和重要取樣,但它們只能處理單變數概率分佈的情況。
拒絕取樣
拒絕取樣的思想是,目前需要取樣的概率分佈形式複雜,我們引入相對簡單的概率分佈(提議分佈,proposal distribution),這個概率分佈能覆蓋目標分佈,然後直接在提議分佈上取樣,通過一定的準則選擇拒絕還是接受當前的取樣值。
假設我們希望從概率分佈
z,我們能夠很容易計算
現在,我們引入簡單的提議分佈
則函式
中⽣成⼀個數
麼樣本被拒絕,否則
一個樣本的接受率為
顯然,k越大,整體接受率越低,因此k越低越好,但是k有需要滿足限制
一般而言,
缺點:因為目標概率分佈的情況複雜,找到⼀個較好的提議分佈和⽐較函式是⼀件相當困難的事情。此外,接受率隨著維度的指數下降是拒絕取樣的⼀個⼀般特徵。雖然拒絕取樣在⼀維或⼆維空間中是⼀個有⽤的⽅法,但是它不適⽤於⾼維空間
重要取樣
這種取樣方法主要用於估計概率分佈的期望。與拒絕取樣不同,重要取樣不拒絕任何的取樣結果,而是給提議分佈上的取樣結果賦予權重
同樣假設直接從
顯然,這種取樣是非常低小的,因為一般而言,目標概率分佈都將它的大部分質量限制在z空間的一個很小的區域,也就是說只有很小部分的樣本會對求合適產生貢獻。
這裡再次引入提議分佈