1. 程式人生 > >變分推斷(variational inference)

變分推斷(variational inference)

一、問題

在最初的計算中,我們預設先驗分佈和後驗分佈同分布(共軛分佈)。但在實際中,後驗分佈並不一定符合某一個分佈。
例如,likelihood是一個神經網路,和先驗的計算結果就不是一個標準的共軛分佈
這裡寫圖片描述

這時候,我們就要找到一個分佈可以無限逼近後驗分佈
這裡寫圖片描述

二、Mean field計算方法

1、我們假設後驗分佈是多個q(z)的乘積結果
這裡寫圖片描述

2、而這邊的q(z)屬於一個特定的分佈範圍

3、我們的目標是確保每一個組成後驗分佈的q(z)與最終的後驗分佈p(z)近似
這裡寫圖片描述

這裡我們通過KL演算法分別計算近似程度
這裡寫圖片描述

4、最終,通過公式推導,我們得到了3的最終計算版本
log(某一個q分佈)=除此q分佈外其他分佈的整體期望值*p分佈+固定值
這裡寫圖片描述

5、基於variational inference,調整的EM演算法主要改變了E部分的邏輯。每一個虛擬變數分佈q(t)不再是p的共軛分佈,而是體現p分佈某一部分的特徵的單獨分佈。
這裡寫圖片描述

三、Kl演算法特徵

KL演算法會強制:P(藍線)趨向0的時候,q(黃區)也要趨向0
所以,可以保證q分佈體現了p分佈的某一部分特徵
這裡寫圖片描述