極大似然估計

貝葉斯估計是引數估計中的一種方法，以貝葉斯思想為基礎，而貝葉斯思想在機器學習中經常用到。機器學習中常涉及貝葉斯網路，最終的問題都是轉化為引數求解。貝葉斯引數估計是這些問題的基礎版本。前方高能預警，本文的講解比較理論。

實際問題中我們會有很多資料，比如一篇文章中每個單詞的詞頻等。我們得到的資料通常用X表示，也稱為樣本。我們還會假設這些資料服從某一個分佈，例如最常用的正態分佈，這時可以將問題表示為X∼N(μ,σ)，μ和σ表示正態分佈的兩個引數。如果這兩個引數知道了，這個分佈就確定了，從而可以知道資料X的許多性質。最常用的引數估計方法是極大似然（或最大似然估計）估計。

一般的最大似然法求解兩個引數的基本步驟是：

假設每個樣本Xi是獨立同分布（iid）的，即每一個樣本都有Xi∼N(μ,σ).
求所有樣本X的聯合分佈
因為是iid，所以X的聯合分佈等於每個樣本Xi的概率密度函式的乘積，即：L(μ,σ2;x)=f(x)=(12πσ2√)nexp{−∑ni=1(xi−μ)22σ2}
對上述聯合分佈的概率密度函式取對數，即：ℓ(μ,σ2;x)=logL(μ,σ2;x)=−n2log(2πσ2)−∑ni=1(xi−μ)22σ2
對上述函式分別求∂ℓ∂μ和∂ℓ∂σ2並另它們等於0，進而求得極值
分別對μ和σ2求二階偏導，驗證極值是最大值

上述步驟是極大似然法的求解步驟，用到的資訊都是已知樣本的資訊。但是通常在估計引數時我們可能已經對引數有了一個大概的瞭解，比如已經知道μ

和σ2的取值範圍。僅僅知道取值範圍還太簡單，有時會更進一步假設μ和σ2的取值服從某個分佈，這樣問題就變成了在正態分佈中，要估計期望μ和方差σ2的值，但與極大似然法不同的是，我們事先已經知道了μ和σ2的取值是服從某種分佈的，這個資訊如果不用到引數估計中那真是太浪費了，於是問題變成：如何將這兩個引數的分佈結合到引數估計當中去呢？貝葉斯估計解決了這個問題。

貝葉斯估計（Bayes Estimation）

上述提到的在估計引數之前對引數已經有了瞭解稱為引數的先驗知識。貝葉斯估計即在估計過程中將先驗知識也考慮了進去，博眾家之長總是好的。先驗知識可以是一個具體的值，也可以是取值範圍（函式）。實際應用中，通常會將引數的先驗知識視作一個分佈，那麼這個引數就會有一個概率密度函式，這個pdf叫做引數的先驗概率

。

一般待估計的一維引數用θ表示，多維用粗體θ. 先驗概率密度函式用符號π(θ)表示。樣本的概率密度函式用f(x|θ)表示，其中加入θ是表示該pdf跟θ有關，同時說明要估計的引數是θ.

貝葉斯估計涉及到三個基本概念，他們長的很像：

損失函式（Loss Funcition）
風險函式（Risk Function）
貝葉斯風險（Bayes Risk）

貝葉斯估計的目的是結合引數的先驗知識，使得估計出來的引數能令貝葉斯風險達到最小。簡單說就是最小化貝葉斯風險。

下面解釋這三個概念。

損失函式

在引數估計問題中，評價估計的好壞就是看估計出來的引數與真值的差距有多小。估計出來的引數通常用θ^表示，引數的真值用θ表示。那麼這個差距如何定義呢？實際上，這個差距就是損失函式。

損失函式有好幾種：

L(θ^,θ)=(θ^−θ)2
L(θ^,θ)=|θ^−θ|
L(θ^,θ)={01if |θ−θ^|⩽Δif |θ−θ^|>Δ

上述是三種常用的損失函式。可以看到當估計值與真實值無限接近時，損失函式都會無限接近0，相當於沒有損失. 損失函式中的估計值θ^是通過樣本計算出來的。比如正態分佈中的μ，我們可以用樣本均值來估計μ，即μ

貝葉斯引數估計的理解

極大似然估計

貝葉斯估計（Bayes Estimation）

損失函式

貝葉斯引數估計的理解

最大似然和貝葉斯引數估計

最大似然估計和最大後驗概率估計（貝葉斯引數估計）

引數估計：貝葉斯思想和貝葉斯引數估計

【機器學習基本理論】詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解

詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解

關於貝葉斯推理的理解

樸素貝葉斯理論--自我理解

01 EM演算法 - 大綱 - 最大似然估計(MLE)、貝葉斯演算法估計、最大後驗概率估計(MAP)

貝葉斯誤差的理解

貝葉斯模型的理解（2）

樸素貝葉斯分類演算法理解及文字分類器實現

全概公式和貝葉斯公式的理解

貝葉斯公式的理解

【IM】從貝葉斯角度理解生成式和判別式及引數估計方法

極大似然估計與貝葉斯的理解

通過簡單例子來理解先驗分佈、後驗分佈、似然估計&&貝葉斯公式

R語言Copula的貝葉斯非引數估計

引數估計：最大似然、貝葉斯與最大後驗

【數學基礎】引數估計之貝葉斯估計

貝葉斯引數估計的理解

極大似然估計

貝葉斯估計（Bayes Estimation）

損失函式

相關推薦