1. 程式人生 > 其它 >最大似然估計中的“似然”如何解釋?

最大似然估計中的“似然”如何解釋?

可以簡單地將“似然”理解為概率。

在英語日常生活中,似然(likelihood)概率(probability)的使用一般不作區分。在統計學上,基於某些模型的引數(粗略地說,我們可以認為引數決定了模型),觀測到某資料的概率稱為概率;而已經觀測到某資料,模型的引數取特定值的概率稱為似然。

舉個例子來說,我們有一些秤,這些秤不怎麼準,每次稱東西都會有一些誤差,而且每次稱的誤差可能不一樣(比方說,使用了一些不穩定的電子元件)。假設這些誤差是由這些秤的零件的引數決定的。那麼,給定一個秤,並且有出廠報告,上面載明瞭零件的引數。拿這桿秤去稱個1kg的東西,可能稱出各種重量,比如0.98kg、0.99kg、1.02kg等等,稱出每種重量的概率,稱為概率。另一方面,有一個秤的出廠報告我們丟了,現在我們要通過拿這個秤去反覆稱1kg的東西,根據測出的重量的統計資料,反推這個秤的引數可能是哪些值(引數取每個值的概率),這就稱為似然。

我們看到,似然和概率本質上都是概率,這是它們容易混淆的一個原因。

另一方面,只要資料和引數一致的情況下,給定引數計算出觀測到特定資料的概率,和給定資料,計算出特定引數的似然,值是相等的:

\[L(\mu , \sigma ;data)=P(data;\mu , \sigma ) \]

你可以把概率和似然想象成鑰匙和鎖,是配套的。給你一把鑰匙,讓你去試可以開那扇門的鎖,和指定一扇門的鎖,讓你去試哪吧鑰匙能開,不會改變鑰匙和鎖的對應關係。

所以,所謂最大似然估計,就是我們想知道哪套引數組合對應的曲線最可能擬合我們觀測到的資料(擬合出觀測資料的概率最大),即最大化擬合觀測到的資料的曲線引數的似然。