似然函式的理解

阿新 • • 發佈：2019-02-04

一直對貝葉斯里面的似然函式（likelihood function），先驗概率（prior），後驗概率（posterior）理解得不是很好，今天彷彿有了新的理解，記錄一下。

看論文的時候讀到這樣一句話：

原來只關注公式，所以一帶而過。再重新看這個公式前的描述，細思極恐。

the likelihood function of the parameters θ = {w,α,β} given the observations D can be factored as..

兩個疑問：likelihood function為什麼會寫成條件概率的形式？given的明明是D，為什麼到後面的公式裡，卻變成了given θ

呢？

百度了一下，先貼上wikipedia的解釋：

下面整理一下自己的理解，借用wikipedia裡面硬幣的例子。

常說的概率是指給定引數後，預測即將發生的事件的可能性。拿硬幣這個例子來說，我們已知一枚均勻硬幣的正反面概率分別是0.5，要預測拋兩次硬幣，硬幣都朝上的概率：

H代表Head，表示頭朝上

p(HH | pH = 0.5) = 0.5*0.5 = 0.25.

這種寫法其實有點誤導，後面的這個p其實是作為引數存在的，而不是一個隨機變數，因此不能算作是條件概率，更靠譜的寫法應該是 p(HH;p=0.5)。

而似然概率正好與這個過程相反，我們關注的量不再是事件的發生概率，而是已知發生了某些事件，我們希望知道引數應該是多少。

現在我們已經拋了兩次硬幣，並且知道了結果是兩次頭朝上，這時候，我希望知道這枚硬幣丟擲去正面朝上的概率為0.5的概率是多少？正面朝上的概率為0.8的概率是多少？

如果我們希望知道正面朝上概率為0.5的概率，這個東西就叫做似然函式，可以說成是對某一個引數的猜想（p=0.5）的概率，這樣表示成(條件)概率就是

L(pH=0.5|HH) = P(HH|pH=0.5) = （另一種寫法）P(HH;pH=0.5).

為什麼可以寫成這樣？我覺得可以這樣來想：

似然函式本身也是一種概率，我們可以把L(pH=0.5|HH)寫成P(pH=0.5|HH); 而根據貝葉斯公式，P(pH=0.5|HH) = P(pH=0.5,HH)/P(HH)；既然HH是已經發生的事件，理所當然P(HH) = 1,所以：

P(pH=0.5|HH) = P(pH=0.5,HH) = P(HH;pH=0.5).

右邊的這個計算我們很熟悉了，就是已知頭朝上概率為0.5，求拋兩次都是H的概率，即0.5*0.5=0.25。

所以，我們可以safely得到:

L(pH=0.5|HH) = P(HH|pH=0.5) = 0.25.

這個0.25的意思是，在已知丟擲兩個正面的情況下，pH = 0.5的概率等於0.25。

再算一下

L(pH=0.6|HH) = P(HH|pH=0.6) = 0.36.

把pH從0~1的取值所得到的似然函式的曲線畫出來得到這樣一張圖：

（來自wikipedia）

可以發現，pH = 1的概率是最大的。

即L(pH = 1|HH) = 1。

那麼最大似然概率的問題也就好理解了。

最大似然概率，就是在已知觀測的資料的前提下，找到使得似然概率最大的引數值。

這就不難理解，在data mining領域，許多求引數的方法最終都歸結為最大化似然概率的問題。

回到這個硬幣的例子上來，在觀測到HH的情況下，pH = 1是最合理的（卻未必符合真實情況，因為資料量太少的緣故）。

先理解這麼多。

先驗概率、後驗概率、似然函式與機器學習中概率模型（如邏輯迴歸）的關係理解

看了好多書籍和部落格，講先驗後驗、貝葉斯公式、兩大學派、概率模型、或是邏輯迴歸，講的一個比一個清楚，但是聯絡起來卻理解不能基本概念如下先驗概率：一個事件發生的概率 \[P(y)\] 後驗概率：一個事件在另一個事件發生條件下的條件概率 \[P(y|x

【機器學習】先驗概率、似然函式、後驗概率、對數似然函式等概念的理解

1）先驗：統計歷史上的經驗而知當下發生的概率； 2）後驗：當下由因及果的概率； 2、網上有個例子說的透徹： 1）先驗——根據若干年的統計（經驗）或者氣候（常識），某地方下雨的概率； 2）似然——看到了某種結果，對產生結果的原因作出假設：是颳風了？還是有烏雲？還是

全面理解似然函式與貝葉斯公式

不知道你是否看過我之前的文章，如果看了的話，你會認為很爛，然後判斷這篇部落格也是很大程度上是很爛的，如果這樣的，很幸運，那你使用了貝葉斯思維方式來進行思考問題了。學了這麼多年貝葉斯公式，不是很

似然函式，最大似然估計簡單理解

摘抄自維基百科： https://zh.wikipedia.org/wiki/%E4%BC%BC%E7%84%B6%E5%87%BD%E6%95%B0 https://zh.wikipedia.org/wiki/%E6%9C%80%E5%A4%A7%E4%BC%BC%E7%84%B6%E4%BC%B0%

似然函式的理解

一直對貝葉斯里面的似然函式（likelihood function），先驗概率（prior），後驗概率（posterior）理解得不是很好，今天彷彿有了新的理解，記錄一下。看論文的時候讀到這樣一句話：原來只關注公式，所以一帶而過。再重新看這個公式前的描述，細思極恐

深入理解線性模型（二）---基於似然函式的估計

目錄 1. 引言 2. 關於\(\varepsilon\)假設 3. 基於似然函式的估計 3.1 基於假設1 3.2 基於假設2 3.3. 基於假設3

似然函式

似然函式：似然函式是一種關於統計模型中的引數的函式，表示模型引數中的似然性。當給定輸出x時，關於引數θ的似然函式L(θ|x)（在數值上）等於給定引數θ後變數X的概率： L

似然函式和最大似然估計與機器學習中的交叉熵函式之間的關係

關於似然函式和最大似然估計的詳細說明可以看這篇文章：https://blog.csdn.net/zgcr654321/article/details/83382729 二分類情況和多分類情況下的似然函式與最大似然估計：二分類情況下的似然函式與最大似然估計：我們知道按照生活中的常識

機器學習儲備（3）：似然函式例子解析

似然函式是個什麼函式，它的意義是什麼？它與概率相比，有什麼不同嗎？ 1、似然函式似然函式是一種關於統計模型中的引數的函式，表示模型引數中的似然性。給定輸出 x 時，關於引數 θ 的似然函式 L(θ|x)，在數值上它等於給定引數 θ 後變數 X 的概率：這個是非常

先驗概率、似然函式與後驗概率

先驗概率 Prior probability 在貝葉斯統計中，先驗概率分佈，即關於某個變數 p 的概率分佈，是在獲得某些資訊或者依據前，對 p 的不確定性進行猜測。例如， p 可以是搶火車票開始時，搶到某一車次的概率。這是對不確定性（而不是隨機性）賦予一個量化的數值的

先驗分佈，後驗分佈，似然函式

一個例子搞清楚（先驗分佈/後驗分佈/似然估計） preface：無論是《通訊原理》、《資訊理論》、《通道編碼》還是《概率與統計理論》，或者在現在流行的《模式識別》和《Machine Learning》中總會遇到這麼幾個概念：先驗分佈/後

似然函式與最大似然估計、交叉熵概念與機器學習中的交叉熵函式

文章目錄似然函式與最大似然估計似然的概念似然函式最大似然估計伯努利分佈伯努利分佈下的最大似然估計高斯分佈高斯分佈下的最大似然估計資訊量、熵、相對熵、交叉熵、機器學習中的交

機器學習學習筆記之二——大數定律、中心極限定理以及極大似然估計理解與用法

極大似然估計法常常出現在機器學習演算法的推導過程中，其使用場景或者說功能正是：以已有樣本、已有公式去估計引數，最大可能的那個引數。這樣來理解，極大似然估計法其實和機器學習演算法的目標都是一樣的。那麼極大似然估計法如何來用呢？

似然函式（Likelihood function）是什麼

上次在尋找線性迴歸最小化函式時，又引出一個新的地雷，一個新的不知道，我們繼續上路，開足馬車繼續尋找“似然函式”，它到底是什麼呢？先來到WIKI上看看定義：In statistics, a likelihood function (often simply the likeli

最大似然估計理解

最大似然估計：Maximum Likelihood Estimation，簡稱MLE；要理解此概念首先要看下什麼叫貝葉斯公式，如下： P(θ|D)=P(D|θ)P(θ)P(D) 我們把D看作是樣本，θ看作是這個樣本所服從分佈的引數，那麼上式左側P(θ|D

DPMM(狄利克雷過程混合模型)淺解和新增似然函式的問題

先說說Dirichlet Process 要了解DP，推薦兩篇文章Redford Neal的Markov Chain Sampling Methods for Dirichlet Process Mixture Models 和 Xiaodong Yu的 Gi

似然函式基本概念

統計學中，似然函式是一種關於統計模型引數的函式。給定輸出x時，關於引數θ的似然函式L(θ|x)（在數值上）等於給定引數θ後變數X的概率： L(θ|x)=P(X=x|θ). 概率描述了已知引數時的隨機變數的輸出結果；似然則用來描述已知隨機變數輸出結果時，未知引數的可能取值

似然函式Likelihood function

在數理統計學中，似然函式是一種關於統計模型中的引數的函式，表示模型引數中的似然性。似然函式在統計推斷中有重大作用，如在最大似然估計和費雪資訊之中的應用等等。“似然性”與“或然性”或“概率”意思相近，都是指某種事件發生的可能性，但是在統計學中，“似然性”和“或然性”或“概率

【機器學習】先驗概率、後驗概率、貝葉斯公式、似然函式

Original url: http://m.blog.csdn.net/article/details?id=49130173 一、先驗概率、後驗概率、貝葉斯公式、似然函式在機器學習中，這些概念總會涉及到，但從來沒有真正理解透徹他們之間的聯絡。下面打算好好從

機器學習筆記：最大熵（模型，推導，與似然函式關係的推導，求解）

1、最大熵模型最大熵原理：最大熵原理認為在學習概率模型時，在所有可能的概率模型中，熵最大的模型是最少的模型。該原理認為要選擇的概率模型首先得承認已有的現實（約束條件），對未來無偏（即不確定的部分是等可能的）。比如隨機變數取值有A,B,C，另外已知

似然函式的理解

相關推薦