EM概率統計基礎（二）

阿新 • • 發佈：2019-01-10

前言

前面《EM概率統計基礎（一）》簡單講解了後驗概率和先驗概率之間的關係，得到如下結果：

先驗概率乘以似然函式，正比於後驗概率

$\large Posterior\propto Likelihood\;\ast\;Prior$

那麼似然函式是什麼，它和概率又有什麼關係，希望可以總結總結。

似然函式

Likelihood Function

似然函式也稱為似然，是一個關於統計模型引數的函式，也就是這個函式中自變數統計模型的引數。似然函式是關於統計引數的函式，可以用來評估一組統計的引數。

似然函式的定義，它是給定聯合樣本值 $\large x$ 下關於（未知）引數 $\large \theta$ 的函式

$\large L\left(\theta|x \right )=f\left(x|\theta \right )$

$\large x$ 表示聯合樣本隨機變數 $\large X$ 取到的值，即 $X=x$

；

$\large \theta$ 是指未知引數，它屬於引數空間；

$\large f\left(\theta|x \right )$ 是一個密度函式，它表示（給定） $\large \theta$ 下關於聯合樣本值 $\large x$ 的聯合密度函式

所以從定義上可以看出似然函式和密度函式完全兩個數學物件：前者是關於 $\large \theta$ 的函式，後者是關於 $\large x$ 的函式。這裡的等號 = 可以理解成函式值形式的相等，而不是兩個函式本身是同一個函式。

似然和概率的區別

首先給出一個簡便的區分方法，根據定義：

“xxxx的概率”中xxxx只能是概率空間中的事件，即事件（發生）的概率是多少，因為時間具有概率結構從而刻畫隨機性，所以才能談概率

“xxxx的似然”中xxxx只能是引數，比如說上文所述的引數等於 $\large \theta$

時的似然是多少。

舉個栗子：

已知一個硬幣是均勻的（在拋的過程中，正反面的概率相等），那連續10次正面朝上的概率是多少，這是一個概率問題。

如果一個硬幣在10次拋落中均正面朝上，那硬幣的是均勻的（在拋落中，正反面的概率相等）概率是多少，此時的概率是似然。

Probability is used before data are available to describe possible future outcomes given a fixed value for the parameter (or parameter vector).

Likelihood is used after data are available to describe a function of a parameter (or parameter vector) for a given outcome.
The likelihood of a set of parameter values, θ, given outcomes x, is equal to the probability of those observed outcomes given those parameter values, that is

有趣的栗子

這個栗子摘自Quora上一個計算機系教授的回答，很有意思。

其將概率密度函式和似然函式之間類比成 $\large 2^a$ 與 $\large a^2$ 之間的關係。

假設一個函式為 $\large a^b$ 的函式，這個函式包含兩個變數。

如果設定b = 2，那麼可以得到一個關於a的二次函式，即 $\large a^2$

如果設定為a = 2 ，那麼將得到一個指數函式，即 $\large 2^b$

可以看出，這兩個函式雖然有著不同的名字，但源自於同一個函式 $\large a^b$

同樣的， $\large P\left(x|\theta \right )$ 也是一個具有兩個變數的函式，如果你將 $\large \theta$ 設定為常量，那麼你可以得到一個Probability Function（function of $\large x$ ），但如果你設定 $\large x$ 為常量，那麼你可以得到一個Likelihood Function（function of $\large \theta$ ）

以下舉一個栗子（沒錯，我超喜歡吃栗子的）

有一個硬幣，它有 $\large \theta$ 的概率會正面向上，那麼也就有1- $\large \theta$ 的概率會反面向上。 $\large \theta$ 存在但未知。此時，你為了獲得 $\large \theta$ 的具體數值，你決定做實驗：拋這枚硬幣10次，得到一個序列 x=HHTTHTHHHH 。

通過概率論基礎我們可以得出，出現此序列的概率為： $\theta\cdot\theta\cdot\left(1-\theta \right )\cdot\left(1-\theta \right )\cdot\theta\cdot\left(1-\theta \right )\cdot\theta\cdot\theta\cdot\theta\cdot\theta$

我們嘗試了所有 $\large \theta$ 的值，畫出了下面的圖：

這個曲線就是 $\large \theta$ 的似然函式，通過了解在某一假設下，已知資料發生的可能性，來評價到底哪一個假設更加接近於 $\large \theta$ 的真值。

如圖所示，最可能的假設是 $\theta=0.7$ ，但實際上這個實驗量太小，無法稅負你這個硬幣是均質的，但0.7就是最大似然估計，只是因為樣本太少而導致最大似然值偏差過大，如果擴充樣本空間，H和T的樣本數量將趨近於1：1，那最終求得的最大似然估計將接近0.5.

總結

常說的概率指的是給定引數後，預測即將發生的事件的可能性，而似然概率則正好相反，我們關注的量不再是時間的發生概率，而是已知發生了某些事件，我們希望知道引數應該是多少。最大似然概率就是在已知觀測資料的前提下，找到使得似然概率最大的引數值。

此篇只是簡單介紹了下似然函式和概率之間的區別，下篇希望總結一下極大似然估計(MLE)和極大後驗估計(MAP)，如果有什麼錯誤，歡迎大佬們批評指正。

參考文獻

https://www.quora.com/What-is-the-difference-between-probability-and-likelihood-1/answer/Jason-Eisner?share=cbfeda82&srid=zDgIt

https://blog.csdn.net/jasonwayne/article/details/51824832

EM概率統計基礎（二）

前言

似然函式

似然和概率的區別

有趣的栗子

總結

參考文獻

EM概率統計基礎（二）

我的人工智慧之旅——概率統計基礎（更新中）

Jquery基礎（二）

Angular基礎（二）

java基礎（二）

Java多線程基礎（二）

redis 數據結構基礎（二）鏈表

Linux學習（二十二）Shell基礎（二）變量、環境變量配置文件

計算機網絡基礎（二）-—IP地址詳述

Python基礎（二）之數據類型和運算（1）——數字

Python基礎（二）之數據類型和運算（2）——字符串

Linux系統 shell基礎（二）

HBase框架基礎（二）

Hive框架基礎（二）

SQL夯實基礎（二）：連接操作中使用on與where篩選的差異

python基礎（二）

運維網絡基礎（二）

Zookeeper詳解-基礎（二）

第一章 Python基礎（二）

MySQL數據庫基礎（二）——MySQL字符集與亂碼解析

EM概率統計基礎（二）

前言

似然函式

似然和概率的區別

有趣的栗子

總結

參考文獻

相關推薦