1. 程式人生 > 實用技巧 >2020-10-18 二、熵的定義

2020-10-18 二、熵的定義

本文轉自:https://zhuanlan.zhihu.com/p/39706910

1: 熵的定義

假設離散隨機變數[公式],它的p.m.f是[公式]。我們定義[公式]的熵[公式]是:

[公式]
引理:[公式]

證明[公式],即均勻分佈熵最大。

利用拉格朗日乘子法證明:

[公式]
[公式]

由拉格朗日計算可以可到:[公式][公式]得到極值為[公式]


2: 聯合熵和條件熵

定義(聯合熵):[公式]

定義(條件熵):假如[公式],則條件熵是:

[公式]

定理(鏈式規則):[公式]

證明:

[公式]
推廣:[公式]

注意:熵只依賴於隨機變數的分佈,與隨機變數取值無關。


3: 相對熵和互資訊

定義(相對熵或Kullback–Leibler(KL) divergence):KL散度是兩個隨機變數的概率質量函式[公式][公式]的距離,公式如下:

[公式]
其中:[公式],且[公式]

定義(互資訊

):假設隨即變數[公式][公式]的p.m.f是[公式],邊際p.m.f分別是[公式][公式]。則互資訊[公式]是:

[公式]
定理(互資訊和熵的關係):

[公式]
因此互資訊就是在瞭解了其中一個[公式]的前提下,對消除另一個[公式]不確定性所提供的資訊量,也可稱為資訊增益。

上面一堆概念,估計比較暈,用下面這個圖很容易明白他們的關係。左邊的橢圓代表[公式]右邊的橢圓代表[公式]中間重合的部分就是我們的互資訊或者資訊增益[公式]左邊的橢圓去掉重合部分就是[公式]右邊的橢圓去掉重合部分就是[公式]兩個橢圓的並就是[公式]

定義(條件互資訊):在給定[公式]後,隨機變數[公式][公式]的互資訊是:

[公式]
定義(條件相對熵):[公式]

定理:[公式]是兩個p.m.f,則[公式]當且僅當[公式]時,等號成立。

推論:對於任意的[公式][公式],當且僅當[公式][公式]獨立時等號成立。

引理:一組非負序列[公式][公式]是收斂的:

1.[公式]或者[公式](兩組正的序列KL距離定義)
2. 如果[公式],則[公式],當且僅當[公式]時,等號成立。
3. 如果[公式][公式]對所有的[公式]都成立,則[公式]

引理:令非負序列[公式][公式]是收斂的。則[公式],當且僅當[公式]時等號成立。

引理:[公式],其中[公式]表示集合[公式]元素的個數,當且僅當[公式]有均勻分佈時等號成立。【均勻分佈時熵最大,即不確定性最大】

引理(Condition reduces entropy):[公式],當且僅當[公式](獨立)時等號成立。: 交叉熵

由KL散度可以得到:[公式]。而KL散度的前半部分[公式]就是交叉熵。

[公式]是資料的真實概率分佈,[公式]是由資料計算得到的概率分佈。機器學習的目的就是希望[公式]儘可能地逼近甚至等於[公式],從而使得KL散度接近最小值0。由於真實的概率分佈是固定的,KL散度公式的後半部分[公式]就成了一個常數。那麼KL散度達到最小值的時候,也意味著交叉熵達到了最小值。對[公式]

的優化就等效於求交叉熵的最小值。


5: 微分熵

定義:[公式]是連續的,[公式](存在),其中[公式]是隨機變數的支撐。此時熵不一定是大於0。

定義(聯合熵):一組隨機變數[公式]的 p.d.f 是[公式],則聯合熵是:

[公式]
定義(條件熵):對於隨機變數[公式][公式],條件熵是:

[公式]


6: 相對熵和互資訊(連續)

定義(相對熵或Kullback–Leibler(KL) divergence):兩個連續隨機變數[公式][公式],KL散度為:

[公式]
注意:假如[公式]的支撐包含在[公式]的支撐上,則[公式]是有限的。

定義(互資訊):兩個隨機變數[公式][公式]p.d.f 是[公式],邊際 p.d.f 分別為[公式][公式]。則互資訊[公式]是:

[公式]
定理:[公式],當且僅當[公式][公式]幾乎處處相等時等號成立。

推論:
1. 對於任何[公式],有[公式],當且僅當[公式][公式]獨立時等號成立。
2.[公式],當且僅當[公式][公式]獨立時等號成立。

定理(微分熵的鏈式規則):[公式]

推論:[公式]

定理:[公式]是非奇異矩陣,[公式]

定理:假設[公式]均值是0,方差是[公式],則[公式],當且僅當[公式]時等號成立。(當一階矩和二階矩給定時,高斯分佈的熵最大)

參考文獻:

1、https://zhuanlan.zhihu.com/p/36192699

2、https://zhuanlan.zhihu.com/p/36311131

3、https://zhuanlan.zhihu.com/p/36385989