深入解析最大熵模型

不要把雞蛋放到一個籃子裡

理解了這句話其實已經理解了最大熵模型的精髓了，不過這句話還是有點含蓄，下面講一下我的理解，歡迎交流。
“不要把雞蛋放到一個籃子裡”，這樣可以降低風險。

為啥不放到一個籃子裡就可以降低風險啊？如果有人告訴你就算世界毀滅這個籃子也不會破也不會摔倒地上，那麼就永遠不會有風險（雞蛋永遠不會摔破）
遺憾的是，沒有人告訴過你（暗含我們沒有足夠的知識做出這樣的推理），既然有風險就說明籃子是有可能破掉的，但是我們又無法準確知道到底哪個籃子會破掉，那麼我們怎麼做呢？那麼好吧我們認命承認自己一無所知，不作出任何假設（比如假設某個籃子不會破），把雞蛋隨機的放入多個籃子裡面，這樣風險最小。
（有些東西寫出來就和想的不一樣，湊合看吧，這個應該可以數學上給予證明，我不會啊，哎

）

熵和條件熵

這個在決策樹的部落格裡面已經介紹過了，這裡再簡單說下
熵在資訊理論和概率統計中，用來表示隨機變數的不確定。是用來度量不確定的，（最大熵模型說白了就是最大不確定模型，最大不確定性模型不是最不靠譜模型，恰恰相反是最靠譜的模型，後面會介紹為什麼？）
熵的定義：
設 $X \in (x_{1}$

, x 2 , … … x n )

X∈(x_1,x_2,……x_n)

X \in (x_{1}, x_{2}, \dots \dots x_{n})

為一個離散隨機變數，其概率分佈為

P(X=x_i)=p_i,i=1,2……n

,則

X

的熵為

H(X)=-\displaystyle\sum_{i=1}^{n}p_ilogp_i,其中若p_i=0,定義0log0=0

H(X)

僅依賴於

X

的分佈，而與

X

的具體取值無關。

H(X)

的值越大，表示

X

的不確定性越大。
**條件熵：**設

X∈(x_1,x_2,……x_n)，Y∈(y_1,y_2,……y_m)

為離散隨機變數。在已知X的條件下，Y的條件熵可定義為：

H(Y|X)=\displaystyle\sum_{i=1}^{n}p(x_i)H(Y|X=x_i)=-\displaystyle\sum_{i=1}^{n}p(x_i)\displaystyle\sum_{j=1}^{m}p(y_j|x_i)logp(y_j|x_i)

它表示已知

X

的條件下，Y的條件概率分佈的熵對X的數學期望。

似然與最大似然估計

在數理統計學中，似然函式是一種關於統計模型中引數的函式（似然函式中的未知數是模型引數，理解一下），在統計推斷中有重大作用。
似然性與概率的區別：
1）概率用於在已知一些引數的情況下，預測接下來的觀測所得到的結果。（其實就是模型已知了即模型引數都知道了，利用這個已有模型預測下觀測結果）

2）似然性則是用於在已知某些觀測所得到的結果時，對有關實物的性質的引數進行估計（觀測結果已經呈現在眼前了，你給說說是什麼樣的引數才最大可能會出現目前的結果）

最大似然估計是似然函式最初也是最自然的應用，似然函式取得最大值表示相應的引數能夠使得統計模型最為合理（醍醐灌頂，該賞）
從這樣一個想法出發，最大似然估計的做法是：首先選取似然函式（一般是概率密度函式），整理之後求最大值。

設X為離散隨機變數，其概率分佈為 $p(x:θ),θ為引數，則X的N個**獨立同分布**的樣本x_1,x_2,……x_n的聯合概率分佈為:$

$p(x_1,x_2……x_N；θ)=∏p(x_i;θ),其中i=1,2……N$

1)當引數 $θ$ 固定時，上式表示 $x_1,x_2,……x_n$ 的概率
2)當 $x_1,x_2,……x_n$ 固定時，它是 $θ$ 的函式，把它記作 $L(θ;x)並稱其為似然函式$

相關推薦

深入解析最大熵模型

不要把雞蛋放到一個籃子裡理解了這句話其實已經理解了最大熵模型的精髓了，不過這句話還是有點含蓄，下面講一下我的理解，歡迎交流。 “不要把雞蛋放到一個籃子裡”，這樣可以降低風險。為啥不放到一個籃子裡就可以降低風險啊？如果有人告訴你就算世界毀滅這個籃子也不會破也不會摔倒地上，那麼就永遠

最大熵模型（MaxEnt）解析

給出了最大熵模型的一般形式（其中的f為特徵函式，後面我們還會講到）：而文獻【5】中我們從另外一種不同的角度也得出了多元邏輯迴歸的一般形式：可見，儘管採用的方法不同，二者最終是殊途同歸、萬法歸宗了。所以我們說無論是多元邏輯迴歸，還是最大熵模型，又或者是Sof

[白話解析] 深入淺出最大熵模型

[白話解析] 深入淺出最大熵模型 0x00 摘要本文將盡量使用易懂的方式，儘可能不涉及數學公式，而是從整體的思路上來看，運用感性直覺的思考來解釋最大熵模型。並且從名著中找了幾個具體應用場景來幫助大家深入這個概念。 0x01 背景概念 1. 什麼是熵？熵這個概念可以從多個角度來理解。 1.1 從物理學角度理

最大熵模型

定性全部投資情況進行算法出了信息簡單我們不要把雞蛋都放在一個籃子裏面講得就是最大熵原理，從投資的角度來看這就是風險最小原則。從信息論的角度來說，就是保留了最大的不確定性，也就是讓熵達到了最大。最大熵院裏指出，對一個隨機事件的概率分布進行預測的時候，我

通俗理解最大熵模型

log logs ima 最大熵 ges es2017 最大熵模型 blog image 通俗理解最大熵模型

淺談最大熵模型中的特徵

最近在看到自然語言處理中的條件隨機場模型時，發現了裡面涉及到了最大熵模型，這才知道最大熵模型自己還是一知半解，於是在知乎上查閱了很多資料，發現特別受用，飲水思源，我將自己整理的一些資料寫下來供大家參考僅僅對輸入抽取特徵。即特徵函式為對輸入和輸出同時抽取特徵。即特徵函式為

斯坦福大學-自然語言處理入門筆記第十一課最大熵模型與判別模型（2）

一、最大熵模型 1、模型介紹基本思想：我們希望資料是均勻分佈的，除非我們有其他的限制條件讓給我們相信資料不是均勻分佈的。均勻分佈代表高熵（high entropy）。所以，最大熵模型的基本思想就是我們要找的分佈是滿足我們限制條件下，同時熵最高的分佈。熵：表示分佈的不

斯坦福大學-自然語言處理入門筆記第八課最大熵模型與判別模型

一、生成模型與判別模型 1、引言到目前為止，我們使用的是生成模型（generative model)，但是在實際使用中我們也在大量使用判別模型（discriminative model)，主要是因為它有如下的優點：準確性很高更容易包含很多和

【統計學習方法-李航-筆記總結】六、邏輯斯諦迴歸和最大熵模型

本文是李航老師《統計學習方法》第六章的筆記，歡迎大佬巨佬們交流。主要參考部落格： http://www.cnblogs.com/YongSun/p/4767100.html https://blog.csdn.net/tina_ttl/article/details/53519391

統計學習---邏輯斯蒂迴歸與最大熵模型

邏輯斯蒂迴歸和最大熵模型邏輯斯蒂分佈邏輯斯蒂迴歸模型將權值向量和輸入向量加以擴充後的邏輯斯蒂模型為模型引數估計極大似然估計法最大熵模型最大熵原理：在所有可能的概率模型中，熵最大的模型是最好的模型。通常用約

【機器學習】最大熵模型原理小結

最大熵模型(maximum entropy model， MaxEnt)也是很典型的分類演算法了，它和邏輯迴歸類似，都是屬於對數線性分類模型。在損失函式優化的過程中，使用了和支援向量機類似的凸優化技術。而對熵的使用，讓我們想起了決策樹演算法中的ID3和C4.5演算法。理解了最

一些對最大熵模型的理解

一、最大熵原理概念：對於隨機變數X，其概率分佈為P(X)，一般在約束條件下會有無數P(X)存在。最大熵原理就是在所有符合約束條件的P(X)中，熵最大的模型即為最優模型。二、最大熵模型最大熵模型，就是基於最大熵原理的分類模型。李航《統計學習方法》中對最大熵模型的描述

最大熵模型中的數學推導

最大熵模型中的數學推導 0 引言寫完SVM之後，一直想繼續寫機器學習的系列，無奈一直時間不穩定且對各個模型演算法的理

NLP --- 最大熵模型的解法（GIS演算法、IIS演算法）

上一節中我們詳細的介紹了什麼是最大熵模型，也推匯出了最大熵模型的目標公式，但是沒給出如何求解的問題，本節將詳細講解GIS演算法求解最大熵模型的過程，這裡先把上一節的推匯出的公式拿過來：上面第一個式子是說我們要尋找的P要滿足k個約束條件，下式說是在滿足的約束的情況下，找到是熵值最大的那

NLP --- 最大熵模型的引入

前幾節我們詳細的闡述了什麼是HMM,同時給出了HMM的三個問題，也給出瞭解決這三個問題的方法最後給出了HMM的簡單的應用。其中為了解決第三個問題我們引入了EM演算法，這個演算法有點麻煩，但是不難理解，而解決第一個和第二個問題時使用的演算法基本上都是基於動態規劃的，這裡需要大家首先對動態規劃演算法

《統計學習方法（李航）》邏輯斯蒂迴歸與最大熵模型學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）線性迴歸（1）是確定兩種或以上變數間相互依賴的定量關係的一種統計分析方法。（2）模型：y=wx+b （3）誤差函式：（4）常見求解方法最小

十、最大熵模型與EM演算法

一、最大熵模型 lnx<=x−1lnx<=x−1 證明：f(x)=x−1−lnx,x>0f(x)=x−1−lnx,x>0，求導是凸函式，在x=1處取得極值 1、熵熵是資訊的度量，與資訊量成反比。

最大熵模型及其python實現

剛開始學習最大熵模型的時候，自以為書中的推導都看明白了。等到自己實現時才發現問題多多。因此，這篇部落格將把重點放在python程式的解讀上，為什麼說是解讀呢，因為這個程式不是我寫的（輕點噴~~），這個程式參考了網上的一篇部落格，地址：http://blog.cs

機器學習 - 最大熵模型

機器學習 - 最大熵模型最大熵原理最大熵模型定義最大熵模型的學習極大似然估計求解最大熵原理最大熵的思想認為，在所有

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型標籤（空格分隔）：機器學習教程·李航統計學習方法邏輯斯蒂：logistic 李航書中稱之為：邏輯斯蒂迴歸模型周志華書中稱之為：對數機率迴歸模