1. 程式人生 > >數學狂想曲(四)——玻爾茲曼分佈

數學狂想曲(四)——玻爾茲曼分佈

玻爾茲曼分佈

Boltzmann distribution(又叫Gibbs distribution)本來是脫胎於熱力學和統計力學的分佈,但在量子力學和機器學習領域也得到了廣泛的應用。

注:Ludwig Eduard Boltzmann,1844~1906,奧地利物理學家,統計力學的奠基人之一。維也納大學博士,先後執教於格拉茨大學、維也納大學、慕尼黑大學和萊比錫大學。英國皇家學會會員。

資訊熵

設概率實驗X有n個可能的獨立結局,即n個隨機事件A1,,An,每個隨機事件的概率為p1,,pn。則資訊熵的定義為:

Hn=ki=1npilnpi(1)

其中k為一正常數。可以看出H

n實際上是pi的泛函。

以下我們主要從資訊熵的角度出發研究玻爾茲曼分佈。但不能忽視的是,玻爾茲曼分佈最早脫胎於熱力學,而資訊熵與熱力學統計物理中的熵,雖然數學形式一致,但本質是不同的。兩者相差一個玻爾茲曼常數。參見:

資訊熵與熱力學統計物理中的熵有什麼區別和聯絡?

注:資訊熵的定義有多種,公式1給出的是Shannon熵的定義,除此之外還有von Neumann熵、Renyi熵等。以下如無特殊指出,資訊熵均指Shannon熵。

最大資訊熵原理

事實上,有些隨機事件其概率往往不可能直接計算,平常我們對具體問題作出處理時,掌握的僅僅是一些與隨機事件有關的隨機變數的統計平均值,以及某些其他制約條件。而當一個隨機變數的平均值給定時,還可以有多種概率分佈與之相容。現在的問題是如何從這些相容的概率分佈中挑選出“最可幾”的分佈來作為實際上的分佈。顯然,要做到這點,必須有個挑選標準,最大資訊熵原理就可作為這種挑選標準。

注:最可幾分布(Most Probable Distribution),又稱最概然分佈。它表徵在特定系統的特定狀態下,出現概率最大的分佈。從它的定義可以看出,它實際上並不是某種具體的分佈,而更像是符合某一特定目標的分佈。
比如,麥克斯韋-玻爾茲曼分佈、費米-狄拉克分佈和玻色-愛因斯坦分佈,是熱力學常見的三種最可幾分布。但它們所處的系統,以及系統的狀態各不相同。

最大熵原理是1957年由E.T.Jaynes提出的,其主要思想是,在只掌握關於未知分佈的部分知識時,應該選取符合這些知識但熵值最大的概率分佈。其實質就是,在已知部分知識的前提下,關於未知分佈最合理的推斷就是符合已知知識最不確定或最隨機的推斷,這是我們可以作出的唯一不偏不倚的選擇,任何其它的選擇都意味著我們增加了其它的約束和假設,這些約束和假設根據我們掌握的資訊無法作出。

注:Edwin Thompson Jaynes,1922~1998,美國統計學家。普林斯頓大學博士,華盛頓大學教授。

假定系統涉及的M個隨機變數f(j)i(j=1,,M)的期望值Fj已知,即:

Fj=i=1nf(j)ipi(2)

其中f(j)i表示第j個隨機變數在狀態i中的取值。pi滿足歸一化條件:

i=1npi=1(3)

將公式2和公式3所述的兩個約束,代入公式1,可得如下Lagrange乘子:

J(pi)=Hn/kα(i=1npi1)j=1Mβj(i=1nf(j)ipiFj)=i=1npilnpiαi=1npi+αj=1Mi=1nβjf(j)ipi+j=1MβjFj

pi求導,可得:

J(pi)pi=lnpi1αj=1Mβjf(j)i

令上式等於0,可得:

pi=exp(1α

相關推薦

數學狂想曲——分佈

玻爾茲曼分佈 Boltzmann distribution(又叫Gibbs distribution)本來是脫胎於熱力學和統計力學的分佈,但在量子力學和機器學習領域也得到了廣泛的應用。 注:Ludwig Eduard Boltzmann,1844~

熵的理解分佈

log2n(以 2 為底的對數):用二進位制數來表達不同的狀態組合需要多少個二進位制位; 0. 玻爾茲曼分佈 網路中任意兩個狀態出現的概率與對應能量之間的關係: P(α)P(β)=exp(−E0/T)exp(−E1/T) 從式中可以得出兩點

深度學習 --- 分佈詳解

上一節我們從Hopfield神經網路存在偽吸引子的問題出發,為了解決偽吸引子帶來的問題,詳細介紹了模擬退火演算法,本節也是基礎性的講解,為了解決偽吸引子還需要引入另外一個重要概念即:玻爾茲曼分佈。本篇將詳解玻爾茲曼分佈,但是還是先說說為什麼要引入玻爾茲曼分佈,因為為了解決Hopfield神經網路

受限RBM原理總結

guid filter font list cuc spa 得到 aci dcb https://blog.csdn.net/l7H9JA4/article/details/81463954 授權轉發自:劉建平《受限玻爾茲曼機(RBM)原理總結》 地址:http://w

六.隨機神經網路Boltzmann

Hopfield網路具有最優計算功能,然而網路只能嚴格按照能量函式遞減方式演化,很難避免偽狀態的出現,且權值容易陷入區域性極小值,無法收斂於全域性最優解。 如果反饋神經網路的迭代過程不是那麼死板,可以在一定程度上暫時接受能量函式變大的結果,就有可能跳出區域性極小值。隨機神經網路的核心思想就是在網路中加入概率

深度學習 --- 受限科夫過程、馬科夫鏈

        上一節我們詳細的探討了玻爾茲曼機,玻爾茲曼機的發明是為了解決Hopfield神經網路的偽吸引子的問題,因此把退火演算法、玻爾茲曼分佈和Hopfield神經網路結合在一起形成了玻爾茲曼機(隨機神經網路)。通過前面幾節我們知道玻爾茲曼機可以很好

深度學習 --- 隨機神經網路詳解機學習演算法、執行演算法

BM網路的學習演算法 (1)  學習過程       通過有導師學習,BM網路可以對訓練集中各模式的概率分佈進行模擬,從而實現聯想記憶.學習的目的是通過調整網路權值使訓練集中的模式在網路狀態中以相同的概率再現.學習過程可分為兩個階段;第一階段

RBM受限和深層信念網絡Deep Brief Network

例如 sha 目標 監督學習 怎麽 繼續 定義 再次 rbm 目錄: 一、RBM 二、Deep Brief Network 三、Deep Autoencoder 一、RBM 1、定義【無監督學習】 RBM記住三個要訣:1)

RBM受限和深層信念網路Deep Brief Network

 目錄: 一、RBM 二、Deep Brief Network 三、Deep Autoencoder   一、RBM 1、定義【無監督學習】 RBM記住三個要訣:1)兩層結構圖,可視層和隱藏層;【沒輸出層】2)層內無連線,層間全連線;3)二值狀態值,

Restricted Boltzmann Machine限制

RBM原理: 玻爾茲曼機最初是作為一種廣義的“聯結主義”引入,用來學習向量上的任意概率分佈。聯結主義(connectionism)的中心思想是,當網路將大量簡單計算單元連線在一起時可以實現智慧的行為。分散式表示(distributed representation)認為系統每個

深度學習方法:受限機RBM模型求解,Gibbs sampling

歡迎轉載,轉載請註明:本文出自Bin的專欄blog.csdn.net/xbinworld。  技術交流QQ群:433250724,歡迎對演算法、技術、應用感興趣的同學加入。 接下來重點講一下RBM模型求解方法,其實用的依然是梯度優化方法,但是求解需要用

《白話深度學習與Tensorflow》學習筆記7RBM限制

不受限的:在實際工程中用處不大,所以目前只需要研究受限玻爾茲曼機。 一層是視覺化層,一般來說是輸入層,另一層是隱含層,也就是我們一般指的特徵提取層。 RBM是可以多層疊加在一起的。 上面的h1到hn是n個實數,下面的v1到vm是m個實數,都是0到1

RBM受限原理及程式碼

EBMs 的隱藏神經元 在很多情況下, 我們看不到部分的隱藏單元  , 或者我們要引入一些不可見的參量來增強模型的能力.所以我們考慮一些可見的神經元(依然表示為 ) 和 隱藏的部分 . 我們可以這樣寫我們的表示式:                                            

深度置信網路DBN和受限RBM

原部落格於http://blog.163.com/silence_ellen/blog/static/176104222201431710264087/ 本篇非常簡要地介紹了深度信念網路的基本概念。文章先簡要介紹了深度信念網路(包括其應用例項)。接著分別講述了:(1)

3D數學基礎元數和歐拉角

transform 推薦 中間 應該 它的 轉變 編輯器 最簡 組件 一、四元數   四元數本質上是個高階復數,可視為復數的擴展,表達式為y=a+bi+cj+dk。在說矩陣旋轉的時候提到了它,當然四元數在Unity裏面主要作用也在於此。在Unity編輯器中的Transfor

小橙書閱讀指南——希排序及改進算法

多次 image 影響 mage sys src class emp href 算法描述:希爾排序是一種基於插入排序的快速排序算法,相比於傳統的相鄰插入,希爾排序更加適合大規模亂序數組的排序。和插入算法一樣,我們也可以優化插入和移動的過程從而進一步提升算法效率。 算法圖示:

java排序演算法------希排序

希爾排序 希爾排序也是一種插入排序,它是簡單插入排序經過改進之後的一個更高效的版本,也稱為縮小增量排序,同時該演算法是衝破O(n2)的第一批演算法之一。 程式碼實現: /** *希爾排序的誕生是由於插入排序在處理大規模陣列的時候會遇到需要移動太多元素的問

初級演算法探索——數學

問題:羅馬數字轉整數 羅馬數字包含以下七種字元: I, V, X, L,C,D 和 M。 字元 數值 I 1 V 5 X 10 L 50 C

數學狂想曲——Bézier curve, 熵

隨機過程(續) 中心極限定理 中心極限定理:研究何種條件下獨立隨機變數之和的極限分佈為正態分佈的一系列命題的統稱。它是數理統計學和誤差分析的理論基礎,指出了大量隨機變數積累分佈函式逐點收斂到正態分佈的積累分佈函式的條件。自然界與生產中,一些現象受到許多相互獨立的

受限制機(RBM)用於電影推薦小例

lips 開發 rec tran 必須 int png a* __init__ 原文章:http://blog.csdn.net/u010223750/article/details/61196549 1 #coding=‘utf-8‘ 2 """ 3 de