機器學習資訊熵

阿新 • • 發佈：2018-11-25

位元化(Bits)

假設存在一組隨機變數X，各個值出現的概率關係如圖；現在有一組由X變數組成的序列: BACADDCBAC.....；如果現在希望將這個序列轉換為二進位制來進行網路傳輸，那麼我們得到一個得到一個這樣的序列:01001000111110010010.......

結論: 在這種情況下，我們可以使用兩個位元位來表示一個隨機變數。

P(X=A)=1/4 P(X=B)=1/4 P(X=C)=1/4 P(X=D)=1/4
A B C D
00 01 10 11

而當X變量出現的概率值不一樣的時候，對於一組序列資訊來講，每個變數平均
需要多少個位元位來描述呢??

P(X=A)=1/2 P(X=B)=1/4 P(X=C)=1/8 P(X=D)=1/8
A B C D
0 10 110 111

假設現在隨機變數X具有m個值，分別為: V 1 ,V 2 ,....,V m ；並且各個值出現的概率
如下表所示；那麼對於一組序列資訊來講，每個變數平均需要多少個位元位來描
述呢??

　　P(X=V₁)=p₁ P(X=V₂)=p₂ P(X=V₃)=p₃ .................... P(X=V_m)=p_m

可以使用這些變數的期望來表示每個變數需要多少個位元位來描述資訊:

資訊熵(Entropy)

　　H(X)就叫做隨機變數X的資訊熵；

資訊熵(Entropy)　　

　　資訊量：指的是一個樣本/事件所蘊含的資訊，如果一個事件的概率越大，那麼就可以認為該事件所蘊含的資訊越少。極端情況下，比如：“太陽從東方升起”，因為是確定事件，所以不攜帶任何資訊量。

　　資訊熵：1948年，夏農引入資訊熵；一個系統越是有序，資訊熵就越低，一個系統越是混亂，資訊熵就越高，所以資訊熵被認為是一個系統有序程度的度量。

　　資訊熵就是用來描述系統資訊量的不確定度。

　　High Entropy(高資訊熵)：表示隨機變數X是均勻分佈的，各種取值情況是等概率出現的。

　　Low Entropy(低資訊熵)：表示隨機變數X各種取值不是等概率出現。可能出現有的事件概率很大，有的事件概率很小。

條件熵H(Y|X)

　　給定條件X的情況下，隨機變數Y的資訊熵就叫做條件熵。

　　給定條件X的情況下，所有不同x值情況下Y的資訊熵的平均值叫做條件熵。

　　另外,一個公式如下所示：

　　事件(X,Y)發生所包含的熵，減去事件X單獨發生的熵，即為在事件X發生的前提下，Y發生“新”帶來的熵，這個也就是條件熵本身的概念。

機器學習資訊熵

位元化(Bits) 假設存在一組隨機變數X，各個值出現的概率關係如圖；現在有一組由X變數組成的序列: BACADDCBAC.....；如果現在希望將這個序列轉換為二進位制來進行網路傳輸，那麼我們得到一個得到一個這樣的序列:01001000111110010010....... 結論: 在這種情況下，我們可

機器學習--資訊資訊熵資訊增益

資訊：資訊這個概念的理解更應該把他認為是一用名稱，就比如‘雞‘(加引號意思是說這個是名稱)是用來修飾雞(沒加引號是說存在的動物即雞)，‘狗’是用來修飾狗的，但是假如在雞還未被命名為'雞'的時候，雞被命名為‘狗’，狗未被命名為‘狗’的時候，狗被命名為'雞'，那麼現在我們看到狗就會稱其為‘雞’，

機器學習-9（資訊熵的簡單介紹）

這一節介紹一下資訊熵，這個跟熱力學的熵是有區別的，所以現在讓我們忘記熱力學第二定律，我們不需要去聯想。在這裡我將按0基礎的思維來討論資訊熵到底是什麼我們先把基礎公式摘出來 H(X)=−∑xεXP(x)logP(x)) 看公式，我們已經能感受到了，這是離散型的，每個特徵值是獨立

【機器學習】資訊、資訊熵、資訊增益、增益率及基尼係數的概念總結

資訊、資訊熵、資訊增益、增益率及基尼係數的概念總結資訊資訊是用來消除隨機不確定性的東西。對於機器學習中的決策樹而言，如果待分類的事物集合可以劃分為多個類別當中，則第k類的資訊可以定義如下：資訊熵資訊熵是用來度量不確定性，當熵越大，k的不確定性越大，反之越小

【機器學習演算法-python實現】決策樹-Decision tree（1）資訊熵劃分資料集

1.背景決策書演算法是一種逼近離散數值的分類演算法，思路比較簡單，而且準確率較高。國際權威的學術組織，資料探勘國際會議ICDM （the IEEE International Con

機器學習：資訊熵，基尼係數，條件熵，條件基尼係數，資訊增益，資訊增益比，基尼增益，決策樹程式碼實現（一）

文章目錄初始化，涉及到使用的變數：資訊熵定義公式，經驗公式程式碼：基尼係數定義公式，經驗公式程式碼：條件熵，條件基尼係數條件熵定義公式，經驗公式

機器學習之資訊增益（熵和條件熵）

要了解資訊增益，我們要先知道熵與條件熵的定義。 2.1 熵熵是無序度的度量，在資訊理論和統計中，熵表示隨機變數不確定性的度量。假設XX是一個取有限值的離散型隨機變數，它的概率分佈如下： P(X=xi)=pi,i=1,2,…,nP(X=xi)=pi,i=1,2,…

AI機器學習-信息熵，條件熵，信息增益

人工智能其他信息熵信息熵是系統有序化程度的一個度量。比如說，我們要搞清楚一件非常非常不確定的事，或是我們一無所知的事情，就需要了解大量的信息。相反，如果我們對某件事已經有了較多的了解，我們不需要太多的信息就能把它搞清楚。所以，從這個角度，我們可以認為，信息量的度量就等於不確定性的多少。一個系統越是

周志華《機器學習》圖4.4和圖4.9繪制(轉載+增加熵顯示功能)

程式碼來自參考連結: https://blog.csdn.net/leafage_m/article/details/79629074 本文的貢獻是: ①修正參考連結中,演算法第3種情況中的投票問題的相關程式碼, 原文程式碼函式makeTreeFull有誤,會導致生成圖4.4的"虛擬

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

python實現西瓜書《機器學習》習題4.3資訊增益決策樹

首先這篇的格式可能會亂，markdown裝上以後，有時候是用csdn原來的編輯器，有時候就變成了markdown編輯器，蒙。更蒙的是，大牛的程式碼太飄逸了，有點看不懂，慣例先來原地址：https://blog.csdn.net/Snoopy_Yuan/article/details/689

似然函式和最大似然估計與機器學習中的交叉熵函式之間的關係

關於似然函式和最大似然估計的詳細說明可以看這篇文章：https://blog.csdn.net/zgcr654321/article/details/83382729 二分類情況和多分類情況下的似然函式與最大似然估計：二分類情況下的似然函式與最大似然估計：我們知道按照生活中的常識

機器學習基礎（五十八）—— 夏農熵相對熵（KL散度）與交叉熵

【機器學習】交叉熵函式的使用及推導

前言說明：本文只討論Logistic迴歸的交叉熵，對Softmax迴歸的交叉熵類似。 minist手寫數字識別就是用交叉熵作為代價函式。 1.從方差代價函式說起代價函式經常用方差代價函式（即採用均方誤差MSE），比如對於一個神經元（單輸入單輸出，s

機器學習中各種熵的定義及理解

機器學習領域有一個十分有魅力的詞：熵。然而究竟什麼是熵，相信多數人都能說出一二，但又不能清晰的表達出來。而筆者對熵的理解是：“拒絕學習、拒絕提升的人是沒有未來的，也只有努力才能變成自己想成為的人”。下圖是對熵的一個簡單描述：熵可以理解為是一種對無序狀態的度量方式。那麼熵又是如何被用在機器學習中

一文搞懂交叉熵在機器學習中的使用，透徹理解交叉熵背後的直覺

關於交叉熵在loss函式中使用的理解交叉熵（cross entropy）是深度學習中常用的一個概念，一般用來求目標與預測值之間的差距。以前做一些分類問題

【機器學習基礎】熵、KL散度、交叉熵

　　熵（entropy）、KL 散度（Kullback-Leibler (KL) divergence）和交叉熵（cross-entropy）在機器學習的很多地方會用到。比如在決策樹模型使用資訊增益來選擇一個最佳的劃分，使得熵下降最大；深度學習模型最後一層使用 softmax 啟用函式後，我們也常使用交叉熵來

【機器學習】最大熵模型原理小結

最大熵模型(maximum entropy model， MaxEnt)也是很典型的分類演算法了，它和邏輯迴歸類似，都是屬於對數線性分類模型。在損失函式優化的過程中，使用了和支援向量機類似的凸優化技術。而對熵的使用，讓我們想起了決策樹演算法中的ID3和C4.5演算法。理解了最

機器學習筆記：各種熵

在機器學習中通常會使用各種熵來描述分佈與分佈之間的關係，如條件熵和交叉熵等，也有直接優化熵的模型，如最大熵模型。這篇文章簡單總結一下之前見到過的一些熵相關的概念。資訊量定義假設有離散隨機變數 XXX 滿足分佈 P(X=xi)=piP(X = x_{i}

【資訊科技】【2011】【含部分原始碼】影象處理和機器學習技術在數字乳腺影象中癌組織檢測與分類的應用

本文為馬來西亞馬來亞大學（作者：JAWAD NAGI）的電腦科學碩士論文，共355頁。乳腺癌是最常見的癌症之一，也是導致女性死亡的主要原因。乳腺攝影是目前最有效的乳腺癌影像學檢查方法，可用於鑑別異常癌細胞。研究顯示，在當前的乳腺癌篩查中，大約15%到30%的

機器學習 資訊熵

相關推薦

機器學習資訊熵