1. 程式人生 > >讀書心得(一)資訊理論中熵-的初淺理解

讀書心得(一)資訊理論中熵-的初淺理解

  • 資訊的度量與他的不確定性相關

一條資訊的資訊量和它的不確定性有著直接關係。

當我們需要搞清楚一件不確定的事情時,我們需要更大量的資訊來瞭解事情的真相;相反,如果我們需要

我們已經理解的事,那僅需少量資訊就能理解。

==>可以把一件資訊的資訊量(真正有用的資訊)等於不確定性的多寡。

舉例一:

世足賽中,我錯過了觀看球賽的時間但我想知道最後是誰得到了冠軍,此時有觀看過球賽之某人可以讓我問答(資訊)

我每問答一次此人收我一塊錢,已知共有32支球隊,如果用較有效率的做法,我們可以用以下問法"冠暈球隊在1-16號中嗎?"

"冠軍球隊在1-8號中嗎?"、"冠軍球隊在9-16號中嗎?"如此反覆詢問,如此一來便可以使用五塊錢獲得該次比賽的誰是冠軍資訊(資訊量)。

此資訊共值五元。

        而在資訊理論中,夏農所用的是位元(bit)而不是錢。

但有些球隊依過去歷史紀錄贏得比賽的機率比較大,與其使用簡單二分法,

         我們可以一次將那些贏的機率較小的球隊綜合起來與其比較,如此反覆,有很高的機率可以在小於五次的詢問

        次數的道誰是冠軍的資訊。

  當每支球隊的冠可能性不相等時,夏農指出其準確資訊量應當是

H=-(p1*logp2+p2+p2*logp2+...+p32*logp32);

其中log是以二為底,Pn為球隊n贏得球賽的機率,數學證明可匯出當我們擁有球隊贏得球賽的概率時

該公式的H必小於logn(在此範例當中為5),比二分法有效。

對任意隨機變數X而言(比如得冠軍的球隊),它的熵定義如下:

H(X)=-Σx∈X P(x)logP(x);

舉例(二)

有了熵這個概念,我們可以試算50萬字中文書有多少資訊量,已知常用漢字約略7000,

假如每字出現為等機率,那麼需要大概13bit才能表達一漢字;但實際上每漢字出線機率不均等

 前10%的漢字站常用文字95%以上,因此即使不考慮上下文相關性,而只考慮每漢字獨立出現的概率

每漢字的資訊熵僅有8-9bit,如果考慮上下文相關性,僅有5bit。

冗餘度Redundancy

透過資訊及所含真正資訊的差異。

  如果一本書重複的內容多,它的資訊量就小,冗餘度就大。

相關推薦

讀書心得()資訊理論-的理解

資訊的度量與他的不確定性相關 一條資訊的資訊量和它的不確定性有著直接關係。 當我們需要搞清楚一件不確定的事情時,我們需要更大量的資訊來瞭解事情的真相;相反,如果我們需要 我們已經理解的事,那僅需少量資訊就能理解。 ==>可以把一件資訊的資訊量(真正有用的資訊)等於不

關於資訊理論、相對、、條件、互資訊、典型集的一些思考

1. 緒論 0x1:資訊理論與其他學科之間的關係 資訊理論在統計物理(熱力學)、電腦科學(科爾莫戈羅夫複雜度或演算法複雜度)、統計推斷(奧卡姆剃刀,最簡潔的解釋最佳)以及概率和統計(關於最優化假設檢驗與估計的誤差指數)等學科中都具有奠基性的貢獻。如下圖 這個小節,我們簡要介紹資訊理論及其關聯的思想的

Vuex 實際使用的一點心得 —— 刷新就沒了

store 點心 需要 一點 con app patch 介紹 很多 問題 在開發中,有一些全局數據,比如用戶數據,系統數據等。這些數據很多組件中都會使用,我們當然可以每次使用的時候都去請求,但是出於程序員的“潔癖”、“摳”等等優點,還是希望一次請求,到處使用。 這時候很自

sql 如何同時更改的多行值

sql如圖,我要把 pre_tel 列 都加上 010 或者其他區號,但是如何用同一條 sql 語句實現?sql 如何同時更改一列中的多行值

構建之法第三章讀書心得

如何 讀書心得 初級 知識 技能 任務 項目 標準 技術   在構建之法第三章中,我們主要學習了個人能力的衡量與發展。   初級軟件工程師有以下幾個成長階段:1、積累軟件開發相關的知識,提升技術技能。                    2、積累問題領域的知識和經驗。  

關於信息論的定義與含義:

round tail 增量 order aik 參考 info eight 分布 信息熵: 1. 熱力學中的熱熵是表示分子狀態混亂程度的物理量。香農用信息熵的概念來描述信源的不確定度。 2. ;兩個獨立符號所產生的不確定性應等於各自不確定性之和 3. 在信源中,考慮的不是

構建之法 chapter 8 需求分析 ——讀書心得

工作 一段 簡潔 多任務 解釋 平臺 tor abc 敏捷 需求分析,是軟件工程開發的第一步,準確全面地找到用戶的需求,盡可能滿足用戶的要求,是軟件惺惺發展的基礎。所以需求分析很重要。具體來說有以下幾個步驟: 1.獲取和引導需求:軟件團隊需要找到軟件的利

自定義控件時-添加多個控件到

logs pub name 添加多個 tool 是否 imp efi 類名 dmwidgetinterface.h 1 #ifndef _DM_WIDGET_INTERFACE_H_ 2 #define _DM_WIDGET_INTERFACE_H_ 3 4

構建之法第四章讀書心得

算法 邏輯錯誤 規範 審核 領域 之間 心得 使用 部分 代碼風格規範——主要是文字上的規定,看似表面文章,實際上非常重要 代碼風格的原則是:簡明,易讀,無二義性 代碼設計規範——牽涉到程序設計、模塊之間的關系、設計模式等方方面面的通用原則 代碼設計規範不光是程序書寫的格

《你必須知道的.NET》讀書筆記:小OO有大智慧

實現 職責 可靠性 基本 code cfile 生存 最好 min() 此篇已收錄至《你必須知道的.Net》讀書筆記目錄貼,點擊訪問該目錄可以獲取更多內容。 一、對象   (1)出生:系統首先會在內存中分配一定的存儲空間,然後初始化其附加成員,調用構造函數執行初始化,這

PHP開發心得

parameter shanghai php.ini als exce 可能 方法 clas sdl 1,php獲得服務器時間 $time= date(‘Y-m-d H:i‘); echo $time;   一般寫法如上,但發現打印出來的時間小時數總數不對,和機器的時

Verilog學習心得()

== padding 並行執行 printf enter pad port 網線 學習心得 ?         作為一個萌新,第一次讓我學習Verilog我是拒絕的,連數電都沒有學習過學Verilog真是一種折磨...不過自己選擇的路不管怎麽樣都要走下去.

vivado使用心得()

nbsp redis 路徑 verilog 不兼容 分析 缺點 控制臺輸出 web ? 最新消息請看最後~ 我的任務是分析Verilog程序中的算法...於是自然搭配Xilinx(賽靈思)發布的vivado集成開發環境進行分析.我用的版本是vi

Maven項目搭建():Maven體驗

測試類 java平臺 存在 ack 做的 rar cli maven2 試用 今天給大家介紹一個項目管理和綜合工具:Maven。 Maven: maven讀作 [‘meivin],本意是指可以被信任的領域專家,致力於傳播知識(來自於http://en.wikip

alibaba-Java開發手冊心得-編程規約-1命名風格

tor abs 形容詞 通用 架構設計 test arc 單詞 快速 1.【強制】不能以 _ $開始 或結束 2.【強制】嚴禁使用 拼音和英文混合,或中文。即使是純拼音也要避免使用。除非是國際通用的例如taobao youku 等。 3.【強制】類名 必須遵從駝峰形式Upp

《SQL Server企業級平臺管理實踐》讀書筆記——SQL Server關於系統庫Tempdb總結

lis 定義函數 into 不能 get 裏的 where requests tar Tempdb系統數據庫是一個全局資源。可供連接到SQL Server實例的全部用戶使用。 存儲的內容項: 1、用戶對象 用戶對象由用戶顯示創建。這些對象能夠位於用戶會話的作用域

構建之法第五章讀書心得

多個 功能需求 優先級 周期 基礎 第五章 高效 包括 交付 這一章我們主要學習了團隊和流程。團隊簡而言之就是開發一個軟件工程的團隊,那麽團隊究竟怎樣在一起開發這一軟件便有了多種多樣的方法。 比如所有人都一起做的一窩蜂模式,但這樣模式弊端很大,雖然都做了許多工作,但結合起來

alibaba-Java開發手冊心得-編程規約-6並發處理

工廠 com 線程資源 資源 以及 指定 導致 java java開發 1. 【強制】獲取單例對象需要保證線程安全,其中的方法也要保證線程安全。 說明:資源驅動類、工具類、單例工廠類都需要註意。 2. 【強制】創建線程或線程池時請指定有意義的線程名稱,方便出錯時回溯。 3

《JavaScript 高級程序設計》讀書筆記 簡介

ron 設計 str 歷史 定義 程序 筆記一 scrip strong 一 歷史 二 實現   a. javascript三個部分:     ECMAScript:由ECMA-262定義,提供核心語言功能;     DOM:提供HTML的應用程序編程接口/提

Pandas: 如何將的文本拆分為多行? | Python

gid scene pmo lua ioe solid gige ble app Pandas: 如何將一列中的文本拆分為多行? 在數據處理過程中,經常會遇到以下類型的數據: 在同一列中,本該分別填入多行中的數據,被填在一行裏了,然而在分析的時候,需要拆分成為多