文字上的演算法讀書筆記一--基礎知識

阿新 • • 發佈：2018-11-03

1.1 概率論

概率描述一些事情發生的可能性。

大數定理：

當試驗次數（樣本）足夠多的時候，事件出現的頻率無限接近於該事件真實發生的概率。

來表示隨機變數的概率，那麼就要滿足如下兩個特性：

聯合概率

表示兩個事件共同發生的概率，如果相互獨立，則

條件概率

是指在已知事件x已發生的情況下，事件y發生的概率。且有。如果這兩個事件相互獨立，那麼與相等。

聯合概率和條件概率分別對應兩個模型：生成模型和判別模型。

期望：

概率分別的均值稱為期望：

期望就是對每個可能的的取值x，與其對應的概率值,進行相乘求和。假如一個隨機變數的概率分散式均勻分佈，期望就等於均值。

方差：

概率分佈的方差為：

方差表示隨機變數偏離期望的大小。衡量資料的波動性，方差越小表示資料越穩定，反之波動性越大。

概率分佈有：均勻分佈，正態分佈，二項分佈，泊松分佈，指數分佈等

1.2 資訊理論

外面下雨了，很平常

見到外星人了，很稀奇

同樣兩條資訊。一條資訊量很少，一條資訊量很大，很有價值，如何量化呢

資訊熵

需要資訊熵，一個隨機變數X的資訊熵如下：

資訊越少，事件的不確定性越大，資訊熵很大。

資訊熵表示不確定性的度量

聯合熵：

描述的是一對隨機變數X和Y的不確定性。

條件熵：

條件熵衡量的是在一個隨機變數X已知的情況下，另一個隨機變數Y的不確定性。

互資訊：

衡量兩個隨機變數的相關程度，當X和Y完全相關時，互資訊就是1，完全無關時，互資訊就是0。

互資訊與熵的關係：

相對熵（KL距離）：

相對熵是衡量相同時間空間裡兩個概率分佈（函式）的差異程度（不同於熵和互資訊，它們衡量的是隨機變數的關係）

分佈相同，相對熵為0，當差異增加，則相對熵增加。

物理意義在於如果用Q分佈來編碼P分佈（一般是真實分佈）的話，平均每個基本事件編碼長度增加了多少位元。

交叉熵：

可以理解為p的資訊熵+

舉例

計算機和硬體的互資訊就比計算機和杯子的互資訊要大，因為更相關。

計算方法，，x獨立出現的概率，y獨立出現的概率，x和y同時出現的概率。

文件中計算詞出現的個數，相除就可以了

1.2 貝葉斯法則

定義如下：

是後驗概率，是似然概率，是先驗概率，稱為標準化常量。

應用：

分詞是自然語言處理的最底層，最基本的一個技術了。

對一句話分詞，最簡答的就是查字典，使用的策略是最大值匹配。

查字典法有兩種：

正向最大匹配法和反向最大匹配法。一個是從前向後匹配，一個是從後向前匹配。

棘手問題：

歧義問題。

如學歷史知識

前向：學歷/史/知識

後向：學/歷史/知識

存在二義性。

基於統計的方法：

假設使用者輸入的句子用S表示，把S分詞後結果表示為：

那麼我們求得是達到最大值的那個分詞結果，這個概率不好求，於是通過貝葉斯：

是一個標準化常量，公式改寫為

表示這種分詞生成句子S的可能性，表示這種分詞本身的可能性。

可以認為就是1，因為必然能生成S,那麼剩下的就是計算

在數學中，要簡化數學模型，那就是假設

假設句子中一個詞的出現概率只依賴於它前面的那個詞，根據全概率公式：

可以改寫成：

接下來就是估計，這樣問題變得簡單，只要統計這對詞在統計文字中前後相鄰出現了多少次，以及在同樣的文字中出現了多少次。

平滑，防止概率為0

實際系統中，由於效能等原因，很少使用語言模型來分詞消歧，而是使用序列標註、共現和一些規則等方法來消歧。

文字上的演算法讀書筆記一--基礎知識

1.1 概率論概率描述一些事情發生的可能性。大數定理：當試驗次數（樣本）足夠多的時候，事件出現的頻率無限接近於該事件真實發生的概率。來表示隨機變數的概率，那麼就要滿足如下兩個特性：聯合概率表示兩個事件共同發生的概率，如果相互獨立，則條件概率是指在

PILE讀書筆記_基礎知識

Chef學習筆記(一)--基礎知識與安裝配置

Chef 概念安裝配置示例通常Chef由三部分組成：Workstation、Chef Server、Chef Node。 Workstation是進行日常工作的機器，需安裝Chef Development Kit，用來編寫cookbooks，管理Chef Server和Node。

《Spring Cloud微服務實戰》讀書筆記之基礎知識1

摘要微服務是一種系統架構的設計風格，它主旨在於將一個原本獨立的系統，拆分成多個獨立執行的小型服務。不同服務之間通過Restful介面進行通訊協作。關鍵詞：Spring Cloud，微服務一、什麼是微服務微服務是一種系統架構的設計風格，它主旨在於將一個原本

Deep Learning讀書筆記1--基礎知識篇（第二、三、四、五章）

Deep Learning An MIT Press book Ian Goodfellow and Yoshua Bengio and Aaron Courville 英文原版

UNIX讀書筆記----UNIX基礎知識

UNIX體系結構：　　從嚴格意義上講，可將作業系統定義為一種軟體，它控制計算機硬體資源，提供程式執行環境。我們通常將這種軟體稱為核心（Kernel），因為他相對較小，而且位於環境的核心。圖片顯示了UNIX系統的體系結構。　　核心的介面被稱為系統呼叫（system call）。公用函式庫構建在系統呼叫介面只是，

文字上的演算法讀書筆記二--我們生活在一個尋求最優的世界裡

最優化模型是機器學習的內功，幾乎每一個機器學習背後都是一個最優化模型。 2.1 最優化問題科學抽象於生活，科學服務於生活。每個機器學習背後都是個最優化問題。希望付出最小的成本來獲得最大的收益。一般的最優化形式表示如下：是目標函式，和分別是約束條件，沒有約束條件的（只有,稱

文字上的演算法讀書筆記七--理解語言有多難

理解語言有多難 7.1 自然語言處理自然語言處理NLP是讓計算機能處理語言，20世紀50年代，大家關心的是人類學習語言的認知研究上，計算機處理語言，必須先分析語句和獲取語義，需要分析詞的次序，句子的句法規則，就是喬姆斯基的有限狀態自動機刻畫語言的語法，建立了自然語言的有限狀態模型，這時是基

文字上的演算法讀書筆記六--搜尋引擎

6 搜尋引擎是什麼玩意兒 Google這家搜尋引擎公司的巨大成功，才把文字處理技術推向了一個新的高度。 6.1 搜尋引擎原理假設Q為使用者要查詢的關鍵詞；為所有網頁集合中第i個網頁；表示給定一個Q,第i個網頁滿足了使用者需求的概率，那麼搜尋引擎乾的就是根據使用者的輸入Query（也包括

文字上的演算法讀書筆記五--nlp的需要知道的術語

搜尋引擎的基本的術語 1.tf/df/idf tf是詞頻，就是某個詞的出現的次數，表示的是一個詞的區域性資訊。 df是文件頻率，就是指某個詞的文件頻率，這個詞在多少個文件中出現。 idf是逆文件頻率，它是詞重要性的一個很好的衡量。計算如下：在大量語料庫中統計的，所以一般表

文字上的演算法讀書筆記四--分散式系統

第三篇應用篇如何計算的更快隨著資料量的爆炸式增長，如何儲存和計算海量資料就成了一個問題。解決的方法之一是使用分散式系統，可以更快更好的完成使用者的請求。程式優化程式執行時，經過將目標檔案中的程式碼和資料從磁碟拷貝到主存，從儲存器拷貝到暫存器堆，再從暫存器中拷貝到顯示器上。

FPGA軟硬協同設計學習筆記及基礎知識（一）

擴展性產生新的 pll 多個分配每次調用 span 一、FPGA軟件硬件協同定義：軟件：一般以軟件語言來描述，類似ARM處理器的嵌入式設計。硬件定義如FPGA，裏面資源有限但可重配置性有許多優點，新的有動態可充配置技術。

《web安全之機器學習入門》第5章K近鄰演算法讀書筆記【上】

K近鄰演算法的思路：如果一個樣本在空間上最近的K鄰居大多數都屬於M類，則該樣本屬於M類。在本章中，使用K近鄰演算法識別使用者操作序列中的異常命令。分析資料集url:http://www.schonlau.net/資料集說明：50個使用者的linux操作日誌以User開頭的檔案

Java基礎複習筆記——異常基礎知識（一）

1.論Exception和Error的區別 Exception 和Error都繼承自Throwable父類。 Error是指正常執行情況下，不太可能出現的情況，一旦Error發生一般都會導致程式處於非正常不可恢復的狀態，比如

《深入淺出MySQL》讀書筆記一：SQL基礎

一、SQL分類 1、create、drop、alter等，屬於資料定義語言 2、insert、delete、update、select 屬於資料操縱語句 3、grant等定義訪問許可權和安全級別屬於資料控制語句二、資料定義語句 mysql -uroot -p 輸入密

《深入Linux核心架構與底層原理》讀書筆記一——核心架構與核心資料結構知識

1、核心架構常見架構正規化：Linux核心上下層通訊方式橫向系統和縱向系統橫向系統如cgroup,proc,sys檔案系統，系統呼叫的組織，除錯系統，Core Dump，訊號，記憶體管理等；縱向系統是指具體的功能模組，如USB功能，一個對USB檔案的操作要走完核心中的很多個層

【記】《.net之美》之讀書筆記(一) C#語言基礎

### 前言工作之中，我們習慣了碰到任務就直接去實現其業務邏輯，但是C#真正的一些基礎知識，在我們久而久之不去了解鞏固的情況下，就會忽視掉。我深知自己正一步步走向只知用法卻不知原理的深淵，所以工作之餘，一直想找一些能深入講解C#基礎知識和底層原理的書籍，有幸在網上看到了《.net之美》一書，（--張子陽作

《你必須知道的.NET》讀書筆記一：小OO有大智慧

實現職責可靠性基本 code cfile 生存最好 min() 此篇已收錄至《你必須知道的.Net》讀書筆記目錄貼，點擊訪問該目錄可以獲取更多內容。一、對象　（1）出生：系統首先會在內存中分配一定的存儲空間，然後初始化其附加成員，調用構造函數執行初始化，這

Shader學習筆記_基礎知識_分量

spa 例如 string 不知道坐標 nbsp pre 表示設置分量矢量的分量名稱：{x,y,z,w}表示頂點； {r,g,b,a}表示顏色；{s,t,p,q}表示紋理坐標。每個分量用點號連接（例如v2.x（一個float變量），v3.rg(一個vec2變量)）

《JavaScript 高級程序設計》讀書筆記一簡介

ron 設計 str 歷史定義程序筆記一 scrip strong 一歷史二實現　　a. javascript三個部分：　　　　ECMAScript：由ECMA-262定義，提供核心語言功能；　　　　DOM：提供HTML的應用程序編程接口/提

文字上的演算法讀書筆記一--基礎知識

1.1 概率論

大數定理：

聯合概率

條件概率

期望：

方差：

1.2 資訊理論

資訊熵

聯合熵：

條件熵：

互資訊：

互資訊與熵的關係：

相對熵（KL距離）：

交叉熵：

舉例

1.2 貝葉斯法則

應用：

在數學中，要簡化數學模型，那就是假設

相關推薦