對語言模型N-gram的理解

今天我們一起來學習一下語言模型N-gram，首先我們來用數學的方法來描述一下語言的規律，這個數學模型就是我們在自然語言處理中的統計語言模型（Statistical Language Model）。在自然語言處理中，所謂的一個句子是否合理通順，就看這個句子的可能性，這裡的可能性就要用概率來衡量。同一種意思的句子，不同種的表達形式，哪種形式出現的概率最大，那麼就表示這個句子是最合理的。
在每一個句子中，我們可以用詞來做為組成句子的最小單位，我們舉個栗子，假設一個句子S是由n個詞w1、w2…wn組成的，那麼這個句子存在的可能性為P(S)，很容易理解得到P(S)=P(w1,w2…wn)，也就是n個詞從w1到wn依次排列的可能性，我們回顧一下概率論裡面的條件概率，這個在之前的貝葉斯理論中也介紹過，我們可以用公式來表示:

P (A | B) = P (A B) / P (B) \Rightarrow P (A B) = A (A | B) \cdot P (B)

$P(A|B) = P(AB)/P(B) \Rightarrow P(AB) = A(A|B) \cdot P(B)$

在B的事件已經發生的情況下發生A事件的概率等於A和B事件同時發生的概率除以B事件的概率，同時我們可以得到A和B事件同時發生的概率等於B事件發生情況下A事件的概率乘以B事件的概率。有了這個公式，我們可以得到：

P (w_{1}, w_{2}, . . ., w_{n}) = P (w_{1}) \cdot P (w_{2} | w_{1}) \cdot P (w_{3} | w_{1}, w_{2}) \cdot \cdot \cdot P (w_{n} | w_{1}, w_{2}, . . ., w_{n - 1})

$P({w_1},{w_2},...,{w_n}) = P({w_1}) \cdot P({w_2}|{w_1}) \cdot P({w_3}|{w_1},{w_2}) \cdot \cdot \cdot P({w_n}|{w_1},{w_2},...,{w_{n - 1}})$

我們在使用百度搜索的時候會有相關的推薦搜尋，如下圖所示：
相關搜尋

P (w_{1}, w_{2}, . . ., w_{n}) = P (w_{1}) \cdot P (w_{2} | w_{1}) \cdot P (w_{3} | w_{2}) \cdot \cdot \cdot P (w_{n} | w_{n - 1})

$P({w_1},{w_2},...,{w_n}) = P({w_1}) \cdot P({w_2}|{w_1}) \cdot P({w_3}|{w_2}) \cdot \cdot \cdot P({w_n}|{w_{n - 1}})$

在引入了這個馬爾可夫假設之後，計算整句話可能性機變得簡單許多。上述的這個公式所對應的統計語言模型就是二元模型（Bigram model）。同樣的道理，我們可以得到，當一個詞的概率由前面N-1個詞所決定，那麼這個就是N元模型，一般來說中文N-gram模型的N不會超過4，N越大，那麼計算量就越大。當N=1的時候，一元模型的計算可以寫成：

P (w_{1}, w_{2}, . . ., w_{n}) = P (w_{1}) \cdot P (w_{2}) \cdot \cdot \cdot P (w_{n})

$P({w_1},{w_2},...,{w_n}) = P({w_1}) \cdot P({w_2}) \cdot \cdot \cdot P({w_n})$

三元模型（Trigram）可以寫成：

P (w_{1}, w_{2}, . . ., w_{n}) = P (w_{1}) \cdot P (w_{2} | w_{1}) \cdot P (w_{3} | w_{1}, w_{2}) \cdot P (w_{4} | w_{2}, w_{3}) \cdot \cdot \cdot P (w_{n} | w_{n - 2}, w_{n - 1})

對語言模型N-gram的理解

對語言模型N-gram的理解

2017MySQL中文索引解決辦法自然語言處理(N-gram parser)

詞向量的Distributed Representation與n元語法模型(n-gram model)

效能測試（一）------對理髮店模型的個人理解

通俗理解N-gram語言模型。（轉）

n-gram語言模型及平滑演算法

python 自然語言處理統計語言建模 - （n-gram模型）

(五)N-gram語言模型的資料處理

(四)N-gram語言模型與馬爾科夫假設

N-Gram語言模型

自然語言處理中的N-Gram模型詳解

N-gram語言模型與馬爾科夫假設

N-gram統計語言模型(總結)

N-gram語言模型 & Perplexity & 平滑

c語言中對字段寬度的理解？

N-Gram模型

Go語言的面向對象模型初探

對星型模型和雪花模型的簡單理解

C++語言學習（十三）——C++對象模型分析

快速熟悉one-hot，N-gram，word2vec模型

對語言模型N-gram的理解

相關推薦