N元語言模型
語言模型是幹嘛的?
語言模型可以計算任何句子的概率。例如,“I love you”的概率是多少?用數學語言表述,
語言模型有什麼用?
語言模型在自然語言處理中佔有重要的地位,在語音識別,機器翻譯,漢語自動分詞和句法分析等都有應用。因為這些模型都會有噪聲,都會有幾種不同的結果等著我們去選擇,這時候就需要知道每種結果的概率,來幫助我們選擇。
為什麼叫“語言模型”?因為這是統計學意義上的模型,又跟語言相關,所以叫語言模型。統計模型指一系列分佈,引數模型指一系列可用有限個引數表示的模型。語言模型就是一種引數模型,它的引數是矩陣的所有cell。
如何計算語言模型的引數?
引數無法精確計算,只能大概估計。這裡用的方法是極大似然估計。對於某個語料庫,極大似然估計的意思是,哪個語言模型(什麼樣的引數)最有可能產生這個語料庫呢?把這個問題分解成許多個小問題:當
那樣計算概率的原因:馬爾科夫假設
然而,為什麼I love you的概率可以通過
參考資料:
《Speech and Language Processing》Jurafsky and Martin, Chapter 4