自然語言處理4-4：語言模型之模型評估perplexity

阿新 • • 發佈：2020-09-23

perplexity可以用來評估訓練的語言模型的好壞，其實就是下面這個公式

$$perplexity = 2^{-x}\qquad x表示的是平均的log likelihood，也可以理解為平均的概率啦$$

下面舉一個例子，假設我們有一個測試集如下：

我喜歡喝奶茶

假設我們有一個訓練好的bi-gram模型，對於詞典庫中的每個單詞，通過這個模型可以得到諸如P(單詞2|單詞1)的概率。這裡列出部分概率

P（我）= 0.1
p(喜歡|我）= 0.1
p（喝|喜歡）=0.1
p（奶茶|喝）=0.1

我們可以得到

x = log{P（我）p(喜歡|我）p（喝|喜歡）p（奶茶|喝）} / 4= -4/4 = -1

perplexity = 2^(-x) = 2^(1) = 2

我們知道，似然估計越大越好，也就是說，x越大越好，所以perplexity越小越好，於是我們就可以通過perplexity對語言模型進行優化了。

這裡舉出的例子都非常小，實際上測試集肯定非常大，而且也不限於bi-gram，當然，訓練的模型得到的概率也不可能都是0.1.

自然語言處理4-4：語言模型之模型評估perplexity

perplexity可以用來評估訓練的語言模型的好壞，其實就是下面這個公式 $$perplexity = 2^{-x}\\qquad x表示的是平均的log likelihood，也可以理解為平均的概率啦$$

自然語言處理4-5：語言模型之平滑操作

為什麼需要平滑操作假設有一個預料集我喜歡喝奶茶我喜歡吃巧克力我喜歡健身

C#開發PACS醫學影像處理系統(四)：介面佈局之狀態列

狀態列一般用於顯示系統狀態，例如影像數量統計、CPU和記憶體使用情況、全屏時顯示日期等，

C#開發PACS醫學影像處理系統(三)：介面佈局之工具欄

工具欄佈局採用WPF中Grid作為容器，按鈕採用自定義樣式和圖示，並採用Separator分割線：

自然語言處理4-3:語言模型之n-gram模型

n-gram模型 unigram模型：假設每個單詞的出現概率和前面的單詞無關，寫成表示式就是：

自然語言處理（1）：Transformer模型實現原理詳解

劃時代的產物在2018年，谷歌推出了BERT模型之後，該模型在11項NLP任務中奪得STOA結果，引爆了整個NLP界。而BERT取得成功的一個關鍵因素是Transformer的強大作用。谷歌的Transformer模型最早是用於機器翻譯

使用scikit-learn進行自然語言處理——文件特徵提取(基於詞袋模型bag-of-words) 計算tf-idf

首先python環境已經安裝了numpy, scipy, sklearn, jieba # coding=utf-8 \"\"\" @desc: \"\"\" from scipy import sparse

【學術】計算傳播學：自然語言處理技術的用途和應用潛力

目錄一、社會傳播學研究二、目前社會傳播學存在的挑戰（1）如何高效地收集、整合資料，並進行資訊的提取與利用。

清華大學劉知遠：知識指導的自然語言處理

“語言是一塊琥珀，許多珍貴和絕妙的思想一直安全地儲存在裡面。”從人類誕生伊始，自然語言就承載著世世代代的智慧，積聚了無窮無盡的知識。這片深蘊寶藏的沃土吸引了眾多滿懷好奇的AI研究者，投入其中耕

R語言自然語言處理：關鍵詞提取與文字摘要（TextRank）

作者：黃天元，復旦大學博士在讀，目前研究涉及文字挖掘、社交網路分析和機器學習等。希望與大家分享學習經驗，推廣並加深R語言在業界的應用。

R語言自然語言處理：關鍵詞提取（TF-IDF）

作者：黃天元，復旦大學博士在讀，熱愛資料科學與開源工具（R/Python），致力於利用資料科學迅速積累行業經驗優勢和科學知識發現，涉獵內容包括但不限於資訊計量、機器學習、資料視覺化、應用統計建模、知識圖譜等，

【自然語言處理】：seq2seq當中的Attention注意力機制

一.seq2seq機制傳統的seq2seq機制在語言翻譯當中使用了兩個RNN，一個是encoder，將語言進行編碼，另一個是decoder，將我們的得到的語言編碼進行解碼，解碼的過程當中就可以對我們的語言進行翻譯成另外一種語言。其

【自然語言處理】： transformer原理實現

1.seq2seq 一般在我們序列模型當中，都會分為encoder和decoder兩個部分，如下圖所示：

哈工大自然語言處理工具箱之ltp在windows10下的安裝使用教程

ltp是哈工大出品的自然語言處理工具箱,pyltp是python下對ltp(c++)的封裝. 在linux下我們很容易的安裝pyltp,因為各種編譯工具比較方便. 但是在windows下需要安裝vs並且還得做一些配置,因為我服務的人都是在windows下辦

MySQL基礎-05DQL語言(資料查詢語言)-進階4常見函式

宣告：此MySQL基礎學習源自尚矽谷。（推薦）b站官方連結：https://www.bilibili.com/video/BV1xW411u7ax?p=1

吳裕雄--天生自然ANDROID開發學習：2.4.4 Adapter基礎講解

1.MVC模式的簡單理解舉個例子：大型的商業程式通常由多人一同開發完成,比如有人負責操作介面的規劃與設計, 有人負責程式程式碼的編寫如果要能夠做到程式專案的分工就必須在程式的結構上做適合的安排 ,如果,介面設計

自然語言處理1-2: 編輯距離

原文出處：https://algorithms.tutorialhorizon.com/dynamic-programming-edit-distance-problem/ 問題：假設我們現在有兩個字串s1和s2，並且給出如下所示的三個編輯操作，寫出一個演算法，當每次只能使用其中一個編

自然語言處理「迷惑行為大賞」第二季

作為一名NLPer，"自然語言處理太難了" 成為你的口頭禪了嗎？今天整理了一系列自然語言處理的迷惑行為，和大家一起欣賞

自然語言處理「迷惑行為大賞」，自然語言處理太難難難了！

點選上方“AI遇見機器學習”，選擇“星標”公眾號重磅乾貨，第一時間送達

zabbix2.2.4沒有中文語言選項和關閉其它語言選項方法

今天更新zabbix監控時發現2.2.4版本中預設沒有中文語言選項，如下：需要在include/locales.inc.php檔案中的第50行到80行配置，將需要的語言選項配置為true，而沒有必須的配置為false，只保留英語選項和

自然語言處理4-4：語言模型之模型評估perplexity

相關推薦