1. 程式人生 > >BLEU機器翻譯評價指標學習筆記

BLEU機器翻譯評價指標學習筆記

BLEU機器翻譯評價指標學習筆記

BLEU(bilingual evaluation understudy),雙語互譯質量評估輔助工具,主要用來評估機器翻譯質量的工具。

評判思想:機器翻譯結果越接近專業人工翻譯的結果,則越好。

實際工作:判斷兩個句子的相似程度。

計算公式
B L E U

N = B P e x p (
n = 1 N w n
l o g p n
) BLEU-N=BP \cdot exp\Big(\sum_{n=1}^{N}{w_nlog{p_n}}\Big)
其中,BP為懲罰因子, p n p_n 為多元精度, w n w_n 為多元精度對應的權重。

多元精度n-gram precision

原始多元精度

原文:貓坐在墊子上
機器譯文: the the the the the the the.
參考譯文:The cat is on the mat.

  • 1元精度 1-gram

    img

    6個詞中,5個詞命中譯文,1元精度 p 1 p_1 為5/6.

  • 2元精度 2-gram

    img

    2元片語的精度則是 3/5.

  • 3元精度 3-gram

    img

    3元片語的精度為1/4.

  • 4元精度 4-gram

    4元片語的精度為0。

一般情況,1-gram可以代表原文有多少詞被單獨翻譯出來,可以反映譯文的充分性,2-gram以上可以反映譯文的流暢性,它的值越高說明可讀性越好。

  • 異常情況

    原文:貓坐在墊子上
    機器譯文: the the the the the the the.
    參考譯文:The cat is on the mat.

    此時,1-gram匹配度為7/7,顯然,此譯文翻譯並不充分,此問題為常用詞幹擾

改進多元精度

C o u n t w i , j c l p = m i n ( C o u n t w i , R e f j C o u n t w i ) C o u n t c l p = m a x ( C o u n t w i , j c l p ) , i = 1 , 2 , 3 p n = C C a n d i d a t e s n g r a m C C o u n t c l i p ( n g r a m ) C C a n d i d a t e s n g r a m C C o u n t c l i p ( n g r a m ) Count^{clp}_{w_i,j}=min{(Count_{w_i},Ref_jCount_{w_i})}\\ Count^{clp}=max(Count^{clp}_{w_i,j}),i=1,2,3\cdots\\ p_n=\frac{\sum_{C\in{Candidates}}{\sum_{n-gram\in C}{Count_{clip}(n-gram)}}}{\sum_{C^{'}\in{Candidates}}{\sum_{n-gram^{'}\in C^{'}}{Count_{clip}(n-gram^{'})}}}

其中, C o u n t w i Count_{w_i} 為單詞 w i w_i 在機器譯文中出現的次數, R e f j C o u n t w i Ref_jCount_{w_i} 為單詞 w i w_i 在第 j j 個譯文中出現的次數, C o u n t w i , j c l p Count^{clp}_{w_i,j} 為單詞 w i w_i 對於第 j j 個參考譯文的截斷計數, C o u n t c l p Count^{clp} 為單詞 w i w_i 在所有參考翻譯裡的綜合截斷計數, p n p_n 為各階N-gram的精度, p n p_n 的公式分子部分表示 n n 元組在翻譯譯文和各參考譯文中出現的最小次數之和,分母部分表示 n n 元組在各參考譯文中出現的最大次數之和。

此時對於異常情況: C o u n t c l p = 2 Count^{clp}=2

相關推薦

BLEU機器翻譯評價指標學習筆記

BLEU機器翻譯評價指標學習筆記 BLEU(bilingual evaluation understudy),雙語互譯質量評估輔助工具,主要用來評估機器翻譯質量的工具。 評判思想:機器翻譯結果越接近專業人工翻譯的結果,則越好。 實際工作:判斷兩個句子的相似程度。 計算公式:

機器翻譯評價指標BLEU詳細計算過程

原文連線 https://blog.csdn.net/guolindonggld/article/details/56966200 1. 簡介 BLEU(Bilingual Evaluation Understudy),相信大家對這個評價指標的概

關於機器翻譯評價指標BLEU(bilingual evaluation understudy)的直覺以及個人理解

最近我在做Natural Language Generating的專案,接觸到了BLEU這個指標,雖然知道它衡量的是機器翻譯的效果,也在一些文獻的experiment的部分看到過該指標,但我實際上經常會略去閱讀實驗效果的部分(純粹感覺不如理論部分激動人心哈哈哈),現在輪到自己做專案了,下定決心要搞懂這個指標到

機器翻譯評價指標

兩個 如同 absolute nor pre ring block 解決 blog 評價機器學習系統是的指標同樣適用於圖像或者視頻描述領域。BELU、Meteor、ROUGE、CIDEr和SPICE。前兩個是評測機器翻譯的,第三個是評測自動摘要的,最後兩個應該是為capti

深入理解C指標學習筆記(一)

第一章 認識指標 指標在C和C++中隨處可見,它給程式設計師帶來了極大的方便,指標為動態記憶體的分配提供了重要支援。使用指標我們可以方便的操控記憶體,提高程式的執行效率;同時利用指標變數我們可以實現各種資料結構,例如連結串列等;另一方面指標與陣列的表示法

征服C指標學習筆記

1.對變數使用&運算子,可以取得該變數的地址。這個地址稱為指向該變數的指標。    指標變數hoge_p儲存了指向其他變數的地址的情況下,可以說“hoge_p指向hoge”。   對指標變數運用*運算子,就等於它指向的變數。如果hoge_p指向hoge,*hoge_

C語言指標學習筆記

指標 1.        表示式中,陣列可以解讀成“指向它的初始元素的指標”(有三個例外),和在後面加不加[]沒有關係 2.        向一個函式傳遞陣列時,實際上傳遞的是一個指向初始元素的指標 3.        C中三種記憶體領域的壽命 靜態變數和全域性變數的壽命從

Bobo老師機器學習筆記第九課-分類演算法的評價指標

1、以前學習分類演算法時候,一直用分類準確度進行演算法的好壞,準確度一定準確嗎? 對於極度偏斜(Skewed data)的資料,只使用分類準確度是不夠的。比如一種癌症的發病率是0.01%,那麼我們系統即使在不分類的情況下,預測健康的情況準確率就可以達到99.99%。這個明顯是不符合實際情況的。

Python機器學習:6.6 不同的性能評價指標

learning 分享 混淆矩陣 sklearn fusion 性能 www. onf 準確率 在前面幾個章節,我們一直使用準確率(accuracy)來評價模型的性能,通常這是一個不錯的選擇。除此之外,還有不少評價指標哦,比如查準率(precision)、查全率(recal

機器學習面試--算法評價指標

匹配 預測 src 數據挖掘 學習 關系 目標 mina abs 機器學習分為三個階段: 第一階段:學習模型。采用學習算法,通過對訓練集進行歸納學習得到分類模型; 第二階段:測試模型。將已經學習得到的分類模型用於測試集,對測試集中未知類別的實例進行分類。 第三階

學習筆記-C語言6(指標與動態記憶體分配)

1. 指標 指標的引入: 指標是C語言最強大的功能之一,使用指標可以儲存某個變數在記憶體中的地址,並且通過操作指標來對該片記憶體進行靈活的操作,例如改變原變數的值,或者構造複雜的資料結構。指標一般初始化為NULL(0)。& 是取地址運算,* 是間接運算子,通過 * 可以訪問與修改

【機器學習】機器學習分類器模型評價指標 機器學習分類器模型評價指標

機器學習分類器模型評價指標 分類器評價指標主要有: 1,Accuracy 2,Precision  3,Recall  4,F1 score  5,ROC 曲線

Bobo老師機器學習筆記第五課-線性迴歸演算法的評估指標

評價線性迴歸的指標有四種,均方誤差(Mean Squared Error)、均方根誤差(Root Mean Squared Error)、平均絕對值誤差(Mean Absolute Error)以及R Squared方法。 sklearnz中使用的,也是大家推薦的方法是R Squared方法。

const修飾符、const與指標一起使用(C++學習筆記 6)

一、 在C++中使用const修飾符來定義常量。(const來自單詞constant,是常量的意思) 用法:const 型別 常量名 = 表示式; 例如:const int LIMIT = 100; 這個常量LIMIT是有型別的,佔用儲存單元,有地址,可以用指標指向它,但不能修改它。

ElasticSearch學習筆記之二十二 指標聚合續

ElasticSearch學習筆記之二十二 指標聚合續 Max Aggregation Min Aggregation Percentiles Aggregation Stats Aggregation Sum Aggregation Va

ElasticSearch學習筆記之二十一 指標聚合

ElasticSearch學習筆記之二十一 指標聚合 指標聚合 Avg Aggregation Script Value Script Missing value Weighted Avg Agg

機器學習演算法——評價指標彙總

準確率,精確率,召回率和F1 準確率(Accuracy), 精確率(Precision), 召回率(Recall)和F1-Measure ROC-AUC ROC曲線 需要提前說明的是,我們這裡只討論二值分類器。對於分類器,或者說分類演算法,評價指標主要有precision,recal

指標(C++學習筆記 12)

記憶體將每個位元組作為一個儲存單元,並給每個儲存單元指定一個編號作為其地址。 系統給不同資料型別分配的儲存空間大小是不一樣的,如:整型變數分配2個位元組的儲存空間;double型變數分配8個位元組;字元型變數分配1個位元組。 變數的地址:因為一個變數的儲存空間要連續佔用若

指標與陣列(C++學習筆記 11)

一、指向陣列元素的指標 1、定義指向陣列元素的指標 每個陣列元素相當於一個變數,所以定義指向陣列元素的指標與定義指向變數的指標方法相同。例如: int ia[5]; /*定義包含5個數組元素的整型陣列ia*/ int *pi; /*定義指向整型變數的指標變數pi*/ p

機器學習演算法的評價指標

機器學習演算法的評價指標 關於作者 前言 二分類問題中常用的概念 精確率(precision) 召回率(recall) F1值 ROC、AUC sklearn實現roc、auc