1. 程式人生 > >資訊檢索(IR)的評價指標介紹

資訊檢索(IR)的評價指標介紹

在資訊檢索、分類體系中,有一系列的指標,搞清楚這些指標對於評價檢索和分類效能非常重要,因此最近根據網友的部落格做了一個彙總。

準確率、召回率、F1

資訊檢索、分類、識別、翻譯等領域兩個最基本指標是召回率(Recall Rate)準確率(Precision Rate),召回率也叫查全率,準確率也叫查準率,概念公式:

             召回率(Recall)      =  系統檢索到的相關檔案 / 系統所有相關的檔案總數

             準確率(Precision) =  系統檢索到的相關檔案 / 系統所有檢索到的檔案總數

圖示表示如下:

注意:準確率和召回率是互相影響的,理想情況下肯定是做到兩者都高,但是一般情況下準確率高、召回率就低,召回率低、準確率高,當然如果兩者都低,那是什麼地方出問題了

。一般情況,用不同的閥值,統計出一組不同閥值下的精確率和召回率,如下圖:

如果是做搜尋,那就是保證召回的情況下提升準確率;如果做疾病監測、反垃圾,則是保準確率的條件下,提升召回。

所以,在兩者都要求高的情況下,可以用F1來衡量。

  1. F1 = 2 * P * R / (P + R)  
  1. F1 = 2 * P * R / (P + R)  

公式基本上就是這樣,但是如何算圖1中的A、B、C、D呢?這需要人工標註,人工標註資料需要較多時間且枯燥,如果僅僅是做實驗可以用用現成的語料。當然,還有一個辦法,找個一個比較成熟的演算法作為基準,用該演算法的結果作為樣本來進行比照,這個方法也有點問題,如果有現成的很好的演算法,就不用再研究了。

AP和mAP(mean Average Precision)

mAP是為解決P,R,F-measure的單點值侷限性的。為了得到 一個能夠反映全域性效能的指標,可以看考察下圖,其中兩條曲線(方塊點與圓點)分佈對應了兩個檢索系統的準確率-召回率曲線

 

可以看出,雖然兩個系統的效能曲線有所交疊但是以圓點標示的系統的效能在絕大多數情況下要遠好於用方塊標示的系統。

從中我們可以 發現一點,如果一個系統的效能較好,其曲線應當儘可能的向上突出。

更加具體的,曲線與座標軸之間的面積應當越大。

最理想的系統, 其包含的面積應當是1,而所有系統的包含的面積都應當大於0。這就是用以評價資訊檢索系統的最常用效能指標,平均準確率mAP其規範的定義如下:(其中P,R分別為準確率與召回率)


ROC和AUC

ROC和AUC是評價分類器的指標,上面第一個圖的ABCD仍然使用,只是需要稍微變換。


回到ROC上來,ROC的全名叫做Receiver Operating Characteristic。

ROC關注兩個指標

   True Positive Rate ( TPR )  = TP / [ TP + FN] ,TPR代表能將正例分對的概率

   False Positive Rate( FPR ) = FP / [ FP + TN] ,FPR代表將負例錯分為正例的概率

在ROC 空間中,每個點的橫座標是FPR,縱座標是TPR,這也就描繪了分類器在TP(真正的正例)和FP(錯誤的正例)間的trade-off。ROC的主要分析工具是一個畫在ROC空間的曲線——ROC curve。我們知道,對於二值分類問題,例項的值往往是連續值,我們通過設定一個閾值,將例項分類到正類或者負類(比如大於閾值劃分為正類)。因此我們可以變化閾值,根據不同的閾值進行分類,根據分類結果計算得到ROC空間中相應的點,連線這些點就形成ROC curve。ROC curve經過(0,0)(1,1),實際上(0, 0)和(1, 1)連線形成的ROC curve實際上代表的是一個隨機分類器。一般情況下,這個曲線都應該處於(0, 0)和(1, 1)連線的上方。如圖所示。


用ROC curve來表示分類器的performance很直觀好用。可是,人們總是希望能有一個數值來標誌分類器的好壞。

於是Area Under roc Curve(AUC)就出現了。顧名思義,AUC的值就是處於ROC curve下方的那部分面積的大小。通常,AUC的值介於0.5到1.0之間,較大的AUC代表了較好的Performance。

AUC計算工具:

P/R和ROC是兩個不同的評價指標和計算方式,一般情況下,檢索用前者,分類、識別等用後者。


參考連結:

http://blog.csdn.net/wh62592855/article/details/7250980

相關推薦

資訊檢索IR評價指標介紹

在資訊檢索、分類體系中,有一系列的指標,搞清楚這些指標對於評價檢索和分類效能非常重要,因此最近根據網友的部落格做了一個彙總。 準確率、召回率、F1 資訊檢索、分類、識別、翻譯等領域兩個最基本指標是召回率(Recall Rate)和準確率(Precision Rate

資訊檢索中常用的評價指標:MAP,nDCG,ERR,F-measure

知識點文字檢索常用的評價指標:MAP、nDCG、ERR、F-score/F-measure以及附加的Precision、Recall、AveP、CG、DCG、IDCG、MRR、cascade models 而ROC曲線及其度量指標AUC主要用於分類和識別 一

推薦系統排序Rank評價指標總結

1.Mean Average Precision (MAP) AP=∑nij=1P(j).yi,j∑nij=1yi,j 其中, yi,j:排序中第j個元素對於查詢i是否是相關的;相關為1,不相關為0。 P(j)=∑k:πi(k)≤πi(j)y(i

斯坦福大學-自然語言處理入門 筆記 第十七課 資訊檢索information retrieval

一、介紹 資訊檢索(information retrieval)是從海量集合體(一般是儲存在計算機中的文字)中找到滿足資訊需求(information need)的材料(一般是文件) 資訊檢索的應用領域:網頁搜尋,郵件搜尋,電腦內部搜尋,法律資訊檢索等等 資訊檢索的基

基於solr實現商品資訊的全文檢索windwons

搭建環境 windows下tomcat+solr   相關軟體準備 1.安裝JDK 2.下載tomcat 3.下載solr-4.10.3.tgz.tgz 4.下載IK分詞器(IKAnalyzer2012FF_hf1.rar)   安裝步驟

ROC曲線的AUC以及其他評價指標的簡介知識整理

相關評價指標在這片文章裡有很好介紹 ROC曲線:接收者操作特徵(receiveroperating characteristic) 比較分類模型的可視工具,曲線上各點反映著對同一訊號刺激的感受性。 縱軸:真正率(擊中率)true positive rate ,TPR,

C++智慧指標智慧指標的簡單介紹

C++智慧指標 在正式瞭解智慧指標前先看一下下面的一段程式碼 #include<iostream> using namespace std; class A { public: A() :_ptr(NULL), _a(

Apache Shiro 使用手冊Shiro架構介紹

springmvc+mybatis dubbo+zookeeper restful redis分布式緩存 shiro kafka 一、什麽是Shiro Apache Shiro是一個強大易用的Java安全框架,提供了認證、授權、加密和會話管理等功能: 認證 - 用戶身份識別,常被稱為用戶“

luence全文檢索簡介

through 提取關鍵字 dna 環境 director 中國 ade equals 關鍵字查詢 剛開始做全文檢索也是找了很多資料但是網上的都不是很齊全luence是個很不多的工具 Lucene4.0的官網文檔:http://lucene.apache.org/core/

[轉]JMeter學習工具簡單介紹

正在 包含 定義 寫入文件 線程組 element 層級 工作臺 roc 一、JMeter 介紹 Apache JMeter是100%純JAVA桌面應用程序,被設計為用於測試客戶端/服務端結構的軟件(例如web應用程序)。它可以用來測試靜態和動態資源的性能,例如:

elasticsearch--聚合中桶Buckets指標Metrics的概念

就會 只有一個 img max() earch 執行 都是 access buck 寫在前面的話:讀書破萬卷,編碼如有神--------------------------------------------------------------------主要內容包括:

負載均衡系列之負載均衡介紹

擴展 貴的 程序 das 等待 計算機集群 通過 因此 高速 負載均衡即是將負載分攤到不同的服務單元,既保證服務的可用性,又保證響應足夠快,給用戶很好的體驗. 集群的分類 負載均衡集群(Load Balancing clusters),簡稱LBC或LB高可用性集群(Hi

《selenium2 python 自動化測試實戰》20——Selenium工具介紹

命令 aic 插件 rhui 所有 key 框架 地址欄 uga (一)Selenium IDE Firefox的一個插件,有助於我們理解測試框架。在附加組件裏搜索下載,一般搜的結果裏前幾個都不是,得點那個查看更多才行,找到這個: 安裝以後瀏覽器工具欄會有

Appium+python1簡單的介紹環境搭建

uil aid abc 同事 type img div 新手 tmp 環境搭建其實並不難,只不過安裝的東西有點多,要加的環境變量有點多。 鏈接:https://pan.baidu.com/s/1nwLhNIT 密碼:56wn 這個壓縮包裏要用的都有了,只需

Office 365 SharePoint 遷移淺談 SMAT 2013 介紹

O365 Office 365 SharePoint 遷移 進入主題,首先來談下微軟用來做SharePoint 遷移評估的工具,SMAT SMAT全稱是SharePoint Migration Assessment Tool,顧名思義就是用來做遷移評估的,目前SharePoint

Fiddler的介紹和安裝

chm 瀏覽器中 tool nec clas 技術分享 strong HR str 一、Fiddler的介紹和安裝 Fildder是一款免費的web調試代理工具,支持任何瀏覽器、系統或平臺。 官網地址:https://www.telerik.com/fiddler Fidd

Robot Framework 介紹

檢測 OS lan tor 語句 ide 簡單 undle 基本 (一)Robot Framework 介紹 發布時間 2017年9月28日 蟲師 Robot Framework 官方網站:http://robotframework.org/ 介紹 Robot Fram

並發基礎 線程介紹

java 並發 一、線程的簡介 線程,有時被稱為輕量級進程(Lightweight Process,LWP),是程序執行流的最小單元。一個標準的線程由線程ID,當前指令指針(有一個程序計數器,它的作用是存放下一條指令所在單元的地址的地方),寄存器集合(寄存器是中央處理器內的組成部分。寄存器是有限存貯容

Python學習之路2——Python種類介紹

VM 種類 廣泛 分享 java字節碼 流程 字節碼 基礎上 python Python的種類 Cpython Python的官方版本,使用C語言實現,使用最為廣泛,CPython實現會將源文件(py文件)轉換成字節碼文件(pyc文件),然後運行在Python虛擬

LayIM.AspNetCore Middleware 開發日記預備知識介紹

Locator route ppk 我只 netcore blank req rop read 前言   開發一個AspNetCore的中間件需要理解RequestDelegate。另外,還需要理解.NET Core中的依賴註入。還有一個就是內嵌資源的訪問。例如:Embed