1. 程式人生 > >召回率與準確率(Precision and Recall)

召回率與準確率(Precision and Recall)

  A    B
未檢索到   C    D

A:檢索到的,相關的 (搜到的也想要的)
B:檢索到的,但是不相關的 (搜到的但沒用的)
C:未檢索到的,但卻是相關的 (沒搜到,然而實際上想要的)
D:未檢索到的,也不相關的 (沒搜到也沒用的)

通常我們希望:資料庫中相關的文件,被檢索到的越多越好,這是追求“查全率”,即A/(A+C),越大越好。
同時我們還希望:檢索到的文件中,相關的越多越好,不相關的越少越好,這是追求“準確率”,即A/(A+B),越大越好。

歸納如下:
召回率:檢索到的相關文件 比 庫中所有的相關文件
準確率:檢索到的相關文件 比 所有被檢索到的文件

“召回率”與“準確率”雖然沒有必然的關係(從上面公式中可以看到),然而在大規模資料集合中,這兩個指標卻是相互制約的。
由於“檢索策略”並不完美,希望更多相關的文件被檢索到時,放寬“檢索策略”時,往往也會伴隨出現一些不相關的結果,從而使準確率受到影響。
而希望去除檢索結果中的不相關文件時,務必要將“檢索策略”定的更加嚴格,這樣也會使有一些相關的文件不再能被檢索到,從而使召回率受到影響。

凡是設計到大規模資料集合的檢索和選取,都涉及到“召回率”和“準確率”這兩個指標。而由於兩個指標相互制約,我們通常也會根據需要為“檢索策略”選擇一個合適的度,不能太嚴格也不能太鬆,尋求在召回率和準確率中間的一個平衡點。這個平衡點由具體需求決定。

其實,準確率(precision,精度)比較好理解。往往難以迅速反應的是“召回率”。我想這與字面意思也有關係,從“召回”的字面意思不能直接看到其意義。
我覺得“召回率”這個詞翻譯的不夠好。“召回”在中文的意思是:把xx調回來。比如sony電池有問題,廠家召回。
既然說翻譯的不好,我們回頭看“召回率”對應的英文“recall”,recall除了有上面說到的“order sth toreturn”的意思之外,還有“remember”的意思。

Recall:the ability to remember sth. that you have learned or sth.that has happened in the past.

這裡,recall應該是這個意思,這樣就更容易理解“召回率”的意思了。
當我們問檢索系統某一件事的所有細節時(輸入檢索query),Recall就是指:檢索系統能“回憶”起那些事的多少細節,通俗來講就是“回憶的能力”。能回憶起來的細節數除以 系統知道這件事的所有細節,就是“記憶率”,也就是recall——召回率。

這樣想,要容易的多了。

在計算機視覺檢測影象的時候,概念很相似。

相關推薦

召回準確率Precision and Recall

  A    B 未檢索到   C    D A:檢索到的,相關的 (搜到的也想要的) B:檢索到的,但是不相關的 (搜到的但沒用的) C:未檢索到的,但卻是相關的 (沒搜到,然而實際上想要的) D:未檢索到的,也不相關的 (沒搜到也沒用的) 通常我們希望:資料庫中相關的文件,被檢索到的越多越好,這是追求“查

準確率召回以及F1模型評估方法

召回率和準確率是資料探勘中預測、網際網路中的搜尋引擎等經常涉及的兩個概念和指標。 召回率:Recall,又稱“查全率”——還是查全率好記,也更能體現其實質意義。 準確率:Precision,又稱“精度”、“正確率”。 以檢索為例,可以把搜尋情況用下圖表示: 相關

推薦系統中的召回準確率

精確率是針對我們預測結果而言的,它表示的是預測為正的樣本中有多少是真正的正樣本,例如我們給使用者推薦了100條新聞,其中10條使用者產生了點選,那麼準確率為10/100 = 0.1而召回率是針對我們原來的樣本而言的,它表示的是樣本中的正例有多少被預測正確了, 例如我們給使用者推薦了100條新聞,其中10條使用

javaleetcode771 寶石石頭Jewels and Stones

題目描述: 給定字串J 代表石頭中寶石的型別,和字串 S代表你擁有的石頭。 S 中每個字元代表了一種你擁有的石頭的型別,你想知道你擁有的石頭中有多少是寶石。 J 中的字母不重複,J 和 S中的所有字元都是字母。字母區分

佇列Stack and Queue

1.定義      棧:後進先出(LIFO-last in first out):最後插入的元素最先出來。   佇列:先進先出(FIFO-first in first out):最先插入的元素最先出來。 2.用陣列實現棧和佇列 實現棧:   由於陣列大小未知,如果每次插入元素都擴充套件一次資料(每

leetcode771 寶石石頭Jewels and Stones

題目描述: 給定字串J 代表石頭中寶石的型別,和字串 S代表你擁有的石頭。 S 中每個字元代表了一種你擁有的石頭的型別,你想知道你擁有的石頭中有多少是寶石。 J 中的字母不重複,J 和 S中的所有字

【leetcode刷題】[簡單]771寶石石頭jewels and stones-java

寶石與石頭 jewels and stones題目分析解答 題目 給定字串J 代表石頭中寶石的型別,和字串 S代表你擁有的石頭。 S 中每個字元代表了一種你擁有的石頭的型別,你想知道你擁有的石頭中有多少是寶石。 J 中的字母不重複,J 和 S中的所有字元都是字母

C#LeetCode刷題之#771-寶石石頭Jewels and Stones

問題 給定字串J 代表石頭中寶石的型別,和字串 S代表你擁有的石頭。 S 中每個字元代表了一種你擁有的石頭的型別,你想知道你擁有的石頭中有多少是寶石。 J 中的字母不重複,J 和 S中的所有字元都是字母。字母區分大小寫,因此"a"和"A"是不同型別的石頭。 輸入: J

Android 風格主題style and theme

1、什麼是Style,什麼是Theme?         Style 和 theme:是一個包含一種 或者 多種格式化 屬性 的集合  ,並且 style和theme都是資源,存放在res/values 資料夾下 即可,android提供了很多這樣的預設資源。你可以來使用它們。同時你也可以自己定義style

斯坦福大學公開課機器學習:machine learning system design | trading off precision and recallF score公式的提出:學習算法中如何平衡取舍查準率和召回的數值

ron 需要 color 不可 關系 machine 同時 機器學習 pos 一般來說,召回率和查準率的關系如下:1、如果需要很高的置信度的話,查準率會很高,相應的召回率很低;2、如果需要避免假陰性的話,召回率會很高,查準率會很低。下圖右邊顯示的是召回率和查準率在一個學習算

準確率Precision召回Recall以及綜合評價指標F1-Measure

在資訊檢索和自然語言處理中經常會使用這些引數,下面簡單介紹如下: 準確率與召回率(Precision & Recall) 我們先看下面這張圖來加深對概念的理解,然後再具體分析。其中,用P代表Precision,R代表Recall 一般來說,Pre

機器學習:準確率Precision召回Recall、F值F-Measure、ROC曲線、PR曲線

介紹: 準確率(Precision)、召回率(Recall)、F值(F-Measure)是資料探勘、機器學習 和推薦系統中的評測指標。 下圖是不同機器學習演算法的評價指標: 本文的物件是二元分類器! 在 介紹評價指標必須瞭解“混淆矩陣” 混淆矩陣 True Posi

精確準確率、查準率、precision召回查全率、recall、RoC曲線、AUC面積、PR曲線

  精確率(Precision)的定義如下:     P=TPTP+FP     召回率(Recall)的定義如下:     R=TPTP+FN     特異性(specificity)的定義如下:     S=FPFP+TN     有時也用一個F1值來綜合評估精確率和召回率,它是精確率和召回

準確率Precision查準率召回Recall查全率和F-Meansure、mAP

某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下: 正確率 = 700 / (700 + 200 + 100) = 70% 召回率 = 700 / 1400 = 50% F值 = 70% * 50% * 2 /

二分類相關評估指標召回準確率,精確,F度量,AUC和ROC

  基礎定義   通常在機器學習的二分類領域中,對模型的結果評估是必不可少的,本文主要總結了各個評估指標,對每個指標的定義,作用進行闡述。廢話到此,直接上乾貨。 TP:True Positive   FP:False Positive TN:Tr

CS229 7.2 應用機器學習方法的技巧,準確率召回 F值

建立模型 當使用機器學習的方法來解決問題時,比如垃圾郵件分類等,一般的步驟是這樣的: 1)從一個簡單的演算法入手這樣可以很快的實現這個演算法,並且可以在交叉驗證集上進行測試; 2)畫學習曲線以決定是否更多的資料,更多的特徵或者其他方式會有所幫助; 3)人工檢查那些演算法預測錯誤的例子(在交叉驗證集上)

R語言︱分類器的效能表現評價混淆矩陣,準確率召回,F1,mAP、ROC曲線

筆者寄語:分類器演算法最後都會有一個預測精度,而預測精度都會寫一個混淆矩陣,所有的訓練資料都會落入這個矩陣中,而對角線上的數字代表了預測正確的數目,即True Positive+True Nagetive。——————————————————————————相關內容:————

NLP任務中的基本指標(precision and recall )

.cn core 參考 樣本 cal true 分享 9.png 技術 》》以下內容參考wikipedia。 precision 精確度 recall 召回率 樣本數據可看成如下兩組: false negative 偽負例 true neg

召回精確

兔子 clas 3.3 奇怪 其中 識別 信息 深度 class 《白話機器學習》這本書寫的不是特別好,但是解釋召回率和精確率這部分還是很好的。 200 張貓的圖片中,有 180 張可以正確識別為貓,而有 20 張誤判為狗 。 200 張狗的圖片可以全部正確判斷為狗 。 6

STL之劃分排序演算法Partions and Sorting

目錄           STL之劃分與排序演算法(Partions and Sorting) 劃分演算法 一、is_partitoned 二、partition 三、partition_copy(beg,