1. 程式人生 > >我對於準確率---p值,召回率R值以及F值的理解

我對於準確率---p值,召回率R值以及F值的理解

再網際網路廣告的推薦系統和反作弊的實踐中經常遇到準確率,召回率,F值幾個東西,剛入行的時候,我經常搞混,直到後來我逐漸明白了。舉個列子!我們用一個模型去判斷一段時間的作弊流量,假設該段時間的流量是100個,作弊的是25個,沒有作弊的是75個,假設這裡正樣本為沒有作弊的流量。然後我們用lstm模型去預測,結果是70個沒有作弊的,但是經檢查,我們把其中69個正樣本預測為沒有作弊,把1個負樣本預測為沒有作弊那麼再我這個列子裡面p=69/70(被預測為正樣本且真的是正樣本的數量/被預測為正樣本的數量)那麼R=69/75(樣本中的正例有多少個被預測正確了)F值

可能很多人就會問了,有了召回率和準去率這倆個評價指標後,不就非常好了,為什麼要有F值這個評價量的存在呢?

按照高中政治老師所說的,存在即合理的說法,既然F值存在了,那麼一定有它存在的必要性,哈哈哈哈!

我們在評價的時候,當然是希望檢索結果Precision越高越好,同時Recall也越高越好,但事實上這兩者在某些情況下有矛盾的。

比如在我這個例子裡就是這樣,為此為了對模型的效果做一個綜合的評價,所以才有了F值F=(2*P*R)/P+R其實這個公式我是記不住的,更多的時候你只需要會看調參頁面就行了。