AUC兩種計算方式

阿新 • • 發佈：2021-09-04

1.通過ROC曲線面積計算AUC

AUC（Area Under Curve）被定義為ROC曲線下的面積。

ROC 曲線橫座標：假正率=FPR=FP/N：預測為負 and 實際為正 / 實際為負

ROC 曲線縱座標：真正率=TPR= TP/P ：預測為正 and 實際為正 / 實際為正

注意:有相同預估值時，需要等當前預估值作為閾值的所有 tp,fp 算完，再更新最終 auc

def calcAUC_byRocArea(label,pred):
    P = 0.0
    N = 0.0
    TP = 0.0
    FP = 0.0
    TPR = 0.0
    FPR = 0.0
    LAST_TRP = 0.0
    LAST_FPR = 0.0
    auc = 0.0
    for l in label:
        if l == 0:
            N+=1
        else:
            P+=1
    sample = zip(label,pred)
    sample_sorted = sorted(sample,key=lambda x: -x[1])


    for i,info in enumerate(sample_sorted):
        l,p = info
        if l == 1:
            TP+=1
        else:
            FP+=1
     
        if i !=0 and  i+1 < len(sample) and p == sample_sorted[i+1][1]:
            continue
        
        TPR = TP/P
        FPR = FP/N
        auc+=0.5*(TPR+LAST_TRP)*(FPR-LAST_FPR)
        LAST_FPR=FPR
        LAST_TRP=TPR

    return auc

2.通過計算概率計算AUC

AUC還有一種解釋就是任取一對正負樣本，正樣本的預測值大於負樣本的預測值的概率。

2.1 暴力時間複雜度 o(n2)

（1）遍歷 label, 選出正樣本、負樣本。

（2）遍歷正負樣本 pair，記錄正樣本 pred> 負樣本 pred 的個數為 cnt

（3） auc = cnt / 正樣本個數* 負樣本個數。

 1 from sklearn.metrics import roc_auc_score
 2 import numpy as np
 3 
 4 def calcAUC_byProb(label,pred):
 5     pos_porb = []
 
 6     neg_prob = []
 7     for i in range(len(label)):
 8         if label[i] == 1:
 9             pos_porb.append(pred[i])
10         elif label[i] == 0:
11             neg_prob.append(pred[i])
12     cnt = 0.0
13     for p in pos_porb:
14         for n in neg_prob:
15             if (p>n):
16                 cnt+=1
17 
             elif(p == n):
18                 cnt+=0.5
19     return cnt / float(len(pos_porb)*len(neg_prob))
20 
21 y = np.array([1, 1, 1, 0,0])
22 pred = np.array([0.6,0.3, 0.5 ,0.2,0.4])
23 print("sklearn auc:",roc_auc_score(y, pred))
24 #print("my auc calc by area:", calcAUC_byRocArea(y, pred))
25 print("my auc calc by prob:", calcAUC_byProb(y, pred))

2.2 動態規劃，時間複雜度0（nlogn)

（1）按照預估值降序，組成 pair。

（2)遍歷pair, 如果 label==1，記錄正樣本個數 pos,

如果 label==0，對於當前樣本來說，前面所有的正樣本個數pos就是當前樣本與所有正樣本預估值大於當前負樣本預估值的個數。

（3）auc = pos / (pos *n-pos)

 1 def calcAUC_byProb(label,pred):
 2     sample = zip(label,pred)
 3     sample_sorted = sorted(sample,key=lambda x: -x[1])
 4     pos = 0
 5     cnt = 0
 6     last_pred = 0
 7     print(sample_sorted)
 8     for i in range(len(sample_sorted)):
 9         l,p = sample_sorted[i]
10         if l == 1:
11             pos+=1
12         elif l == 0:
13             cnt += pos
14             if (i!=0 and last_pred ==p):
15                 cnt-=0.5
16         last_pred = p
17     negs = len(label) - pos
18     print (cnt,pos,negs)
19     return float(cnt) / float(pos*negs)

AUC兩種計算方式

1.通過ROC曲線面積計算AUC AUC（Area Under Curve）被定義為ROC曲線下的面積。 ROC 曲線橫座標：假正率=FPR=FP/N：預測為負 and 實際為正 / 實際為負

mysql查詢欄位型別為json時的兩種查詢方式

表結構如下： idvarchar(32) infojson 資料： id = 1 info = {\"age\": \"18\",\"disname\":\"小明\"}

python使用mysql的兩種使用方式

Python操作MySQL主要使用兩種方式：原生模組 pymsql ORM框架 SQLAchemy pymql pymsql是Python中操作MySQL的模組,在windows中的安裝：

python列印異常資訊的兩種實現方式

1. 直接列印錯誤 try: # your code except KeyboardInterrupt: print(\"quit\") except Exception as ex:

python物件轉字典的兩種實現方式示例

本文例項講述了python物件轉字典的兩種實現方式。分享給大家供大家參考，具體如下：

Pycharm啟用碼啟用兩種快速方式（附最新啟用碼和外掛）

小張的Pycharm最近彈出提示框 Your license has expired提示過期....納尼！！！！是不是看到這個也很頭疼,。於是我就在想有沒有一種方式可以讓他永久免費的,於是小張從網上進行搜尋,還真發現了幾乎免費永久啟用的方

Android Studio自動排版的兩種實現方式

Android Studio這樣的整合開發環境雖然程式碼自動化程度很高，但是自動化程度高導致人的自主性就下降了，而且總是依賴編輯器的功能也會搞得程式碼排版很彆扭。

詳解Nuxt內導航欄的兩種實現方式

方式一 | 通過巢狀路由實現在pages頁面根據nuxt的路由規則，建立頁面 1. 建立檔案目錄及檔案

Vue中keep-alive的兩種應用方式

Vue中keep-alive的使用我總結的有兩種方式應用：首先簡述一下keep-alive的作用，kee-alive可以快取不活動的的元件。當元件之間進行相互切換的時候，預設會銷燬，當重新切換回來時又重新初始化。現在有需求切換回來

JS倒計時兩種實現方式程式碼例項

最近做瀏覽器介面倒計時，用js就實現，兩種方式：一：設定時長，進行倒計時。比如考試時間等等

SpringBoot註冊Filter的兩種實現方式

springboot版本：2.2.5 一、filter註冊 springboot中新增filter有兩種方式： 1、實現方法一

Hystrix兩種隔離方式對比

在微服務架構中，我們不可避免的與Hystrix打交道，最近在面試過程中，也總是被問到Hystrix兩種熔斷方式的區別，今天，就給大家做個小結。

【轉】Ajax 兩種請求方式的區別onload和onreadystatechange

一. onreadystatechange 1. XMLHttpRequest物件有一個屬性readyState，將其(xhr.readyState)列印後發現。進入onreadystatechange請求方式中時，可以列印其狀態為2，狀態為3，狀態為4。

Spring宣告式事務的兩種配置方式（註解/xml）

application配置tx:annotation-driven 配置宣告式事務tx:TransactionManager 宣告式事務需要資料來源所以需要配置DataSource

詳解springboot專案帶Tomcat和不帶Tomcat的兩種打包方式

1，帶Tomcat的打包方式 1.1，在pom.xml檔案新增以下配置（目的：自定main入口和跳過Junit程式碼）

資料結構(六)-棧(陣列和連結串列兩種模擬方式)

一、棧的介紹棧的英文是stack。棧是一個先入後出(first in last out)的有序列表棧(stack)是限制線性表中元素的插入和刪除只能在線性表的同一端進行操作的特殊線性表，允許插入和刪除的一端，稱為棧頂(top)，另一

Spring框架接入單機Redis兩種實現方式解析

1、Redis的簡單介紹 1）Redis 是一個開源（BSD許可）的，記憶體中的資料結構儲存系統，它可以用作資料庫、快取和訊息中介軟體。它支援多種型別的資料結構，如字串（strings），雜湊（hashes），列表（lists），

redis中RDB和AOF兩種持久化方式的比較

1、RDB持久化機制就是我們俗稱的備份，他可以在定期內對資料進行備份，將Redis伺服器中的資料持久化到硬碟中；

#MyBatis多表查詢 #多對一、一對多的兩種實現方式 @FDDLC

方式一(常用)：我們知道，一個使用者可以對應多個賬戶，一個賬戶只能對應一個使用者，即賬戶和使用者之間存在多對一的關係。為了表示這種關係，在賬戶類中額外增加一個使用者類的成員：

Get和Post兩種請求方式的區別

GET在瀏覽器回退時是無害的，而POST會再次提交請求。GET產生的URL地址可以被Bookmark，而POST不可以。GET請求會被瀏覽器主動cache，而POST不會，除非手動設定GET請求只能進行url編碼，而POST支援多種編碼方

AUC兩種計算方式

1.通過ROC曲線面積計算AUC

2.通過計算概率計算AUC

相關推薦