sklearn之模型評估指標總結歸納

阿新 • • 發佈：2018-11-19

文章目錄

機器學習模型評估

分類模型
迴歸模型
聚類模型
交叉驗證中指定scoring引數
網格搜尋中應用

機器學習模型評估

以下方法，sklearn中都在sklearn.metrics類下，務必記住哪些指標適合分類，那些適合迴歸，不能混著用
分類的模型大多是Classifier結尾，迴歸是Regression

分類模型

accuracy_score（準確率得分）是模型分類正確的資料除以樣本總數 【模型的score方法算的也是準確率】

accuracy_score(y_test,y_pre)
# 或者 model.score(x_test,y_test)，大多模型都是有score方法的

classification_report中的各項得分的avg/total 是每一分類佔總數的比例加權算出來的

print(classification_report(y_test,y_log_pre))

             precision    recall  f1-score   support

          0       0.87      0.94      0.90       105
          1       0.91      0.79      0.85        73

avg / total       0.88      0.88      0.88       178

confusion_matrix（混淆矩陣），用來評估分類的準確性

有的分類問題，實際樣本中1000個A，10個B，如果最後分類大多數B都被預測錯誤了，但依據其他評估方法，得分反而很高(因為A的數目相對太多導致的)

>>> from sklearn.metrics import confusion_matrix
>>> y_true = [2, 0, 2, 2, 0, 1]
>>> y_pred = [0, 0, 2, 2, 0, 2]
>>> confusion_matrix(y_true, y_pred)
array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])

precision_score(精確度)、recall_score(召回率)、f1_score（後者由前兩個推匯出的）

這三個不僅適合二分類，也適合多分類。只需要指出引數average=‘micro’/‘macro’/'weighted’

macro：計算二分類metrics的均值，為每個類給出相同權重的分值。當小類很重要時會出問題，因為該macro-averging方法是對效能的平均。另一方面，該方法假設所有分類都是一樣重要的，因此macro-averaging方法會對小類的效能影響很大

micro：給出了每個樣本類以及它對整個metrics的貢獻的pair（sample-weight），而非對整個類的metrics求和，它會每個類的metrics上的權重及因子進行求和，來計算整個份額。Micro-averaging方法在多標籤（multilabel）問題中設定，包含多分類，此時，大類將被忽略

weighted: 對於不均衡數量的類來說，計算二分類metrics的平均，通過在每個類的score上進行加權實現

roc_curve（ROC曲線，用於二分類）點選檢視

迴歸模型

常見的損失MAE、MSE、R^2

mean_absolute_error（MAE、平均絕對誤差）
mean_squared_error（MSE、均方誤差）

>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_squared_error(y_true, y_pred)  
0.7083

r2_score（R^2、可決係數）

>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> r2_score(y_true, y_pred)  
0.948

聚類模型

這一塊沒有過多涉及，建議看文件聚類效能度量

交叉驗證中指定scoring引數

交叉驗證cross_val_score的scoring引數
- 分類：accuracy(準確率)、f1、f1_micro、f1_macro（這兩個用於多分類的f1_score）、precision(精確度)、recall(召回率)、roc_auc
- 迴歸：neg_mean_squared_error（MSE、均方誤差）、r2
- 聚類：adjusted_rand_score、completeness_score等【這一塊我沒怎麼用過】

from sklearn.model_selection import cross_val_score

scores = cross_val_score(dtc,X,Y,cv=5,scoring='f1')
scores.mean()

網格搜尋中應用

下次寫吧。。。

sklearn之模型評估指標總結歸納

文章目錄機器學習模型評估分類模型迴歸模型聚類模型交叉驗證中指定scoring引數網格搜尋中應用機器學習模型評估以下方法，sklearn中都在

Sklearn之模型評估

假如我們有一個帶標籤的資料集D，我們如何選擇最優的模型？衡量模型好壞的標準是看這個模型在新的資料集上面表現的如何，也就是看它的泛化誤差。因為實際的資料沒有標籤，所以泛化誤差是不可能直接得到的。於是我們需要在資料集D上面劃分出來一小部分資料測試D的效能，用它來近似代替泛化誤差。留出法

【深度學習】常用的模型評估指標

是我初學者 cnblogs 沒有線下均衡顯示總數效果 “沒有測量，就沒有科學。”這是科學家門捷列夫的名言。在計算機科學中，特別是在機器學習的領域，對模型的測量和評估同樣至關重要。只有選擇與問題相匹配的評估方法，我們才能夠快速的發現在模型選擇和訓練過程中可能出現的

模型的性能評估(二) 用sklearn進行模型評估

ant body 指定 cross 學習 median 技術分享依賴是把在sklearn當中，可以在三個地方進行模型的評估 1：各個模型的均有提供的score方法來進行評估。這種方法對於每一種學習器來說都是根據學習器本身的特點定制的，不可改變，這種方法比較簡單。這

目標檢測模型評估指標——mAP計算的討論

對於使用機器學習解決的大多數常見問題，通常有多種可用的模型。每個模型都有自己的獨特之處，並隨因素變化而表現不同。每個模型在“驗證/測試”資料集上來評估效能，效能衡量使用各種統計量如準確度（accuracy），精度（precision），召回率（recall）等。選擇的統計量通常針對特定應用場景

機器學習常見模型評估指標

1.單值評估指標在機器學習或深度學習中，為了評估最終模型的好壞，我們經常會引入各種評估指標，為了便於指標的說明，我們這裡具一個例子作為說明。假設我們想要建立一個垃圾郵件的分類模型，此時，模型預測結果的混淆矩陣如下表所示：此時，我們常用的評估指標就有如下：

機器學習實踐（十六）—sklearn之模型儲存和載入

一、sklearn - 模型的儲存和載入 - API from sklearn.externals import joblib 儲存 joblib.dump(rf, ‘test.pkl’) 載入 estimator

機器學習之模型評估與引數調優

一、流水線工作流在利用訓練資料對模型進行擬合時已經得到一些引數，使用流水線可以避免在將模型用於新資料時重新設定這些引數。利用sklearn中的Pipline類，使得我們可以擬合出包含任意多個處理步驟的模型，並將模型用於新資料的預測。 1. # Title

深度學習模型評估指標（http://scikit-learn.org/stable/）

在機器學習中，對模型的測量和評估同樣至關重要。只有選擇與問題相匹配的評估方法，我們才能夠快速的發現在模型選擇和訓練過程中可能出現的問題，迭代地對模型進行優化。常見的模型評估指標： precision recall F1-score PRC ROC/AUC

AI工程師成長之路--機器學習之模型評估與選擇

開篇簡介：本文是博主結合前輩經驗和自身的認識寫的博文，有不少博主自身理解還不太透徹，因為考慮到文章的完整性，有些部分需要引用的前輩的一些方法，望諒解。由於文章專業化內容過多，會影響閱讀體驗，在這裡建議大家難以理解的部分先不要去深究，等待需要用到的時候再去深入研究一下。本博

快速理解分類模型評估指標

一、從混淆矩陣說起我們以二分類模型來舉例，假設我們要預測使用者在借款之後是否會逾期。對於我們的預測來說，有逾期/不逾期兩種結果。對於真實情況，同樣有逾期/不逾期兩種結果。我們以逾期為正例，以不逾期為反例，將預測結果與真實結果進行列聯交叉，就生成了混淆矩陣

機器學習之模型評估（還是沒搞定...）

任務介紹 1.任務：預測貸款使用者是否會逾期 2.status是標籤：0表示未逾期，1表示逾期【任務四：模型評估】記錄五個模型關於precision，rescore，f1，auc，roc的評分表格，畫出auc和roc曲線圖。模型 Precesion

機器學習：圖文詳解模型評估指標ROC/AUC

模型訓練好，必須要通過各種指標去衡量模型的好壞，也就是模型的泛化能力。模型的評估指標有很多，筆者在剛開始學習的時候，也是搞得焦頭爛額，有時候自己理解了，但又很難跟別人解釋清楚，所以寫下這邊文章。本文主要介紹分類的模型的各種評估指標以及ROC和AUC。 1.混淆矩陣對於二分類的模型，

Person Re-ID相關知識點、資料集及評估指標總結

0. 背景人臉識別技術目前已發展的較為成熟，在很多場景與產品中都已有落地的應用，但人臉識別技術只能用到人體的人臉資訊，而人體的其他重要資訊得不到充分的利用，例如：衣著、姿態、行為等。另外在應用時必須要有清晰的人臉正面照片，但在很多場景下無法滿足要求，例如低頭、背影、模糊身形、帽子遮

二分類模型評估指標的計算方法與程式碼實現

一、定義在研究評估指標之前，先給出分類結果混淆矩陣（confusion matrix）。預測真實正例反例正例 TP FN 反例 FP TN 1.準確率--accuracy 定義：對於給定的測試資料集，分類器正確分類的樣本數與總樣

【推薦系統】評估指標總結

準確率指標: 該型別的指標大部分是推薦演算法優化的目標，衡量著推薦演算法的優劣。準確率。推薦給使用者的商品中，屬於測試集的比例，數學公式$P(L_{u})=\frac{L_{u}\bigcap B_{u}}{L_{u}}$ 。整個測試集的準確率為 $P_{L}=\frac{1}{n}\sum_{u\

模型評估指標AUC（area under the curve）

AUC在機器學習領域中是一種模型評估指標。根據維基百科的定義，AUC(area under the curve)是ROC曲線下的面積。所以，在理解AUC之前，要先了解ROC是什麼。而ROC的計算又需要藉助混淆矩陣，因此，我們先從混淆矩陣開始談起。混淆矩陣

絕對不容錯過：最完整的檢測模型評估指標mAP計算指南(附程式碼)在這裡！

作者: 葉虎編輯: 趙一帆前言本文翻譯自Measuring Obje

迴歸模型-評估指標

一、多元線性迴歸多元線性迴歸示例： y=b+a1∗x1+a2∗x2+⋅⋅⋅+an∗xny=b+a1∗x1+a2∗x2+···+an∗xn 房價預測案例：多重共線性（Mul

機器學習-2：MachineLN之模型評估

你要的答案或許都在這裡：小鵬的部落格目錄開篇廢話：很多文章其實都是將書中的東西、網上課程、或者別人的論文的東西總結一下，發出來，但是個人感覺還是加入個人的理解，然後加上一些工程中遇到的

sklearn之模型評估指標總結歸納

文章目錄

機器學習模型評估

分類模型

迴歸模型

聚類模型

交叉驗證中指定scoring引數

網格搜尋中應用

相關推薦