scikit基礎與機器學習入門（10）模型的評估

阿新 • • 發佈：2021-09-19

除了使用estimator的score函式簡單粗略地評估模型的質量之外，在sklearn.metrics模組針對不同的問題型別提供了各種評估指標並且可以建立使用者自定義的評估指標

metrics評估指標概述

sklearn.metrics中的評估指標有兩類：以_score結尾的為某種得分，越大越好，以_error或_loss結尾的為某種偏差，越小越好。

常用的分類評估指標包括：accuracy_score,f1_score, precision_score,recall_score等。

常用的迴歸評估指標包括：r2_score,explained_variance_score等等。

常用的聚類評估指標包括：adjusted_rand_score,adjusted_mutual_info_score等等

程式碼

呼叫方法:metrics.方法名(真實值，預測值)

from sklearn import metrics
y_pred = [0,0,0,1,1,1,1,1]
y_true = [0,1,0,1,1,0,0,1]
print(metrics.confusion_matrix(y_true,y_pred))
print('準確率：',metrics.accuracy_score(y_true,y_pred))
print('類別精度：',metrics.precision_score(y_true,y_pred,average = None)) #不求平均
print('巨集平均精度：',metrics.precision_score(y_true,y_pred,average = 'macro'))
print('微平均召回率:',metrics.recall_score(y_true,y_pred,average = 'micro'))
print('加權平均F1得分:',metrics.f1_score(y_true,y_pred,average = 'weighted'))

利用基於經驗的基本策略作比較

比如有一個分類問題，如果有100個樣本，其中90個正例，10個反例，那麼即使全都預測為正，就能達到90%的正確率，一般的評價指標對於這類問題的評價不敏感，這是可以通過基準來評價模型的優劣性

DummyClassifier 實現了幾種簡單的分類策略:

stratified 通過在訓練集類分佈方面來生成隨機預測.
most_frequent 總是預測訓練集中最常見的標籤.
prior 類似most_frequenct，但具有precit_proba方法
uniform 隨機產生預測.
constant 總是預測使用者提供的常量標籤.

DummyRegressor 實現了四個簡單的經驗法則來進行迴歸:

mean 總是預測訓練目標的平均值.
median 總是預測訓練目標的中位數.
quantile 總是預測使用者提供的訓練目標的 qua

我們設定一個不平衡的資料集，其標籤分佈如下所示

# 比較線性svm分類器和虛擬估計器的得分
from sklearn.dummy import DummyClassifier
from sklearn.svm import SVC
svc = SVC(kernel='linear', C=1).fit(X_train, y_train)
print('linear svc classifier score:',svc.score(X_test, y_test))
dummy = DummyClassifier(strategy='most_frequent',random_state=0)
dummy.fit(X_train, y_train)
print('dummy calssifier score:',dummy.score(X_test, y_test))

此時得到結果

linear svc classifier score: 0.631578947368

dummy calssifier score: 0.578947368421

發現支援向量機的準確率並不高，說明需要改善模型

很喜歡聽到一個老師說的“半年理論”，現在做出的努力，一般要在半年的沉澱之後，才能出結果，所以在遇到瓶頸之時，不妨再努力半年

scikit基礎與機器學習入門（10）模型的評估

除了使用estimator的score函式簡單粗略地評估模型的質量之外，在sklearn.metrics模組針對不同的問題型別提供了各種評估指標並且可以建立使用者自定義的評估指標

scikit基礎與機器學習入門（1）背景介紹

scikit基礎與機器學習入門（1）第一章僅對概念進行大略地描述，具體演算法的具體原理後續再說

scikit基礎與機器學習入門（4） sklearn模組資料集的使用——自帶資料集和自定義資料集

API通用方法型別獲取方式自帶的小資料集 sklearn.datasets.load_ 線上下載的資料集 sklearn.datasets.fetch_

scikit基礎與機器學習入門（3）機器學習任務的一般流程——以鳶尾花分類為例

機器學習任務的一般流程本文以鳶尾花資料集為例，對機器學習人物的一般步驟進行了梳理

scikit基礎與機器學習入門（5）歸一化，標準化和正則化，二值化

歸一化，標準化和正則化，二值化概念和含義資料歸一化：將資料集中某一列數值特徵的值縮放到0-1區間內

scikit基礎與機器學習入門（7）特徵的選擇

選擇特徵有以下兩方面依據：特徵是否發散：如果一個特徵不發散，例如方差接近於0，也就是說樣本在這個特徵上基本上沒有差異，這個特徵對於樣本的區分並沒有什麼用。

scikit基礎與機器學習入門（6）編碼，增加多項式特徵和缺失值處理

分類特徵編碼_獨熱編碼為了解決這個問題，我們可以使用一種叫做\"one-of-K\"或稱做\"one-hot\"（獨熱）的編碼方式。即兩

scikit基礎與機器學習入門（9）Pipeline和FeatureUnion的構建——構築有條理的機器學習系統

Pipeline訓練過程第一級進行資料預處理，第二級完成資料降維，第三級實現分類、迴歸或聚類功能。

scikit基礎與機器學習入門（8） sklearn主要解決的三類問題——分類，迴歸和聚類

其實這篇沒啥內容，就是在熟悉一下程式碼\\((*^_^*)\\) 分類模型的訓練——以決策樹為例

scikit基礎與機器學習入門（11）欠擬合，過擬合和交叉驗證

欠擬合和過擬合的定義在機器學習問題中，經常會出現模型在訓練資料上的得分很高，但是在新的資料上表現很差的情況，這稱之為過擬合overfitting,又叫高方差high variance

scilit基礎和機器學習入門（12）模型的優化

超引數的取值和搜尋超引數是不直接在估計器內學習的引數。在 scikit-learn 包中，它們作為估計器類中建構函式的引數進行傳遞。典型的例子有：用於支援向量分類器的 C 、kernel 和 gamma ，用於Lasso的 alpha等。

Python基礎學習筆記（10）形參名稱空間

Python基礎學習（10）形參名稱空間一、今日內容大綱形參的補充內容名稱空間（名稱空間）

機器學習sklearn（45）：特徵工程（十二）特徵編碼（六）處理分型別特徵：編碼與啞變數/處理連續型特徵：二值化與分段

1處理分型別特徵：編碼與啞變數 from sklearn.preprocessing import LabelEncoder y = data.iloc[:,-1] #要輸入的是標籤，不是特徵矩陣，所以允許一維

機器學習sklearn（77）：演算法例項（三十四）迴歸（六）線性迴歸大家族（四）多重共線性：嶺迴歸與Lasso（一）嶺迴歸

1 最熟悉的陌生人：多重共線性逆矩陣存在的充分必要條件行列式不為0的充分必要條件

機器學習sklearn（78）：演算法例項（三十五）迴歸（七）線性迴歸大家族（五）多重共線性：嶺迴歸與Lasso（二）Lasso

3 Lasso 3.1 Lasso與多重共線性 3.2 Lasso的核心作用：特徵選擇 import numpy as np import pandas as pd

技術期刊 · 白日照耀開鴻蒙 | 深入鴻蒙 ACE UI 框架解析;無限迴圈的 useEffect 型別;用 Three.js 實現 3D 房間;圖神經網路入門;超基礎的機器學習入門-原理篇

蒲公英 · JELLY技術期刊 Vol.45 清氣升，濁氣降，事物發展總會遵循一定的規律，就好像 react hooks 更加簡潔易的同時，也可能會有隱患；人工智慧也會隨著時間的流逝逐步滲透到我們日常開發，成為解決問題的一大利

超基礎的機器學習入門-原理篇

前言隨著前端智慧化的火熱，AI機器學習進入前端開發者們的視野。AI能夠解決程式設計領域不能直接通過規則和運算解決的問題，通過自動推理產出最佳策略，成為了前端工程師們解決問題的又一大利器。

機器學習演算法（一）: 基於邏輯迴歸的分類預測

程式碼流程 Part1 Demo實踐 Step1:庫函式匯入 Step2:模型訓練 Step3:模型引數檢視 Step4:資料和模型視覺化

機器學習演算法（六）：基於決策樹的分類預測

一、決策樹的介紹決策樹是一種常見的分類模型，在金融分控、醫療輔助診斷等諸多行業具有較為廣泛的應用。決策樹的核心思想是基於樹結構對資料進行劃分，這種思想是人類處理問題時的本能方法。例如在婚戀市場中，女方

Flink 從 0 到 1 學習之（10）Flink 專案如何執行？

前言之前寫了不少 Flink 文章了，也有不少 demo，但是文章寫的時候都是在本地直接執行 Main 類的 main 方法，其實 Flink 是支援在 UI 上上傳 Flink Job 的 jar 包，然後執行得。