機器學習中的評價標準

阿新 • • 發佈：2022-04-09

from sklearn.metrics import classification_report
y_true = [0, 1, 2, 2, 2]
y_pred = [0, 0, 2, 2, 1]
target_names = ['class 0', 'class 1', 'class 2']
print(classification_report(y_true, y_pred, target_names=target_names))

輸出：

                precision    recall  f1-score   support

     class 0       0.50      1.00      0.67         1
     class 1       0.00      0.00      0.00         1
     class 2       1.00      0.67      0.80         3

    accuracy                           0.60         5
   macro avg       0.50      0.56      0.49         5
weighted avg       0.70      0.60      0.61         5

其中列表左邊的一列為分類的標籤名，右邊support列為每個標籤的出現次數．precision recall f1-score三列分別為各個類別的精確度/召回率及 F1值．

TP:預測為1(Positive)，實際也為1(Truth-預測對了)
TN: 預測為0(Negative)，實際也為0(Truth-預測對了)
FP: 預測為1(Positive)，實際為0(False-預測錯了)
FN: 預測為0(Negative)，實際為1(False-預測錯了)

Accuracy = (TP+TN) ⁄（TP + FP + TN + FN）

Precision =TP ⁄（TP+FP）

Recall = TP ⁄（TP+FN）

Precision又叫查準率，Recall又叫查全率

F1 = 2Precision *Recall ⁄（Precision+Recall）

macro avg 為算術平均值，以precision為例，macro avg = （0.50 + 0 + 1.00） ⁄ 3 = 0.50

weighted avg 是用每一個類別樣本數量在所有類別的樣本總數的佔比作為權重以precision為例， weighted avg = （0.5*1 + 0*1 + 1*3）/5 = 0.7

此外還有micro avg

from sklearn.metrics import confusion_matrix, precision_score

y_true = ["A", "A", "A", "A", "B", "B", "C", "C", "C", "C", "C"]
y_pred = ["A", "B", "A", "A", "B", "A", "B", "C", "C", "C", "C"]
print(confusion_matrix(y_true, y_pred))
print(precision_score(y_true, y_pred, average='micro'))

[[3 1 0] [1 1 0] [0 1 4]] 
0.7272727272727273

對於類別A，它的TP=3, FP=1；對於類別B，它的TP=1， FP=1；對於類別C，它的TP=4，FP=1，因此micro avg precision為：

(3+1+4)/(3+1+1+1+4+1)=0.7273

機器學習中的評價標準

from sklearn.metrics import classification_report y_true = [0, 1, 2, 2, 2] y_pred = [0, 0, 2, 2, 1] target_names = [\'class 0\', \'class 1\', \'class 2\']

機器學習中的評價指標

0 概述為了衡量一個機器學習模型的好壞，需要給定一個測試集，用模型對測試集中的每個樣本進行預測，並根據預測結果計算評價分數。對於分類問題，常見的評價指標有準確率、精確率、召回率和F值等。給定測試集\\(\\

機器學習中的評價指標--01

機器學習中的評價指標--01 在機器學習中，效能指標(Metrics)是衡量一個模型好壞的關鍵，通過衡量模型輸出y_predict 和 y_true之間的某種\"距離\"得出的。

機器學習中的評價指標--02

機器學習中的評價指標--02 迴歸演算法的評價指標就是SSE、MSE，RMSE，MAE、R-Squared。下面一一介紹：

機器學習中常用的模型評價指標

本文介紹一些模型中常用的評價模型準確性的指標參考： Various ways to evaluate a machine learning model’s performance

機器學習中的AUC-ROC曲線

作者|ANIRUDDHA BHANDARI 編譯|VK 來源|Analytics Vidhya AUC-ROC曲線你已經建立了你的機器學習模型-那麼接下來呢？你需要對它進行評估，並驗證它有多好（或有多壞），這樣你就可以決定是否實現它。這時就可以引入A

雙樣本T檢驗、F檢驗——機器學習中樣本中的某個特徵（自變數）和因變數之間的相關性強弱

我認為T檢驗和F檢驗在機器學習中的作用：判斷機器學習中樣本集中的某個特徵（自變數）和因變數之間的相關性強弱（用於在建模中判斷此自變數是否可以扔掉）

應對機器學習中類不平衡的10種技巧

作者|GUEST BLOG 編譯|Flin 來源|analyticsvidhya 總覽熟悉類失衡瞭解處理不平衡類的各種技術，例如-

機器學習中的數學（六）：線性判別分析（LDA）, 主成分分析(PCA)

前言如果學習分類演算法，最好從線性的入手，線性分類器最簡單的就是LDA，它可以看做是簡化版的SVM，如果想理解SVM這種分類器，那理解LDA就是很有必要的了。談到LDA，就不得不談談PCA，PCA是一個和LDA非

機器學習中的數學意義

機器學習中的用於聲稱效能的指標標準很少被討論。由於在這個問題上似乎沒有一個明確的、廣泛的共識，因此我認為提供我一直在倡導並儘可能遵循的標準可能會很有趣。它源於這個簡單的前提，這是我的科學老師從

機器學習中模型的診斷、改進、選擇——偏差、方差、欠擬合、過擬合、交叉驗證

技術標籤：深度學習機器學習資料來源：臺大李巨集毅 2020機器學習深度學習課程

機器學習中線性迴歸python程式設計注意事項

技術標籤：python機器學習先把公式列在這裡方便表述：我們設x0永遠為1 ，用來表示 y = kx+b 中的 b

什麼是機器學習中類別資料的轉換？

技術標籤：人工智慧機器學習資料分析資料探勘python 資料預處理一直機器學習專案中最耗時間的工作，我們常常會遇到一些非數值資料，比如城市建築物的商用類別、餐館的菜系類別、手機中app的用途類別等等，這些資

Markdown之機器學習中的特殊符號

技術標籤：MachineLearningmarkdown機器學習數學常用數學符號參考部落格：https://blog.csdn.net/katherine_hsr/article/details/79179622

機器學習2.1-機器學習中的特徵選擇

特徵提取演算法特徵提取演算法分為特徵選擇和特徵抽取兩大類特徵選擇常採用特徵選擇方法。常見的六種特徵選擇方法：

分散式機器學習中的模型聚合

我follow的這篇論文在聯邦學習(分散式)的情景下引入了多工學習，其採用的手段是使每個client/task節點的訓練資料分佈不同，從而使各任務節點學習到不同的模型，且每個任務節點以及全域性(global)的模型都由多個分量

機器學習中的Accuracy和Precision的區別

準確率(Accuracy)、精確率(Precision)和召回率(Recall)的區別準確率(Accuracy) ＝ (TP + TN) / 總樣本＝(40 + 10)/100 = 50%。定義是: 對於給定的測試資料集，分類器正確分類的樣本數與總樣本數之比。

機器學習中的資料

以鳶尾花資料為例：其中包含四個主要的資訊（萼片（sepal）的長寬、花瓣（petal）的長寬）

【轉】機器學習中分類問題類別樣本不均勻如何處理

最近剛好對類別不平衡的分類問題（也即長尾分佈學習，long-tailed recognition）做了一波review，整理一下我自己的總結，可以和其他回答互補一下，為小夥伴們提供一些思路和參考。這裡涵蓋的大部分也都是近年深度學習

機器學習中分類與迴歸的差異

在分類（Classification）問題與迴歸（Regression）問題之間，有著一個重要的區別。

機器學習中的評價標準

相關推薦