機器學習(十) 評價分類結果 (下)

阿新 • • 發佈：2018-09-01

平衡理解 bob exce info exc 描述 assert metrics

五、精準率和召回率的平衡

Precision-Recall 的平衡

技術分享圖片

六、精準率-召回率曲線

技術分享圖片

七、ROC曲線

Receiver Operation Characteristic Curve

描述 TPR 和 FPR 之間的關系

metrics.py

import numpy as np
from math import sqrt


def accuracy_score(y_true, y_predict):
    """計算y_true和y_predict之間的準確率"""
    assert len(y_true) == len(y_predict),          
"the size of y_true must be equal to the size of y_predict"

    return np.sum(y_true == y_predict) / len(y_true)


def mean_squared_error(y_true, y_predict):
    """計算y_true和y_predict之間的MSE"""
    assert len(y_true) == len(y_predict),         "the size of y_true must be equal to the size of y_predict 
"

    return np.sum((y_true - y_predict)**2) / len(y_true)


def root_mean_squared_error(y_true, y_predict):
    """計算y_true和y_predict之間的RMSE"""

    return sqrt(mean_squared_error(y_true, y_predict))


def mean_absolute_error(y_true, y_predict):
    """計算y_true和y_predict之間的MAE"""
    assert 
 len(y_true) == len(y_predict),         "the size of y_true must be equal to the size of y_predict"

    return np.sum(np.absolute(y_true - y_predict)) / len(y_true)


def r2_score(y_true, y_predict):
    """計算y_true和y_predict之間的R Square"""

    return 1 - mean_squared_error(y_true, y_predict)/np.var(y_true)


def TN(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    return np.sum((y_true == 0) & (y_predict == 0))


def FP(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    return np.sum((y_true == 0) & (y_predict == 1))


def FN(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    return np.sum((y_true == 1) & (y_predict == 0))


def TP(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    return np.sum((y_true == 1) & (y_predict == 1))


def confusion_matrix(y_true, y_predict):
    return np.array([
        [TN(y_true, y_predict), FP(y_true, y_predict)],
        [FN(y_true, y_predict), TP(y_true, y_predict)]
    ])


def precision_score(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    tp = TP(y_true, y_predict)
    fp = FP(y_true, y_predict)
    try:
        return tp / (tp + fp)
    except:
        return 0.0


def recall_score(y_true, y_predict):
    assert len(y_true) == len(y_predict)
    tp = TP(y_true, y_predict)
    fn = FN(y_true, y_predict)
    try:
        return tp / (tp + fn)
    except:
        return 0.0


def f1_score(y_true, y_predict):
    precision = precision_score(y_true, y_predict)
    recall = recall_score(y_true, y_predict)

    try:
        return 2. * precision * recall / (precision + recall)
    except:
        return 0.


def TPR(y_true, y_predict):
    tp = TP(y_true, y_predict)
    fn = FN(y_true, y_predict)
    try:
        return tp / (tp + fn)
    except:
        return 0.


def FPR(y_true, y_predict):
    fp = FP(y_true, y_predict)
    tn = TN(y_true, y_predict)
    try:
        return fp / (fp + tn)
    except:
        return 0.

技術分享圖片

八、多分類問題中的混淆矩陣

技術分享圖片

我寫的文章只是我自己對bobo老師講課內容的理解和整理，也只是我自己的弊見。bobo老師的課是慕課網出品的。歡迎大家一起學習。

機器學習(十) 評價分類結果 (下)

平衡理解 bob exce info exc 描述 assert metrics 五、精準率和召回率的平衡 Precision-Recall 的平衡六、精準率-召回率曲線七、ROC曲線 Receiver Operation Cha

機器學習：評價分類結果（實現混淆矩陣、精準率、召回率）

test set 目的 mod 二分參數 nbsp return try 一、實例　1）構造極度偏差的數據 import numpy as np from sklearn import datasets digits = datasets.load_digits

CS231n——機器學習演算法——線性分類（下：Softmax及其損失函式）

在前兩篇筆記中，基於線性分類上，線性分類中繼續記筆記。 1. Softmax分類器 SVM和Softmax分類器是最常用的兩個分類器，Softmax的損失函式與SVM的損失函式不同。對於學習過二元邏輯迴歸分類器的讀者來說，Softmax分類器就可以理解為邏輯迴歸分類器面對多個分類的一

【機器學習】決策樹（下)CART演算法分類樹、迴歸樹

CART同樣由特徵選擇、樹的生成、剪枝組成。既可以用於迴歸，又可以用於分類。 CART是在給定輸入隨機變數X條件下輸出隨機變數Y的條件概率分佈的學習方法。 CART假設決策樹是二叉樹，內部節點特徵的取值為“是“和“否“，左分支是取值為“是“的分支，右分支是取值為“否“的分支。這樣的決策樹

機器學習基礎-8.分類演算法的評價

一、分類演算法評價指標1.分類準確度的問題分類演算法如果用分類準確度來衡量好壞將會存在問題。例如一個癌症預測系統，輸入體檢資訊，可以判斷是否有癌症，預測準確度可以達到99.9%，看起來預測系統還可以，但是如果癌症的產生概率只有0.1%，那麼系統只要預測所有人都是健康的就可以達

機器學習十講-第三講分類

感知機原理下面用一個 perception 函式實現上述演算法。為了深入觀察演算法執行過程，我們保留了每一輪迭代的引數 ww，並對每一輪迭代中隨機選取的樣本也進行了記錄。所以，perception 函式返回三個取值: 最終學

機器學習十大常用算法

不同 youtube 多少 ear 邏輯回歸 total 組成 ddc 表達機器學習十大常用算法小結機器學習十大常用算法小結通過本篇文章可以對ML的常用算法有個常識性的認識，沒有代碼，沒有復雜的理論推導，就是圖解一下，知道這些算法是什麽，它們是怎麽應用的，例子

機器學習：wine 分類

算法 sub quad type 數據處理線性判別分析 rain -s scl 數據來源：http://archive.ics.uci.edu/ml/datasets/Wine參考文獻：《機器學習Python實戰》魏貞原博文目的：復習工具：Geany#導入類庫from p

機器學習算法分類

分享圖片概率機器學習 body mage blog png src 半監督學習算法分類一：有監督學習無監督學習半監督學習算法分類二　　　分類與回歸　　聚類　　標註算法分類三　　

[機器學習]模型評價參數，準確率，召回率，F1-score

就是 ddl .com gpo sci 擔心 height 數據 -s 很久很久以前，我還是有個建築夢的大二少年，有一天，講圖的老師看了眼我的設計圖，說：“我覺得你這個設計做得很緊張”，當時我就崩潰，對緊張不緊張這樣的評價標準理解無能。多年後我終於明白老師當年的意思，然鵝已

機器學習中各分類算法的優缺點比較

參考情況 strong lib 而不是表達式出版社函數導致文章轉自：http://bbs.pinggu.org/thread-2604496-1-1.html 1決策樹（Decision Trees）的優缺點決策樹的優點：一、決策

機器學習(十一) 支持向量機 SVM（上）

gin 模型結構線性可分 adding 統計學習 lis 可能方法一、什麽是支撐向量機SVM （Support Vector Machine） SVM(Support Vector Machine)指的是支持向量機，是常見的一種判別方法。在機器學習領域，是一個有監

機器學習(十二) 決策樹

圖解通過 rop 監管運用一個系統分支對象屬性決策樹(Decision Tree）是在已知各種情況發生概率的基礎上，通過構成決策樹來求取凈現值的期望值大於等於零的概率，評價項目風險，判斷其可行性的決策分析方法，是直觀運用概率分析的一種圖解法。由於這種決策分支畫

【機器學習】在分類中如何處理訓練集中不平衡問題

原文地址：一隻鳥的天空，http://blog.csdn.net/heyongluoyao8/article/details/49408131 在分類中如何處理訓練集中不平衡問題在很多機器學習任務中，訓練集中可能會存在某個或某些類別下的樣本數遠大於另一些類別下的樣本數目。即類別不平衡，為了

CS231n——機器學習演算法——線性分類（中：SVM及其損失函式）

損失函式 Loss function 在線性分類（上）筆記中，定義了從影象畫素值到所屬類別的評分函式（score function），該函式的引數是權重矩陣W。在函式中，資料 (

機器學習演算法--CART分類迴歸樹

許多問題都是非線性的，用線性模型並不能很好的擬合數據，這種情況下可以使用樹迴歸來擬合數據。介紹CART, 樹剪枝，模型樹。 1.CART 傳統決策樹是一種貪心演算法，在給定時間內做出最佳選擇，不關心是否達到全域性最優。切分過於迅速，特徵一旦使用後面將不再使用。不能處理連續型特徵，

新手入門機器學習十大演算法

在機器學習的世界中，有一種被稱為“無免費午餐”的定理。它意在說明沒有哪種演算法能夠完美地解決每個問題，特別是對於監督學習問題。例如，神經網路不會總是比決策樹要好，反之亦然。往往是有許多因素在起作用（如：資料集的大小、結構），共同決定了最後的結果。因此，我們應該針對具體的問題嘗試許多不同的演算法

機器學習演算法——評價指標彙總

準確率，精確率，召回率和F1 準確率(Accuracy), 精確率(Precision), 召回率(Recall)和F1-Measure ROC-AUC ROC曲線需要提前說明的是，我們這裡只討論二值分類器。對於分類器，或者說分類演算法，評價指標主要有precision，recal

圖解機器學習十大常用演算法

通過本篇文章可以對ML的常用演算法有個常識性的認識，沒有程式碼，沒有複雜的理論推導，就是圖解一下，知道這些演算法是什麼，它們是怎麼應用的，例子主要是分類問題。每個演算法都看了好幾個視訊，挑出講的最清晰明瞭有趣的，便於科普。以後有時間再對單個演算法做深入地解析。今天的演算法如下：

機器學習十大演算法之決策樹（詳細）

什麼是決策樹？如何構建決策樹？ ID3 C4.5 CART 決策樹的優缺點及改進什麼是決策樹？決策樹是運用於分類的一種樹結構，其本質是一顆由多個判斷節點組成的樹，其中的每個內部節點代表對某一屬性的一次測試，每條邊代表一個測試結果，而葉節點代表某個類或類的分佈。屬於有監督學習核心思想：

機器學習(十) 評價分類結果 (下)

五、精準率和召回率的平衡

六、精準率-召回率曲線

七、ROC曲線

八、多分類問題中的混淆矩陣

相關推薦