【Task4(2天)】模型評估

阿新 • • 發佈：2019-05-17

時間 cal wid boost ive div learn col 決策

記錄5個模型（邏輯回歸、SVM、決策樹、隨機森林、XGBoost）關於accuracy、precision，recall和F1-score、auc值的評分表格，並畫出ROC曲線。時間：2天

可以參照以下格式：

說明：這份數據集是金融數據（非原始數據，已經處理過了），我們要做的是預測貸款用戶是否會逾期。表格中 "status" 是結果標簽：0表示未逾期，1表示逾期。

1.繪圖繪表格函數

這裏直接用的是上一篇的處理後的數據，定義好的模型

from sklearn.metrics import recall_score,precision_score,f1_score,accuracy_score,roc_curve,roc_auc_score
 
import numpy as np

def plot_roc_curve(fpr_train, tpr_train,fpr_test,tpr_test, name=None):
    plt.plot(fpr_train, tpr_train, linewidth=2,c=‘r‘,label=‘train‘)
    plt.plot(fpr_test, tpr_test, linewidth=2,c=‘b‘,label=‘test‘)
    plt.plot([0, 1], [0, 1], ‘k--‘)
    plt.axis([0, 1, 0, 1])
    plt.xlabel( 
‘False Positive Rate‘)
    plt.ylabel(‘True Positive Rate‘)
    plt.title(name)
    plt.legend(loc=‘best‘)
    plt.show()

def metrics(models,X_train_scaled,X_test_scaled,y_train,y_test):
    results_test = pd.DataFrame(columns=[‘recall_score‘,‘precision_score‘,‘f1_score‘,‘accuracy_score‘,‘AUC 
‘])
    results_train = pd.DataFrame(columns=[‘recall_score‘,‘precision_score‘,‘f1_score‘,‘accuracy_score‘,‘AUC‘])
    for model in models:
        name = str(model)
        result_train = []
        result_test = []
        model = models[model]
        model.fit(X_train_scaled,y_train)
        y_pre_test = model.predict(X_test_scaled)
        y_pre_train = model.predict(X_train_scaled)
        result_test.append(round(recall_score(y_pre_test,y_test),2))
        result_test.append(round(precision_score(y_pre_test,y_test),2))
        result_test.append(round(f1_score(y_pre_test,y_test),2))
        result_test.append(round(accuracy_score(y_pre_test,y_test),2))
        result_test.append(round(roc_auc_score(y_pre_test,y_test),2))
        
        
        result_train.append(round(recall_score(y_pre_train,y_train),2))
        result_train.append(round(precision_score(y_pre_train,y_train),2))
        result_train.append(round(f1_score(y_pre_train,y_train),2))
        result_train.append(round(accuracy_score(y_pre_train,y_train),2))
        result_train.append(round(roc_auc_score(y_pre_train,y_train),2))
        
        fpr_train, tpr_train, thresholds_train = roc_curve(y_pre_train,y_train)
        fpr_test, tpr_test, thresholds_test = roc_curve(y_pre_test,y_test)
        plot_roc_curve(fpr_train, tpr_train,fpr_test,tpr_test,name)
        
        results_test.loc[name] = result_test
        results_train.loc[name] = result_train
    return results_test,results_train

results_test,results_train = metrics(models,X_train_scaled,X_test_scaled,y_train,y_test)

結果如下

訓練集：技術分享圖片（數模型過擬合的很厲害！！）

測試集：技術分享圖片

模型ROC曲線：

技術分享圖片

【Task4(2天)】模型評估

時間 cal wid boost ive div learn col 決策記錄5個模型（邏輯回歸、SVM、決策樹、隨機森林、XGBoost）關於accuracy、precision，recall和F1-score、auc值的評分表格，並畫出ROC曲線。時間：2天可以參

【機器學習123】模型評估與選擇 (上)

　　第2章模型評估與選擇 2.1 經驗誤差與過擬合先引出幾個基本概念：誤差(error）：學習器的實際預測輸出與樣本的真實輸出之間的差異。訓練誤差(training error)：學習器在訓練集上的誤差，也稱“經驗誤差”。測試誤差(testing error)：學習器在測試集上的

【機器學習】模型評估與選擇

內容大多來自統計學習方法——李航機器學習——周志華 1. 統計學習三要素統計學習方法都是有模型、策略和演算法構成的，也就是統計學習方法由三要素構成，可以簡單地表示為：方法=模型+策略+算法方法=模型+策略+算法構建一種統計學習方法就是

【Luogu】【關卡2-1】簡單的模擬（2017年10月）

題意 pan 任務進制 class spa -s row 機器翻譯任務說明：開始普及組的訓練！所謂模擬，就是直接根據題意編寫，思維難度簡單。鋪地毯進制轉換多項式輸出機器翻譯排座椅笨小猴都是簡單模擬題【Luogu】【關卡2-1】簡單

【Luogu】【關卡2-6】貪心（2017年10月）

元素 spa tdi ace one 直接 lap aps splay 任務說明：貪心就是只考慮眼前的利益。對於我們人生來說太貪是不好的，不過oi中，有時是對的。 P1181 數列分段Section I 給一個n個元素的數組，和一個數字m，問最少能把這個數組分成幾段，每段的

【Luogu】【關卡2-15】動態規劃的背包問題（2017年10月）

splay image 說明方案理解 ostream img 如果一次任務說明：這是最基礎的動態規劃。不過如果是第一次接觸會有些難以理解。加油闖過這個坎。 P1060 開心的金明小明的媽媽給小明N元錢，小明想買m件物品，每個物品價值為價格*重要度，求出不超過N元

【Luogu】【關卡2-16】線性動態規劃（2017年10月）

all -1 要掌握 span pan nbsp 關卡線性結構這也任務說明：這也是基礎的動態規劃。是在線性結構上面的動態規劃，一定要掌握。 P1020 導彈攔截導彈攔截合唱隊形尼克的任務石子合並低價購買多米諾骨牌【Luogu】

【TP3.2.3】微信網頁授權--基類

重新 exec 進入 index.php sset AR 關註 fun func 非常好用的微信授權基類：其他的微信權限類都可以繼承至該類： <?php namespace Wechat\Controller; use Think\Controller;

Python學習【第2篇】：Python之數據類型

msg ear sleep abc 命令 play bbbb 朋友 == 數字類型和字符串類型 1.bin()函數將十進制轉換成而進制 2.oct()函數將十進制轉換成八進制 3.hex()函數將十進制轉換成十六進制　　　　十六進制表示：0-9 a b c

Python學習【第2篇】：Python之數據類型（2）

append 但是 iss 代碼 key 常用方法 uber ner ces 元組 #為何要有元組，存放多個值，元組不可變，更多的是用來做查詢 t=(1,[1,3],‘sss‘,(1,2)) #t=tuple((1,[1,3],‘sss‘,(1,2))) #

RQNOJ PID217 / [NOIP1999]攔截導彈【n^2 / LIS】

正整數由於 include n-1 name 整數攔截 sin code 題目描述某國為了防禦敵國的導彈襲擊，發展出一種導彈攔截系統。但是這種導彈攔截系統有一個缺陷：雖然它的第一發炮彈能夠到達任意的高度，但是以後每一發炮彈都不能高於前一發的高度。某天，雷達捕捉到敵國的

python爬蟲【第2篇】

multi 實現 from eat 進程 lun pid RR print 一、多進程 1.fork方法（os模塊,適用於Lunix系統） fork方法：調用1次，返回2次。原因：操作系統經當前進程（父進程）復制出一份進程（子進程），兩個進程幾乎完全相同，fork方法分別在

Python開發【第2篇】【數據類型】

修改元素八進制 ola pen str count() list name sort 一、數字數字數據類型用於存儲數值。他們是不可改變的數據類型，這意味著改變數字數據類型會分配一個新的對象。 # 創建對象 var1 = 1 var2 = 2 # 刪除對象 del

C語言Windows程序開發—MessageBox函數介紹【第01天】

class ner windows.h can lpctstr 字符串 return napi ext （一）MessageBox函數的參數介紹： 1 int MessageBox ( 2 HWND hWnd, //彈出Messa

C語言Windows程序開發—TextOut函數介紹【第02天】

菜單 stock rec null 主函數 callback 介紹關閉 windows.h （一）TextOut函數的參數介紹： 1 BOOL TextOut ( //如果函數調用成功，返回TRUE，否則，返回FALSE 2 H

【11.9校內測試】【倒計時1天】【ak歡樂賽】【多項式計算模擬】

然而AK失敗了，就是因為這道摸你題：（最後一篇題解了吧？QAQ） Solution 模擬多項式乘法，其中的運算處理很像高精度，不過第$i$位代表的就是$x^i$前面的係數了。好像去年的時候就講了表示式的計算（又開始玻璃心了QAQ），開雙棧，一個棧表示數字，一個棧表示運算子。然後碰到右括號或者運

【python 2.7】輸入任意字母數字，輸出其對應的莫爾斯碼並播放聲音

技術 ini lease pre 無線 () .com bye eas #python 2.7 #!/usr/bin/env python # -*- coding:utf-8 -*- import os import winsound,sys,time _

C語言Windows程式開發—Windows視窗樣式與常用控制元件樣式【第04天】

（一）Windows視窗（MDICLIENT）樣式介紹 1 /* Windows視窗樣式 */ 2 WS_BORDER //帶有邊框的視窗 3 WS_CAPTION //帶有標題欄的視窗 4 WS_CHILD

【第12天】Java集合（一）

1 什麼是集合？有哪些分類 1.1 JCF(Java Collections FrameWork) 2 ArrayList ★ 2.1 包裝類 2.2 基本用法與特點 2.3 刪除元素

【第11天】Java的單例模式、介面以及Object類常用的方法

1 單例模式 1.1 醉漢式 1.2 懶漢式 2 介面（interface） 3 Object類常用的方法 3.1 clone() 3.2 finalize()

【Task4(2天)】 模型評估

1.繪圖繪表格函數

相關推薦

【Task4(2天)】模型評估