客戶貸款逾期預測[7] - 模型融合
任務
用你目前評分最高的模型作為基準模型,和其他模型進行stacking融合,得到最終模型及評分。
實現
#簡單調包實現 from mlxtend.classifier import StackingCVClassifier, StackingClassifier clf_stacking = StackingClassifier(classifiers=[svm,dtc,xgbc,lgbc],meta_classifier=lr,use_probas=True,verbose=3) clf_stacking.fit(X_std_train,y_train)
使用之前模型評估的函式對融合後的模型評分
model_metrics(clf_stacking,X_std_train,X_std_test,y_train,y_test)
從測試集的f1 score來看,相比於單模型評分提高了6%,但是分數也不高,只有0.5439.
參考
相關推薦
客戶貸款逾期預測[7] - 模型融合
任務 用你目前評分最高的模型作為基準模型,和其他模型進行stacking融合,得到最終模型及評分。 實現 #簡單調包實現 from mlxtend.classifier import StackingCVClassi
客戶貸款逾期預測[2]-svm和決策樹模型
任務 本次以信用貸款資料作為練習資料,目的是學會使用常用的機器學習模型,用它們預測貸款客戶是否會逾期,給到的資料已經包含了標籤,列名是status,有0和1兩種值,0表示未逾期,1表示逾期,所以這是一個二分類的問題。 資料處理 &n
客戶貸款逾期預測[1]-邏輯迴歸模型
任務 預測貸款客戶是否會逾期,status為響應變數,有0和1兩種值,0表示未逾期,1表示逾期。 程式碼: # -*- coding: utf-8 -*- """ Created on Thu Nov 15 13:02:11 2018
客戶貸款逾期預測[5] - 特徵工程
目錄 任務 資料探索 特徵刪除 缺失值處理 異常值處理 特徵生成 特徵合併 特徵縮放 資料歸一化 資料標準化 相關性分析 劃分訓練集、模型評估和選擇 參考 任務
客戶貸款逾期預測[4]-記錄評分、繪製roc曲線
任務 記錄五個模型(邏輯迴歸、svm、決策樹、xgboost、lightgbm)關於precision、recall score、f1 score、roc、aoc的評分表格。 實現 # -*- coding: utf-8 -*- ""
客戶貸款逾期預測[3]-xgboost和lightgbm
任務 根據客戶貸款資料預測客戶是否會逾期,1表示會,0表示不會。 實現 # -*- coding: utf-8 -*- """ Created on Thu Nov 15 13:02:11 2018 @author: keepi """ im
金融貸款逾期的模型構建7——模型融合
文章目錄 一、整合學習 1、Bagging 2、Boosting 3、Stacking (1)核心圖解 a、構建新的訓練集 b、構建新的測試集 c、最終的訓練與預測
邏輯迴歸模型實踐-貸款逾期預測
任務 預測貸款使用者是否會逾期,status為響應變數,有0和1兩種值。 程式碼: # -*- coding: utf-8 -*- """ Created on Thu Nov 15 13:02:11 2018 @author: keepi """ i
貸款逾期(7)---stacking
任務 【任務七-模型融合】用你目前評分最高的模型作為基準模型,和其他模型進行stacking融合,得到最終模型及評分。 Stacking 原理:Stacking模型本質上是一種分層的結構。 第一層 使用5-折交叉驗證,5折交叉驗證就是先拿出四折作為training data,另外
使用SVM和決策樹實現客戶貸款逾期分析
一、背景及目標 根據提供的金融資料,分別使用SVM和決策樹兩種演算法預測貸款使用者是否會逾期。 二、任務分析 匯入資料後,首先,由於資料中存在缺失值,因此需要對缺失值資料進行預處理。 其次,對明顯與模型無關的特徵進行刪除。 最後,分別採用SVM和決策樹進行模型
ML - 貸款使用者逾期情況分析4 - 模型融合之Stacking
文章目錄 模型融合之Stacking (判定貸款使用者是否逾期) 1. 理論介紹 1.1 系統解釋 1.2 詳細解釋 2. 程式碼 2.1 調包實現 2.2 自己實現
個人貸款違約預測模型練習
重點為分類模型的資料理解與資料準備 資料介紹 賬戶表(Accounts):每條記錄描述一個賬戶的靜態資訊 顧客資訊表(Clients):每條記錄描述一個客戶的特徵資訊 許可權分配表(Disp):每條記錄描述顧客和賬戶之間的關係,以及客戶操作賬戶的許
金融貸款逾期的模型構建1
資料 data_all.csv檔案是非原始資料,已經處理過了。資料是金融資料, 我們要做的是預測貸款使用者是否會逾期。表格中, status是標籤: 0表示未逾期, 1表示逾期。 任務——模型構建 給定資料集,資料三七分,隨機種子2018。(在任務1中什麼都不用考慮,即不需資
金融貸款逾期的模型實現
資料集的下載地址為 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 我們要做的是預測貸款使用者是否會逾期。表格中 "status" 是結果標籤:0表示未逾期,1表示逾期。 先對資料進行三七分,隨機種子2018。這裡利用了LR,SVM,Decisio
使用Xgboost和lightgbm實現對貸款使用者逾期預測
一、背景及目標 根據提供的金融資料,分別使用xgboost和lightgbm兩種演算法預測貸款使用者是否會逾期。 二、任務分析 匯入資料後,首先,由於資料中存在缺失值,因此需要對缺失值資料進行預處理。 其次,對明顯與模型無關的特徵進行刪除。 最後,分別採用xg
金融貸款逾期的模型構建4——模型調優
文章目錄 一、任務 二、概述 1、引數說明 2、常用方法 二、實現 1、模組引入 2、模型評估函式 3、資料讀取 4、Logistic Regress
金融貸款逾期的模型構建3——模型評估
文章目錄 一、評價指標 1、基本概念 2、準確率(accuracy) 3、精確率(precision) 4、召回率(recall) 5、F1值 6、roc曲線 和 auc值
金融貸款逾期的模型構建2——整合模型
任務——模型構建 構建隨機森林、GBDT、XGBoost和LightGBM這4個模型,並對每一個模型進行評分,評分方式任意,例如準確度和auc值。 1、相關安裝資源 隨機森林、GBDT均在sklearn包中; LightGBM:https://github.co
十大經典預測演算法六---整合學習(模型融合演算法)
模型融合演算法概念 它不是具體的指某一個演算法,而是一種把多個弱模型融合合併在一起變成一個強模型的思想 用模型融合演算法的原因 1、單個模型容易過擬合,多個模型融合可以提高範化能力 2、單個模型預測能力不高,多個模型往往能提高預測能力 3、對於資料集過大或過小,可以分別進行劃分和有放
金融貸款逾期的模型構建6——特徵選擇
文章目錄 一、IV值 1、概述 2、IV計算 (1)WOE (2)IV 計算 二、實現 0、相關模組 1、IV值 2、R