一週演算法實踐__1.模型構建

阿新 • • 發佈：2019-01-05

預測貸款使用者是否逾期

資料集下載：https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g

1.匯入模組

import numpy as np
import pandas as pd

from sklearn.model_selection import train_test_split,cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import f1_score,accuracy_score,recall_score

2.劃分X和y並簡單分析資料

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=2018)
print(len(X_train))
print(len(X_test))
print(len(y_test[y_test==0])/len(y_test))

3327
1427
0.7484232655921513

訓練集數量：測試集數量=3:1

3.構建模型進行預測

# LogisticRegression模型
clf_Lr=LogisticRegression(random_state=0,solver='lbfgs').fit(X_train,y_train)
y_test_pred=clf_Lr.predict(X_test)
Lr_acc=accuracy_score(y_test,y_test_pred)
f1=f1_score(y_test,y_test_pred,average='micro')
print(f1)
print(Lr_acc)
print(np.unique(y_test_pred))

0.7484232655921513
0.7484232655921513
[0]

#SVM模型
clf_SVM=SVC(gamma='auto').fit(X_train,y_train)
y_test_pred=clf_SVM.predict(X_test)
SVM_acc=accuracy_score(y_test,y_test_pred)
f1=f1_score(y_test,y_test_pred,average='micro')
print(f1)
print(SVM_acc)
print(np.unique(y_test_pred))

0.7484232655921513
0.7484232655921513
[0]

#決策樹模型
clf_Tree=DecisionTreeClassifier(random_state=0).fit(X_train,y_train)
y_test_pred=clf_Tree.predict(X_test)
Tree_acc=accuracy_score(y_test,y_test_pred)
f1=f1_score(y_test,y_test_pred,average='micro')
print(f1)
print(Tree_acc)
print(np.unique(y_test_pred))

0.6629292221443588
0.6629292221443588
[0 1]

通過對比可以看出，LR模型和SVM模型的準確率相同，決策樹模型的準確率略低。但是LR模型和SVM模型都將測試集中樣本預測為 0 ，分析可得len(y_test[y_test==0])/len(y_test)=0.7484232655921513。因此選用決策樹模型。

一週演算法實踐__1.模型構建

預測貸款使用者是否逾期資料集下載：https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 1.匯入模組 import numpy as np import pandas as pd from sklearn.model_selec

一週演算法實踐day1：模型構建

一週演算法實踐day1：模型構建資料說明 1任務 2基本要點 3完整程式碼及註釋 4執行結果展示 5遇到的問題資料說明這份資料集是金融資料（非原始資料，已經處理過了），我們要做的是預測貸

【一週演算法實踐】__2.模型構建之整合模型

模型構建之整合模型構建RF GBDT XDBoost LightGBM這四個模型，並對每一個模型使用準確率和AUC評分。在上次任務中使用了LR SVM DecisionTree這三個簡單的模型對樣本進行了預測和評價，請參照https://blog.csdn.net/wxq_1993/a

一週演算法梳理|任務3

任務內容決策樹演算法資訊理論基礎（熵聯合熵條件熵資訊增益基尼不純度）決策樹的不同分類演算法（ID3演算法、C4.5、CART分類樹）的原理及應用場景迴歸樹原理決策樹防止過擬合手段模型評估 sklearn引數詳解，Python繪

一週演算法梳理|任務1

任務內容任務1 線性迴歸演算法機器學習的一些概念有監督、無監督、泛化能力、過擬合欠擬合(方差和偏差以及各自解決辦法)、交叉驗證。線性迴歸的原理線性迴歸損失函式、代價函式、目標函式優化方法(梯度下降法、牛頓法、擬牛頓法等) 線性迴歸的評估指標

第十一週上機實踐專案專案4-教師兼職幹部類

問題及程式碼：【專案 - 教師兼幹部類】分別定義Teacher(教師)類和Cadre（幹部）類，採用多重繼承方式由這兩個類派生出新類Teacher_Cadre（教師兼幹部）。要求：（1）在兩個基類中都包含姓名、年齡、性別、地址、電話等資料成員。（2）在Teacher類

第十一週上機實踐專案——正三角形

01./* 02.*程式的版權和版本宣告部分： 03.*Copyright（c）2013，煙臺大學計算機學院學生 04.*All ri

第十一週上機實踐專案——點類派生直線類

第十週第十一週上機實踐專案-專案4-教師兼幹部類

第十一週上機實踐專案專案1-點-圓-圓柱類的設計（3）

問題及程式碼：【專案 - 點-圓-圓柱類族的設計】按以下的提示，由基類的設計和測試開始，逐漸地完成各個類的設計，求出圓格柱體的表面積、體積並輸出並且完成要求的計算任務：（1）先建立一個Point(點)類，包含資料成員x,y(座標點)，實現需要的成員函式，並設計main

第十一週上機實踐專案4——類族的設計（3）

（3）再以Circle類為直接基類，派生出一個Cylinder(圓柱體)類，再增加資料成員h(高)，，以及求圓柱表面積的成員函式area和求圓柱體積的成員函式volume，實現需要的成員函式，並設計ma

第十一週上機實踐專案——職員有薪水了（拓展）

第十一週上機實踐專案——儲存班長資訊的學生類

第十一週上機實踐專案——專案3-警察和廚師-（2）

第十一週上機實踐專案4——類族的設計（2）

（2）以Point為基類，派生出一個Circle(圓)類，增加資料成員r(半徑)，以及求面積的成員函式area，實現其他需要的成員函式，設計main函式完成測試；程式碼 #include<i

第十一週上機實踐專案——求兩個數的最大公約數

01./* 02.*程式的版權和版本宣告部分： 03.*Copyright（c）2013，煙臺大學計算機學院學生 04.*All

第十一週上機實踐專案2——職員有薪水了（2）

（2）字串除了用C++擴充的string型別外，按C語言的傳統，還可以用char 表示。請將類宣告中的string全部改為char 後，重新寫一遍程式（此時的區別是，類中有指標成員，構造和解構函式需要考

【演算法設計與分析作業題】第十一週：20. Valid Parentheses

題目 C++ solution class Solution { public: bool isValid(string s) { stack<char> cstack; for (int i = 0; i < s.si

值得花費一週研究的演算法 -- KMP演算法(indexOf)

　　KMP演算法是由三個科學家(kmp分別是他們名字的首字母)創造出來的一種字串匹配演算法. 所解決的問題: 　　求文字字串text內尋找第一次出現字串s的下標,若未出現返回-1。　　例如　　　　text : "adesceqwdasdfagf"; 　　　　s : "sce"; 　　　　ret

《演算法設計與分析》第十一週作業

《演算法設計與分析》第十一週作業標籤（空格分隔）：課堂作業文章目錄《演算法設計與分析》第十一週作業 @[toc] 題目概要思路具體實現心得原始碼：

一週演算法實踐__1.模型構建

預測貸款使用者是否逾期

1.匯入模組

2.劃分X和y並簡單分析資料

3.構建模型進行預測

相關推薦