深度學習模型融合stacking

阿新 • • 發佈：2019-03-19

use get frame positive rate ict print pri can

當你的深度學習模型變得很多時，選一個確定的模型也是一個頭痛的問題。或者你可以把他們都用起來，就進行模型融合。我主要使用stacking和blend方法。先把代碼貼出來，大家可以看一下。

  1 import numpy as np
  2 import pandas as pd
  3 import matplotlib.pyplot as plt
  4 from sklearn.metrics import roc_curve
  5 
  6 SEED = 222
  7 np.random.seed(SEED)
  8 from sklearn.model_selection import 
 train_test_split
  9 
 10 from sklearn.metrics import roc_auc_score
 11 from sklearn.svm import SVC,LinearSVC
 12 from sklearn.naive_bayes import GaussianNB
 13 from sklearn.ensemble import RandomForestClassifier,GradientBoostingClassifier
 14 from sklearn.linear_model import LogisticRegression
 
 15 from sklearn.neighbors import KNeighborsClassifier
 16 from sklearn.neural_network import MLPClassifier
 17 
 18 df = pd.read_csv(‘input.csv‘)
 19 
 20 def get_train_test():   # 數據處理
 21 
 22     y = 1 * (df.cand_pty_affiliation == "REP")
 23     x = df.drop([‘cand_pty_affiliation‘],axis=1)
 
 24     x = pd.get_dummies(x,sparse=True)
 25     x.drop(x.columns[x.std()==0],axis=1,inplace=True)
 26     return train_test_split(x,y,test_size=0.95,random_state=SEED)
 27 
 28 def get_models():   # 模型定義
 29     nb = GaussianNB()
 30     svc = SVC(C=100,probability=True)
 31     knn = KNeighborsClassifier(n_neighbors=3)
 32     lr = LogisticRegression(C=100,random_state=SEED)
 33     nn = MLPClassifier((80, 10), early_stopping=False, random_state=SEED)
 34     gb = GradientBoostingClassifier(n_estimators =100, random_state = SEED)
 35     rf = RandomForestClassifier(n_estimators=1,max_depth=3,random_state=SEED)
 36 
 37     models = {‘svm‘:svc,
 38               ‘knn‘:knn,
 39               ‘naive bayes‘:nb,
 40               ‘mlp-nn‘:nn,
 41               ‘random forest‘:rf,
 42               ‘gbm‘:gb,
 43               ‘logistic‘:lr,
 44               }
 45     return models
 46 
 47 def train_base_learnres(base_learners,inp,out,verbose=True):    # 訓練基本模型
 48     if verbose:print("fitting models.")
 49     for i,(name,m) in enumerate(base_learners.items()):
 50         if verbose:print("%s..." % name,end=" ",flush=False)
 51         m.fit(inp,out)
 52         if verbose:print("done")
 53 
 54 def predict_base_learners(pred_base_learners,inp,verbose=True): # 把基本學習器的輸出作為融合學習的特征，這裏計算特征
 55     p = np.zeros((inp.shape[0],len(pred_base_learners)))
 56     if verbose:print("Generating base learner predictions.")
 57     for i,(name,m) in enumerate(pred_base_learners.items()):
 58         if verbose:print("%s..." % name,end=" ",flush=False)
 59         p_ = m.predict_proba(inp)
 60         p[:,i] = p_[:,1]
 61         if verbose:print("done")
 62     return p
 63 
 64 def ensemble_predict(base_learners,meta_learner,inp,verbose=True):  # 融合學習進行預測
 65     p_pred = predict_base_learners(base_learners,inp,verbose=verbose)    # 測試數據必須先經過基本學習器計算特征
 66     return p_pred,meta_learner.predict_proba(p_pred)[:,1]
 67 
 68 def ensenmble_by_blend():   # blend融合
 69     xtrain_base, xpred_base, ytrain_base, ypred_base = train_test_split(
 70         xtrain, ytrain, test_size=0.5, random_state=SEED
 71     )   # 把數據切分成兩部分
 72 
 73     train_base_learnres(base_learners, xtrain_base, ytrain_base)  # 訓練基本模型
 74 
 75     p_base = predict_base_learners(base_learners, xpred_base) # 把基本學習器的輸出作為融合學習的特征，這裏計算特征
 76     meta_learner.fit(p_base, ypred_base)    # 融合學習器的訓練
 77     p_pred, p = ensemble_predict(base_learners, meta_learner, xtest)  # 融合學習進行預測
 78     print("\nEnsemble ROC-AUC score: %.3f" % roc_auc_score(ytest, p))
 79 
 80 
 81 from sklearn.base import clone
 82 def stacking(base_learners,meta_learner,X,y,generator): # stacking進行融合
 83     print("Fitting final base learners...",end="")
 84     train_base_learnres(base_learners,X,y,verbose=False)
 85     print("done")
 86 
 87     print("Generating cross-validated predictions...")
 88     cv_preds,cv_y = [],[]
 89     for i,(train_inx,test_idx) in enumerate(generator.split(X)):
 90         fold_xtrain,fold_ytrain = X[train_inx,:],y[train_inx]
 91         fold_xtest,fold_ytest = X[test_idx,:],y[test_idx]
 92 
 93         fold_base_learners = {name:clone(model)
 94                               for name,model in base_learners.items()}
 95         train_base_learnres(fold_base_learners,fold_xtrain,fold_ytrain,verbose=False)
 96         fold_P_base = predict_base_learners(fold_base_learners,fold_xtest,verbose=False)
 97 
 98         cv_preds.append(fold_P_base)
 99         cv_y.append(fold_ytest)
100 
101         print("Fold %i done" %(i+1))
102     print("CV-predictions done")
103     cv_preds = np.vstack(cv_preds)
104     cv_y = np.hstack(cv_y)
105 
106     print("Fitting meta learner...",end="")
107     meta_learner.fit(cv_preds,cv_y)
108     print("done")
109 
110     return base_learners,meta_learner
111 
112 def ensemble_by_stack():
113     from sklearn.model_selection import KFold
114     cv_base_learners,cv_meta_learner = stacking(
115         get_models(),clone(meta_learner),xtrain.values,ytrain.values,KFold(2))
116     P_pred,p = ensemble_predict(cv_base_learners,cv_meta_learner,xtest,verbose=False)
117     print("\nEnsemble ROC-AUC score: %.3f" %roc_auc_score(ytest,p))
118 
119 def plot_roc_curve(ytest,p_base_learners,p_ensemble,labels,ens_label):
120     plt.figure(figsize=(10,8))
121     plt.plot([0,1],[0,1],‘k--‘)
122     cm = [plt.cm.rainbow(i)
123         for i in np.linspace(0,1.0, p_base_learners.shape[1] +1)]
124     for i in range(p_base_learners.shape[1]):
125         p = p_base_learners[:,i]
126         fpr,tpr,_ = roc_curve(ytest,p)
127         plt.plot(fpr,tpr,label = labels[i],c=cm[i+1])
128     fpr, tpr, _ = roc_curve(ytest, p_ensemble)
129     plt.plot(fpr, tpr, label=ens_label, c=cm[0])
130     plt.xlabel(‘False positive rate‘)
131     plt.ylabel(‘True positive rate‘)
132     plt.title(‘ROC curve‘)
133     plt.legend(frameon=False)
134     plt.show()
135 
136 from mlens.ensemble import SuperLearner
137 def use_pack():
138     sl =SuperLearner(
139         folds=10,random_state=SEED,verbose=2,
140         # backend="multiprocessing"
141     )
142     # Add the base learners and the meta learner
143     sl.add(list(base_learners.values()),proba=True)
144     sl.add_meta(meta_learner,proba=True)
145     # Train the ensemble
146     sl.fit(xtrain,ytrain)
147     # Predict the test set
148     p_sl=sl.predict_proba(xtest)
149 
150     print("\nSuper Learner ROC-AUC score: %.3f" % roc_auc_score(ytest,p_sl[:,1]))
151 
152 if __name__ == "__main__":
153     xtrain, xtest, ytrain, ytest = get_train_test()
154     base_learners = get_models()
155 
156     meta_learner = GradientBoostingClassifier(
157         n_estimators=1000,
158         loss="exponential",
159         max_depth=4,
160         subsample=0.5,
161         learning_rate=0.005,
162         random_state=SEED
163     )
164 
165     # ensenmble_by_blend() # blend進行融合
166     # ensemble_by_stack()   # stack進行融合
167     use_pack()  # 調用包進行融合

深度學習模型融合stacking

use get frame positive rate ict print pri can 當你的深度學習模型變得很多時，選一個確定的模型也是一個頭痛的問題。或者你可以把他們都用起來，就進行模型融合。我主要使用stacking和blend方法。先把代碼貼出來，大家可以看一下

深度學習模型stacking模型融合python代碼，看了你就會使

shuffle The max and ots shape onf 第一個求平均值話不多說，直接上代碼 1 def stacking_first(train, train_y, test): 2 savepath = ‘./stack_op{}_dt

使用GOOGLE COLAB訓練深度學習模型

edi play bottom art one con style right tag 來自為知筆記(Wiz)使用GOOGLE COLAB訓練深度學習模型

深度學習模型相關知識（2）

fas bubuko 深度學習 image ive bsp 提取 AS 簡寫參考：https://blog.csdn.net/lanran2/article/details/60143861 ROI pooling： ROI是Regin of Interest的簡寫，指的

用深度學習模型Word2Vec探索《紅樓夢》人物關系

繼續 comment block for lse r+ not 百度構建先來看一看結果，發現： 1.賈寶玉和襲人的關系最近。 2.薛寶釵和自己的媽媽關系最近。 3.賈寶玉和林黛玉逼格比較統一，薛寶釵屬於獨樹一幟的逼格調性。 4.大觀園中可以看到邢岫煙經常出沒... 還有

Opencv呼叫深度學習模型

https://blog.csdn.net/lovelyaiq/article/details/79929393 Opencv呼叫深度學習模型 2018年04月13日 15:19:54 TiRan_Yang 閱讀數：1150更多

利用Google免費GPU跑深度學習模型

還在為電腦沒有很好的GPU而煩惱麼，這個教程教你隨時利用Colab中的Tesla K80顯示卡跑深度學習模型先從價格上感受下Tesla K80 首先想體驗Colab，必須先學會科學上網，可以利用VPS買國外結點的伺服器，利用Shadowsockes搭梯子，具體教程可以參考其他博主，在此不做贅述。

######好好好，本質#####基於LSTM搭建一個文字情感分類的深度學習模型:準確率往往有95%以上

基於情感詞典的文字情感分類傳統的基於情感詞典的文字情感分類，是對人的記憶和判斷思維的最簡單的模擬，如上圖。我們首先通過學習來記憶一些基本詞彙，如否定詞語有“不”，積極詞語有“喜歡”、“愛”，消極詞語有“討厭”、“恨”等，從而在大腦中形成一個基本的語料庫。然後，我們再對輸入的句子進行最直接

樹莓派執行深度學習模型——深度學習

最近正鼓搗樹莓派，想在樹莓派上跑深度學習，有些坑與技巧，在此記錄一下：樹莓派的python的pip源比較慢，沒找到國內的用於樹莓派的映象，命令列加快網速的工具proxychains； darknet在CPU上是單執行緒的，很坑，暫時的解決方法是使用opencv呼叫dark

關於訓練深度學習模型deepNN時，訓練精度維持固定值，模型不收斂的解決辦法（tensorflow實現）

一、背景最近一直在做人臉表情的識別，用到的程式是之間的一篇文章中的程式：深度學習（一）——deepNN模型實現攝像頭實時識別人臉表情（C++和python3.6混合程式設計）。這裡我只進行了簡單的程式修改。由於該程式是利用fer2013資料集做的，效果不是很好，人臉表情的識別精度僅有70

【電腦科學】【2016】單目視訊三維人體姿態估計的深度學習模型

本文為立陶宛維爾紐斯格迪米納斯技術大學（作者：Agnė Grinciūnaitė）的碩士論文，共68頁。有一種視覺系統，它可以很容易地識別、跟蹤人體的位置、運動和行為，而不需要任何額外的感知手段。這個系統擁有一個稱為大腦的處理器，只經過幾個月的訓練就能稱職地完成以上任務。通過更多

整合學習-模型融合學習筆記（附Python程式碼）

1 整合學習概述整合學習（Ensemble Learning）是一種能在各種的機器學習任務上提高準確率的強有力技術，其通過組合多個基分類器（base classifier）來完成學習任務。基分類器一般採用的是弱可學習（weakly learnable）分類器，通過整合學習

基於深度學習模型Wide&Deep的推薦

本實驗選用資料為UCI開源資料集，僅用於學習，請勿商用） Wide&Deep推薦演算法出自一篇論文《Wide&Deep Learning for RecommenderSystems》，Wide&Deep由兩部分組成，分別是Wide和Deep。先來說wide，表示的是generali

深度學習模型

官方模型 mnist：對來自MNIST資料集的數字進行分類的基本模型。最開始設計出來的目的是用於識別數字，同時也是深度學習的一個樣例。 resnet：一個深度殘差網路，可用於CIFAR-10和ImageNet的1000個類別的資料集進行分類。由於深度學習模型的練習次數達到

OpenCV 3.3版本釋出，載入CAFFE/Darknet深度學習模型

作者：mingo_敏來源：CSDN 原文：https://blog.csdn.net/shanglianlm/article/details/80030569 版權宣告：本文為博主原創文章，轉載請附上博文連結！ OpenCV 3.3版本釋出，對深度學習

【基於深度學習的細粒度分類筆記8】深度學習模型引數量(weights)計算，決定訓練模型最終的大小

Draw_convnet 這幅圖是通過開源的工具draw_convnet(https://github.com/gwding/draw_convnet)生成的。在清楚整個前向計算網路中的每一個層的輸入輸出以及引數設定後可以自己手動畫出計算圖出來，對於引數量計算就很直觀了

深度學習模型評估指標（http://scikit-learn.org/stable/）

在機器學習中，對模型的測量和評估同樣至關重要。只有選擇與問題相匹配的評估方法，我們才能夠快速的發現在模型選擇和訓練過程中可能出現的問題，迭代地對模型進行優化。常見的模型評估指標： precision recall F1-score PRC ROC/AUC

【轉】一些深度學習模型總結

R.T from http://www.deeplearningmodel.net/ Variational Autoencoder Publication: Original VAE paper (2013) Publication: D

關於影像辨識，所有你應該知道的深度學習模型

YOLO: You Only Look OnceYOLO 有個很討喜的名字，取自 You Only Live Once，但用在 Object detection 上則為 You only look once，意思是說 YOLO 模型的特性只需要對圖片作一次 CNN 便能夠判斷裡面的物體類別跟位置，大大提升辨識

用nvidia-docker跑深度學習模型.md

用nvidia-docker跑深度學習模型 ##背景最近實驗室要參加一個目標檢測的比賽，這段時間一直在跑ssd模型，最開始根據作者給的文件成功編譯後，可以在VOC資料集上進行訓練。由於要用比賽官方的資料集，因此做了幾天的資料集，然後拿自己的資料集訓練的時候，

深度學習模型融合stacking

相關推薦