1. 程式人生 > >評估深度學習模型-在keras中使用scikit-learn-基於keras的python學習筆記(三)

評估深度學習模型-在keras中使用scikit-learn-基於keras的python學習筆記(三)

版權宣告:本文為博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/weixin_44474718/article/details/86249827

使用交叉驗證評估模型

KerasClassifier和kerasregressor
類使用引數build_fn,指定用來建立模型的函式的名稱。因此,必須定義一個函式,並通過函式來定義深度學習的模型,編譯並返回它。在下面的例子中,定義了利用create_model()函式來建立一個簡單的多層神經網路。

函式解釋:

 cross_val_score(estimator, 
                    X, 
                    y=None,
                    groups=None, 
                    scoring=None,
                    cv=None, 
                    verbose=0, 
                    fit_params=None,
                    pre_dispatch='2*n_jobs')

estimator:選用的學習器的例項物件,包含“fit”方法;
X :特徵陣列
y : 標籤陣列
groups:如果資料需要分組取樣的話
scoring :評價函式
cv:交叉驗證的k值,當輸入為整數或者是None,估計器是分類器,y是二分類或者多分類,採用StratifiedKFold 進行資料劃分文字
fit_params:字典,將估計器中fit方法的引數通過字典傳遞

keras.wrappers.scikit_learn.KerasClassifier(build_fn=None, **sk_params), 這實現了Scikit-Learn 分類器介面,
keras.wrappers.scikit_learn.KerasRegressor(build_fn=None, **sk_params),

這實現了Scikit-Learn 迴歸介面。

引數

build_fn: 可呼叫函式或類例項
sk_params: 模型引數和擬合引數
參考keras中文幫助文件:https://keras.io/zh/scikit-learn-api/#_1

from keras.models import Sequential
from keras.layers import Dense
import numpy as np
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import StratifiedKFold
from
keras.wrappers.scikit_learn import KerasClassifier # 構建模型 def create_model(): # 構建模型 model = Sequential() model.add(Dense(units=12, input_dim=8, activation='relu')) model.add(Dense(units=8, activation='relu')) model.add(Dense(units=1, activation='sigmoid')) # 編譯模型 model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy']) return model seed = 7 # 設定隨機數種子 np.random.seed(seed) # 匯入資料 dataset = np.loadtxt('pima-indians-diabetes.csv', delimiter=',') # 分割輸入x和輸出Y x = dataset[:, 0 : 8] Y = dataset[:, 8] #建立模型 for scikit-learn model = KerasClassifier(build_fn=create_model, epochs=150, batch_size=10, verbose=0) # 10折交叉驗證 kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=seed) results = cross_val_score(model, x, Y, cv=kfold) print(results.mean())

這個例子運行了三分鐘!!!(可能我電腦真的太差了)