關於CV調參GridSearchCV

阿新 • • 發佈：2019-02-08

首先需要介紹的工具是sklearn的模型選擇API(GridSearchCV)

第一節：GridSearchCV函式的用法

sklearn.grid_search.GridSearchCV(
	estimator, # 是你要訓練的模型booster
	param_grid, # 字典型別的params 需要選擇的超參
	scoring=None, # 評判效能好壞的標準 如auc: scoring='roc_auc'
	fit_params=None, 
	n_jobs=1, # 並行執行的作業數
	iid=True, 
	refit=True, 
	cv=None, # 訓練集與驗證集的比值，相當於nfold=5
	verbose=0, 
	pre_dispatch='2*n_jobs', 
	error_score='raise'
)

一個簡單的例子如下：

#-*- coding:utf-8 -*-
import pandas as pd
from sklearn import svm, datasets
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report

iris = datasets.load_iris()
# 待調整的超引數
parameters = {
	'kernel':('linear', 'rbf'), 
	'C':[1, 2, 4], 
	'gamma':[0.125, 0.25, 0.5 ,1, 2, 4]
}
svr = svm.SVC() # 模型
clf = GridSearchCV( svr, parameters, n_jobs=4 )
clf.fit(iris.data, iris.target) #你和模型
# clf.cv_results_ 是選擇引數的日誌資訊
cv_result = pd.DataFrame.from_dict( clf.cv_results_ )
with open('./data/cv_result.csv','wb') as f: cv_result.to_csv(f)
print 'The parameters of the best model are: '
print  clf.best_params_  # 打印出最合適的模型引數
y_pred_array = clf.predict(iris.data) # 預測結果
print classification_report( y_true=iris.target, y_pred=y_pred_array )

其中 print clf.best_params_ 會列印如下資訊，這是最優引數

{'kernel': 'linear', 'C': 2, 'gamma': 0.125}

print classification_report( y_true=iris.target, y_pred=y_pred_array ) 會列印如下結果

             precision    recall  f1-score   support

          0       1.00      1.00      1.00        50
          1       1.00      0.94      0.97        50
          2       0.94      1.00      0.97        50

avg / total       0.98      0.98      0.98       150

第二節：lightGBM使用GridSearchCV調參

LGBMRegressor可以呼叫的引數配置如下

lightgbm.sklearn.LGBMRegressor( 
    boosting_type='gbdt', 
    num_leaves=31, 
    max_depth=-1, 
    learning_rate=0.1, 
    n_estimators=10, 
    max_bin=255, 
    subsample_for_bin=50000, 
    objective='regression', 
    min_split_gain=0, 
    min_child_weight=5, 
    min_child_samples=10, 
    subsample=1, 
    subsample_freq=1, 
    colsample_bytree=1, 
    reg_alpha=0, 
    reg_lambda=0, 
    seed=0, 
    nthread=-1, 
    silent=True, 
    huber_delta=1.0, 
    gaussian_eta=1.0, 
    fair_c=1.0, 
    poisson_max_delta_step=0.7, 
    drop_rate=0.1, 
    skip_drop=0.5, 
    max_drop=50, 
    uniform_drop=False, 
    xgboost_dart_mode=False
)

關於CV調參GridSearchCV

首先需要介紹的工具是sklearn的模型選擇API(GridSearchCV) 第一節：GridSearchCV函式的用法 sklearn.grid_search.GridSearchCV( estimator, # 是你要訓練的模型booster param_gr

sklearn學習8-----GridSearchCV(自動調參）

ssi 9.png 訓練全局默認值並行任務圖片 tcl 列表一、GridSearchCV介紹：自動調參，適合小數據集。相當於寫一堆循環，自己設定參數列表，一個一個試，找到最合適的參數。數據量大可以使用快速調優的方法-----坐標下降【貪心，拿當前對模型影響最大的

[調參]CV煉丹技巧/經驗

轉自：https://www.zhihu.com/question/25097993 我和@楊軍類似, 也是半路出家. 現在的工作內容主要就是使用CNN做CV任務. 幹調參這種活也有兩年時間了. 我的回答可能更多的還是側重工業應用, 技術上只限制在CNN這塊. 先說下我的觀點, 調參就是tria

GridSearchCV 與 RandomizedSearchCV 調參

好久沒寫部落格了，原因是最近比較忙，一下報了兩個比賽，今天終於最後一個比賽的初賽都結束了，抽點小空趕緊總結一下，先彙報下成績吧。IJCAI2018 阿里媽媽廣告演算法大賽，初賽第六。FASHIONAI屬性識別大賽初賽25 。複賽加油，爭取取得更好的成績。昨天和前天都

【演算法_調參】sklearn_GridSearchCV,CV調節超參使用方法

GridSearchCV 簡介：GridSearchCV，它存在的意義就是自動調參，只要把引數輸進去，就能給出最優化的結果和引數。但是這個方法適合於小資料集，一旦資料的量級上去了，很難得出結果。這個時候就是需要動腦筋了。資料量比較大的時候可以使用一個快速調優的方法——座標下降

XGBoost調參

zju blog gradient web tab www log .cn sting http://scikit-learn.org/stable/modules/ensemble.html#gradient-tree-boosting https://m.th7.cn/

python調參神器hyperopt

條件 ssi als sha time ans 模擬退火中間 adf 一、安裝 pip install hyperopt 二、說明 Hyperopt提供了一個優化接口，這個接口接受一個評估函數和參數空間，能計算出參數空間內的一個點的損失函數值。用戶還要指定空間內參數的分布

回發或回調參數無效 “HtmlSelect”不能有類型為“LiteralControl”的子級

工具 form -1 rop als net 回調 cit city 原文發布時間為：2009-11-14 —— 來源於本人的百度文章 [由搬家工具導入]回发或回调参数

51nod_1459 最短路 dijkstra 特調參數

return == false 心算 void log con pan tdi 好多基礎知識都沒補完，只好看到、用到一個趕緊補全一個，並且保證下次需要的時候直接用，不用回來再補；其實這個算法是在補同余最短路的時候用到的，當時突然發現理解算法導論上的原理甚至有效性證明，但是

調參tips

blog ros cli div bsp radi lar tips optimize 1. 對w進行初始化 2. clip gradients 1 optimizer.zero_grad() 2 logit = model(feature) 3 loss = F.cr

基於pytorch的CNN、LSTM神經網絡模型調參小結

shu 結合手動 ces hid open ont 16px nbsp （Demo）這是最近兩個月來的一個小總結，實現的demo已經上傳github，裏面包含了CNN、LSTM、BiLSTM、GRU以及CNN與LSTM、BiLSTM的結合還有多層多通道CNN、LSTM

【技術翻譯】支持向量機簡明教程及其在python和R下的調參

sel machine 線性線上 ont 投影 vars 不一定 .cn 原文: Simple Tutorial on SVM and Parameter Tuning in Python and R 介紹數據在機器學習中是重要的一種任務，支持向量機(SVM)

Python中Gradient Boosting Machine(GBM）調參方法詳解

損失函數二叉樹 lai 打印探索 for tails 提示原本原文地址：Complete Guide to Parameter Tuning in Gradient Boosting (GBM) in Python by Aarshay Jain 原文翻譯與校對：@

調參必備---GridSearch網格搜索

過程 pos 評估分享 score 問題： str select 好的什麽是Grid Search 網格搜索？ Grid Search：一種調參手段；窮舉搜索：在所有候選的參數選擇中，通過循環遍歷，嘗試每一種可能性，表現最好的參數就是最終的結果。其原理就像是在數組裏找最

隨機森林和決策樹調參

blog 每次抽樣單獨的數回歸函數現在推薦訓練隨機森林隨機森林的“隨機”體現在兩個部分：使用boostrap隨機抽樣（通俗點說就是有放回的隨機抽樣），假設原先數據集有N個樣本，每次仍然抽出來N個樣本，進行M次抽樣，組成M個數據集（也就是抽M次，

集成學習lgb庫調參的粒子群方法

機器學習算法集成學習粒子群算法是模擬鳥群蜂群的覓食行為的一種算法。基本思想是通過群體中個體之間的協作和信息共享來尋找最優解。試著想一下一群鳥在尋找食物，在這個區域中只有一只蟲子，所有的鳥都不知道食物在哪。但是它們知道自己的當前位置距離食物有多遠，同時它們知道離食物最近的鳥的位置。想一下這時候

對xgboost和lightgbm的理解及其調參應該關註的點

analytic 精度 PE sam 訓練 pick import 構建 oos 這兩個算法都是集成學習了分類回歸樹模型，先討論是怎麽集成的。集成的方法是 Gradient Boosting比如我要擬合一個數據如下：第一次建了一個模型如上圖中的折線，效果不是很理想，然後要

RandomForest 調參

防止 car val 輸入決策 amp str entropy 最小值在scikit-learn中，RandomForest的分類器是RandomForestClassifier，回歸器是RandomForestRegressor，需要調參的參數包括兩部分，第一部分是B

深度學習（十）訓練時的調參技巧

檢查 learning 結果需要 html gradient 過擬合 iba left 訓練過程中需要適時的調整參數，以獲得比較好的模型，下面介紹幾種調參方式：參數初始化初始化參數對結果的影響至關重要，要引起重視 Xavier 　　　　　　權重初始化太大容易

Hyperopt調參時: ‘generator‘ object is not subs

ima 解決支持 vpd strong watermark 不支持 pro log 原因與解決方案思考 :pip 裝的時候就有警告，所以最先考慮的是類庫問題,但是是在找不到是那個類庫的問題,查了Hyperopt源碼也沒什麽用.大概僵持了二十分鐘,決定還是去Githu

關於CV調參GridSearchCV

第一節：GridSearchCV函式的用法

第二節：lightGBM使用GridSearchCV調參

相關推薦