Sklearn常用模型及網格搜尋總結(1)---程式碼

阿新 • • 發佈：2019-01-22

下面總結了一些常用的模型呼叫方法，但是具體的超引數未列舉出來，具體引數還是要查詢API。

方法中都有Classifier（分類）和Regression（迴歸）

常用工具：

from sklearn.model_selection import train_test_split
from sklearn import metrics
import warnings
warnings.filterwarnings("ignore")

model.predict_proba([[0.9]])  #輸出概率

模型評估

acc=metrics.accuracy_score(y_test,pre)  
print(acc)

KNN

from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier()
model.fit(train_x, train_y)

樸素貝葉斯

from sklearn.naive_bayes import MultinomialNB
model = MultinomialNB(alpha=0.01)
model.fit(train_x, train_y)

線性迴歸

from sklearn.linear_model import LogisticRegression
model = LogisticRegression(penalty='l2')
model.fit(train_x, train_y)

GBDT

from sklearn.ensemble import GradientBoostingClassifier
model = GradientBoostingClassifier(n_estimators=200)
model.fit(train_x, train_y)

隨機森林

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(n_estimators=8)
model.fit(train_x, train_y)

支援向量機

from sklearn.svm import SVC
model = SVC(kernel='rbf', probability=True)
model.fit(train_x, train_y)

XGBOOST

import xgboost as xgb
from xgboost.sklearn import XGBClassifier

1、xgb模型訓練

xgb1 = XGBClassifier(
 learning_rate =0.05,
 n_estimators=2800,
 max_depth=5,
 min_child_weight=1,
 gamma=0.21,
 subsample=0.8,
 colsample_bytree=0.75,
 objective= 'binary:logistic',
 nthread=4,
 scale_pos_weight=1,
 seed=27)
print("fiting")
xgb1.fit(X_train,y_train)
pre=xgb1.predict(X_test)
print(pre)
print(y_test)
acc=metrics.accuracy_score(y_test,pre)
print(acc)

2、xgb超參搜尋

param_test1 = {
 'max_depth':range(3,7,2),
 'min_child_weight':range(1,6,2)
}
param_test2 = {
 'max_depth':[4,5,6],
 'min_child_weight':[1,2,3]
}
param_test2b = {
 'min_child_weight':[6,8,10,12]
 }
#[0.0, 0.1, 0.2, 0.3, 0.4]
param_test3 = {
 'gamma':[i/10.0 for i in range(0,5)]
}
param_test3b = {
 'gamma':[0.17,0.18,0.19,0.20,0.21,0.22,0.23,0.24,0.25]
}
param_test4 = {
 'subsample':[i/10.0 for i in range(6,10)],
 'colsample_bytree':[i/10.0 for i in range(6,10)]
}
param_test5 = {
 'subsample':[i/100.0 for i in range(75,90,5)],
 'colsample_bytree':[i/100.0 for i in range(75,90,5)]
}
param_test6 = {
 'reg_alpha':[1e-5, 1e-2, 0.1, 1, 100]
}
param_test7 = {
 'reg_alpha':[0, 0.001, 0.005, 0.01, 0.05]
}
param_test8 = {
 'seed':[24,25,26,27,28]
}
param_test9 = {
 'learning_rate':[0.04,0.05,0.06]
}
gsearch1 = GridSearchCV(estimator =
                        XGBClassifier(
                         learning_rate =0.06,
                         n_estimators=2500,
                         max_depth=6,
                         min_child_weight=1,
                         gamma=0.2,
                         subsample=0.8,
                         colsample_bytree=0.75,
                         objective= 'binary:logistic',
                         nthread=2,
                         scale_pos_weight=1,
                         seed=25),
         param_grid=param_test9,cv=5,verbose=5)
gsearch1.fit(X_train,y_train)
print(gsearch1.best_params_,gsearch1.best_score_)

網格超引數搜尋

from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
model = SVC(kernel='rbf', probability=True)
param_grid = {'C': [1e-3, 1e-2, 1e-1, 1, 10, 100, 1000], 'gamma': [0.001, 0.0001]}
grid_search = GridSearchCV(model, param_grid, n_jobs=1, verbose=1)
grid_search.fit(train_x, train_y)
best_parameters = grid_search.best_estimator_.get_params()
for para, val in list(best_parameters.items()):
    print(para, val)
model = SVC(kernel='rbf', C=best_parameters['C'], gamma=best_parameters['gamma'], probability=True)
model.fit(train_x, train_y)

Sklearn常用模型及網格搜尋總結(1)---程式碼

下面總結了一些常用的模型呼叫方法，但是具體的超引數未列舉出來，具體引數還是要查詢API。方法中都有Classifier（分類）和Regression（迴歸）常用工具：from sklearn.model_selection import train_test_split fr

2.9 線性迴歸演算法學習——kNN模型解決迴歸問題及網格搜尋最優引數

模型引入from sklearn.neighbors import KNeighborsRegressor例項化物件knn_reg=KNeighborsRegressor()訓練資料集knn_reg.fit(X_train,y_train)檢視評估的成績knn_reg.sco

Python+Selenium WebDriver API：瀏覽器及元素的常用函式及變數整理總結

由於網頁自動化要操作瀏覽器以及瀏覽器頁面元素，這裡筆者就將瀏覽器及頁面元素常用的函式及變數整理總結一下，以供讀者在編寫網頁自動化測試時查閱。 from selenium import webdriver driver=webdriver.Firefox()

機器學習：sklearn演算法引數選擇--網格搜尋

機器學習中很多演算法的引數選擇是個比較繁瑣的問題，人工調參比較費時，好在sklearn給我們提供了網格搜尋引數的方法，其實就是類似暴力破解，先設定一些引數的取值，然後通過gridsearch，去尋找這些引數中表現的最好的引數。我們依舊使用上一節的泰坦尼克號生存者預測資料集。同樣使用隨機森林演算

html常用標籤及特殊字元總結

<p>標籤用於在HTML文件裡定義一個段落。瀏覽器在顯示<p>段落時，將在其前後分別插入一個空白行。這些空白是由瀏覽器在呈現網頁時自動加入的，你也可以用樣式表來指定顯示多少空白。標籤描述 <i> 定義斜體文字 <b> 定

sklearn 常用模組及類與方法

preprocessing StandardScalerLabelEncoderOneHotEncodermodel_selection train_test_split（新版本從 cross_validation 移步於此）decomposition PCAlinear_model： LogisticReg

Myeclipse 常用設定及常見問題總結

window--->Preferences--->General---->Editor--->File Associations------>File Type裡面點選add一種檔案型別（比如 *.ini）--->Associated editors--->

模型調參-網格搜尋Sklearn應用

網格搜尋的思想很直觀，sklearn中有封裝好的函式供呼叫。 1. 版本資訊 Python和sklearn的版本資訊如下: 1. Python版本 3.6.3 Anaconda 2. Sklearn版本 0.19.1 2. 引數 2.1 輸入引數

常用正則表達式爬取網頁信息及HTML分析總結

logfile mpi 開始 order 標題 ear 爬取網頁常用 enter Python爬取網頁信息時，經常使用的正則表達式及方法。 1.獲取<tr></tr>標簽之間內容 2.獲取<a href..></a>超鏈接

Ubuntu kylin常用總結1

mail ubuntu art 查看 ger 終端命令 logs 錯誤 linu 1、常用的linux終端命令快捷鍵 Ctrl+U ：剪切光標前的內容Ctrl+K ：剪切光標至行末內容Ctrl+Y ：粘貼Ctrl+E ：移動光標至行末Ctrl+A ：移

項目總結(3.DIBR技術項目總結(1.TOF相機及標定相關))

wan html dib ges img 項目總結 csdn sdn bsp 1.定義： http://blog.csdn.net/lavendarwang/article/details/20729595 項目總結(3.DIBR技術項目總結(1.TOF相機及標定相關)

常用jquery小技能總結1

選中 selector sele select app document find ted 點擊 1使文檔加載好再執行JS $(document).ready(function(){ }); 2通過點擊引發的事件 $(".btn").click(function(){

（持續更新）瀏覽器兼容性總結—之前端開發常用屬性及api

ott 內置事件 move min-width line 顏色漸變效果瀏覽器兼容性 :hover max-width，min-width ie7以上支持 rgba 只支持ie9及以上瀏覽器，ie8要用濾鏡處理 border-radius 也只支持ie9以上不需

模型調參-網格搜尋

調參中的引數是指模型本身的超引數，而不是求解目標函式可以得到的引數解析解。常用的方法是網格搜尋，所謂的網格搜尋可以理解成窮舉法。而現實中，我們往往不能窮舉所有的引數的組合。因此需要對部分引數，在一定範圍內調參。具體的調參邏輯依賴於引數在不同演算法中的數學含義。本文簡單介紹網格搜尋的邏

Linux常用命令總結-1---阿甘講師原創

1、cd命令•解釋：改變使用者當前目錄cd 進入當前使用者的家目錄 cd 目錄名進入目錄 cd .. 一級一級的退出 cd / 直接退出到根 2、ls 檢視當前路徑下的內容，不包含隱藏檔案 ls -a 檢視所有檔案，包含隱藏檔案 ls -l 檢視檔案的詳細資訊 3、whoami 列出當前使用

sklearn之模型評估指標總結歸納

文章目錄機器學習模型評估分類模型迴歸模型聚類模型交叉驗證中指定scoring引數網格搜尋中應用機器學習模型評估以下方法，sklearn中都在

學習筆記（七）模型的調參之網格搜尋和交叉驗證的簡單應用

學習筆記（七）模型的調參之網格搜尋和交叉驗證的簡單應用資料概述交叉驗證 1. Cross——Validation 交叉驗證 2. k折交叉驗證（kfold） 3.留一法Leave-one-out Cross-validation

mysql查看錶結構資訊需求背景是給一個表名然後給出相應的表結構資訊及索引資訊常用的命令有如下： 1. desc tableName; desc employees.employees; 2. sh

需求背景是給一個表名然後給出相應的表結構資訊及索引資訊常用的命令有如下： 1. desc tableName; desc employees.employees; 2. show columns from tableName; show COLUMNS from employees.employe

關於sklearn中的網格搜尋（調參）

官方來源：http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html#sklearn.model_selection.GridSearchCV http://scikit-l

GM(1,1)灰色預測模型及matlab程式碼

原理 https://blog.csdn.net/zxiang248/article/details/72833016/ 例項程式碼 clc;clear; %建立符號變數a(發展係數)和b(灰作用量) syms a b; c = [a b]'; %原始數列 A A =

Sklearn常用模型及網格搜尋總結(1)---程式碼

相關推薦