用 Grid Search 對 SVM 進行調參

阿新 • • 發佈：2019-01-11

上一次用了驗證曲線來找最優超引數。

今天來看看網格搜尋(grid search)，也是一種常用的找最優超引數的演算法。

網格搜尋實際上就是暴力搜尋：
首先為想要調參的引數設定一組候選值，然後網格搜尋會窮舉各種引數組合，根據設定的評分機制找到最好的那一組設定。

以支援向量機分類器 SVC 為例，用 GridSearchCV 進行調參：

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from 
 sklearn.metrics import classification_report
from sklearn.svm import SVC

1. 匯入資料集，分成 train 和 test 集：

digits = datasets.load_digits()

n_samples = len(digits.images)
X = digits.images.reshape((n_samples, -1))
y = digits.target

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.5 
, random_state=0)

2. 備選的引數搭配有下面兩組，並分別設定一定的候選值：
例如我們用下面兩個 grids：
kernel＝’rbf’, gamma, ‘C’
kernel＝’linear’, ‘C’

tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4],
                     'C': [1, 10, 100, 1000]},
                    {'kernel': ['linear'], 'C': [1, 10, 100, 1000]}]

3. 定義評分方法為：

scores = ['precision' 
, 'recall']

4. 呼叫 GridSearchCV，

將 SVC(), tuned_parameters, cv=5, 還有 scoring 傳遞進去，
用訓練集訓練這個學習器 clf，
再呼叫 clf.best_params_ 就能直接得到最好的引數搭配結果，

例如，在 precision 下，
返回最好的引數設定是：{'C': 10, 'gamma': 0.001, 'kernel': 'rbf'}

還可以通過 clf.cv_results_ 的 ‘params’，’mean_test_score’，看一下具體的引數間不同數值的組合後得到的分數是多少：
結果中可以看到最佳的組合的分數為：0.988 (+/-0.017)

還可以通過 classification_report 列印在測試集上的預測結果 clf.predict(X_test) 與真實值 y_test 的分數：

for score in scores:
    print("# Tuning hyper-parameters for %s" % score)
    print()

     # 呼叫 GridSearchCV，將 SVC(), tuned_parameters, cv=5, 還有 scoring 傳遞進去，
    clf = GridSearchCV(SVC(), tuned_parameters, cv=5,
                       scoring='%s_macro' % score)
    # 用訓練集訓練這個學習器 clf
    clf.fit(X_train, y_train)

    print("Best parameters set found on development set:")
    print()

    # 再呼叫 clf.best_params_ 就能直接得到最好的引數搭配結果
    print(clf.best_params_)

    print()
    print("Grid scores on development set:")
    print()
    means = clf.cv_results_['mean_test_score']
    stds = clf.cv_results_['std_test_score']

    # 看一下具體的引數間不同數值的組合後得到的分數是多少
    for mean, std, params in zip(means, stds, clf.cv_results_['params']):
        print("%0.3f (+/-%0.03f) for %r"
              % (mean, std * 2, params))

    print()

    print("Detailed classification report:")
    print()
    print("The model is trained on the full development set.")
    print("The scores are computed on the full evaluation set.")
    print()
    y_true, y_pred = y_test, clf.predict(X_test)

    # 列印在測試集上的預測結果與真實值的分數
    print(classification_report(y_true, y_pred))

    print()

用 Grid Search 對 SVM 進行調參

上一次用了驗證曲線來找最優超引數。今天來看看網格搜尋(grid search)，也是一種常用的找最優超引數的演算法。網格搜尋實際上就是暴力搜尋：首先為想要調參的引數設定一組候選值，然後網

利用Grid Search進行調參

Grid Search是咩？即，網格搜尋，是一種自動調參的方法。為想要調參的引數設定一組候選值，然後網格搜尋會窮舉各種引數組合，根據設定的評分機制找到最好的那一組設定，主要用於系統地遍歷多種引數組合，通過交叉驗證確定最佳效果引數。缺點：這個方法適合於小資料集，一旦資料的量級上去

通過python調用adb命令對app進行測試啟動/停止app

turn -c 構造方法 PE ram split shell pytho time 轉於博客 https://blog.csdn.net/sunfengye/article/details/77498935 yipianfeng_ye的專 #啟動apk messa

使用交叉驗證對鳶尾花分類模型進行調參(超參數)

www. eight data svc ans 分塊分類 app files 如何選擇超參數：交叉驗證：如圖，大訓練集分塊，使用不同的分塊方法分成N對小訓練集和驗證集。使用小訓練集進行訓練，使用驗證集進行驗證，得到準確率，求N個驗證集上的平均正確率；使用平均

JavaSE8基礎鏈式編程調用方法返回對象再調方法簡單示例

ima jdk win dem 鏈式教程 hello world log os ：windows7 x64 jdk：jdk-8u131-windows-x64 ide：Eclipse Oxygen Release (4.7.0) 代碼：

用各種工具對資料進行分類彙總

資料分類彙總的方法有很多種，工具也有很多，這次為大家一一介紹，各種工具如何進行分類彙總，大家自行判斷，覺得哪種最好用，就用哪種，畢竟工具不重要，高效出結果才最重要。為了方便舉例，所用的資料集就是鸞尾花資料集，5個欄位（Sepal.Length、Sepal.Width、Petal.Length、P

用luks方式對磁碟進行加密以及加密磁碟的自動掛載

1.關於luks加密 LUKS(Linux Unified Key Setup)為Linux硬碟分割槽加密提供了一種標準，它不僅能通用於不同的 Linux發行版本，還支援多使用者/口令。因為它的加密金鑰獨立於口令，所以如果口令失密，我們可以迅速改變口

python用sort()函式對列表進行排序，從最後一個元素開始判斷

直接上程式碼： a = [1, 2, 3, 4, 4, 5, 6, 7, 7, 9, 0]a.sort()last = a[-1]for i in range(len(a)-2, -1, -1): if last == a[i]: del a[i] else: las

【文字聚類】用k-means對文字進行聚類

# -*- coding: utf-8 -*- """ Created on Thu Nov 16 10:08:52 2017 @author: li-pc """ import jieba fr

【Machine Learning】通過網格搜尋進行調參

在我們日常的進行超引數優化工作時，可以手動去試，也可以使用隨機搜尋、批量隨機搜尋和網格搜尋等方法調到好的引數，關於網格搜尋，sklearn中GridSearchCV用於系統地遍歷多種引

什麽情況下用+運算符進行字符串連接比調用StringBuffer/StringBuilder對象的append方法連接字符串性能更好？

字符串拼接 build 字符串字符串連接操作重新運算運算符對象存儲 String一旦賦值或實例化後就不可更改，如果賦予新值將會重新開辟內存地址進行存儲。而StringBuffer類使用append和insert等方法改變字符串值時只是在原有對象存儲的內存地址上進

android黑科技系列——分析某直播App的協議加密原理以及調用加密方法進行協議參數構造

輸出結果防護返回不能定義類多個類型所在文件中一、前言隨著直播技術火爆之後，各家都出了直播app，早期直播app的各種請求協議的參數信息都沒有做任何加密措施，但是慢慢的有人開始利用這個後門開始弄刷粉關註工具，可以讓一個新生的小花旦分分鐘變成網紅。所以介於

調用FFmpeg SDK對YUV視頻序列進行編碼

blog -a 51cto fcc ext pro 分享 fab img 由於作者不習慣該編輯器，只是將本文的截圖貼了出來，詳文見：https://www.yuque.com/docs/share/e2ff9da8-678d-49c6-ac9a-ca0f654d3f73調

調用FFmpeg SDK對H.264格式的視頻壓縮碼流進行解碼

b- follow 分享圖片 vpd fff proc ofo com 進行由於作者不習慣該編輯器，只是將本文的截圖貼了出來，詳文見：https://www.yuque.com/docs/share/cce69b1b-b619-44b5-acd1-efa229d8862

【轉】分類/迴歸模型評估—ROC,AUC,RMSE等指標/調參—Grid Search

看到此篇文章內容乾貨較多，轉載過來學習。連結：https://www.52ml.net/20410.html 模型評估的方法一般情況來說，F1評分或者R平方(R-Squared value)等數值評分可以告訴我們訓練的機器學習模型的好壞。也有

如何使用hyperopt對xgboost進行自動調參

本教程重點在於傳授如何使用Hyperopt對xgboost進行自動調參。但是這份程式碼也是我一直使用的程式碼模板之一，所以在其他資料集上套用該模板也是十分容易的。同時因為xgboost，lightgbm，catboost。三個類庫呼叫方法都比較一致，所以在本部分結束之後，我們有理由

java創建一個子類對象是會調用父類的構造方法會不會創建父類

進行 eight 實現知識創建 mod 不一定調用構造方法結構 1、子類在創建實例後，類初始化方法會調用父類的初始化方法(除了Java.lang.Object類，因為java.lang.Object類沒有父類)，而這種調用會逐級追述，直到java.lang.Obj

用block變量來對字符數組對象進行排序

mil 升序進行 mutable ted ear string sorted hit <span style="font-size:18px;">降序排序</span><span style="font-

QT下實現對Linux Shell調用的幾種方法

nes running qprocess -o test main new rest ring 使用QProcess QThread ============================================ #include <QProcess&

對中間過程進行調試

調試 del caffe roc 生成 director set multi target 這是觀測stage2生成的rpn情況的代碼： #!/usr/bin/env python # ------------------------------------------

用 Grid Search 對 SVM 進行調參

相關推薦