09.尋找最好的超引數

阿新 • • 發佈：2020-11-26

import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

1、獲取資料

digits = datasets.load_digits()
X = digits.data
y  
= digits.target

2、分割資料,得到訓練集和測試集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=666)

3、手動尋找

# def temp():
    # knn_clf = KNeighborsClassifier(3)
    # knn_clf.fit(X_train, y_train)
    # y_predict = knn_clf.predict(X_test)
    # accuracy_score(y_test, y_predict) 


    # # 尋找最好的k
    # best_score = 0.0
    # best_k = -1
    # for k in range(1,11):
    #     knn_clf = KNeighborsClassifier(k)
    #     knn_clf.fit(X_train, y_train)
    #     y_predict = knn_clf.predict(X_test)
    #     score= accuracy_score(y_test, y_predict)
    #     if score > best_score: 

    #         best_k = k
    #         best_score = score
    # print("best_k:", best_k)
    # print("best_score:", best_score)

    # # 考慮距離？不考慮距離?
    # best_method = ""
    # best_score = 0.0
    # best_k = -1
    # for method in ["uniform", "distance"]:
    #     for k in range(1,11):
    #         knn_clf = KNeighborsClassifier(n_neighbors=k, weights=method)
    #         knn_clf.fit(X_train, y_train)
    #         y_predict = knn_clf.predict(X_test)
    #         score= accuracy_score(y_test, y_predict)
    #         if score > best_score:
    #             best_k = k
    #             best_score = score
    #             best_method = method
    # print("best_k:", best_k)
    # print("best_score:", best_score)
    # print("best_method:", best_method)
    # # # 探索明可夫斯基距離相應的p

    # # 尋找最好的超引數 Grid Search

3、超引數配置

param_grid = [
    {
        "weights":["uniform"],
        "n_neighbors":[i for i in range(1,11)]
    },
    {
        "weights":["distance"],
        "n_neighbors":[i for i in range(1,11)],
        "p":[i for i in range(1,6)]
    }]

4、例項化分類器

knn_clf = KNeighborsClassifier()

5、為分類器和超引數搭建模型

from sklearn.model_selection import GridSearchCV
grid_search = GridSearchCV(knn_clf, param_grid, n_jobs=-1, verbose=2)

6、例項化模型(多種引數配置的分類器)fit訓練集

# 本質上是將訓練集進一步分為訓練集和測試集,得到最好的引數配置
# 因為要不斷嘗試各種引數交叉驗證,所以非常耗時

grid_search.fit(X_train, y_train)

7、最終拿到最佳引數配置分類器 best_estimator_

knn_clf = grid_search.best_estimator_

8、使用最佳分類器對測試集預測

y_predict = knn_clf.predict(X_test)

9、列印準確率

print(accuracy_score(y_test, y_predict))

09.尋找最好的超引數

import numpy as np import matplotlib import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_selection import train_test_split

OpenCV python sklearn隨機超引數搜尋的實現

本文介紹了OpenCV python sklearn隨機超引數搜尋的實現，分享給大家，具體如下：

使用TensorBoard進行超引數優化的實現

在本文中，我們將介紹超引數優化，然後使用TensorBoard顯示超引數優化的結果。

GridSearchCV網格搜尋得到最佳超引數, 在K近鄰演算法中的應用

　　最近在學習機器學習中的K近鄰演算法,KNeighborsClassifier 看似簡單實則裡面有很多的引數配置, 這些引數直接影響到預測的準確率. 很自然的問題就是如何找到最優引數配置? 這就需要用到GridSearchCV 網格搜尋模型

sklearn.model_selection.RandomizedSearchCV隨機搜尋超引數

GridSearchCV可以保證在指定的引數範圍內找到精度最高的引數，但是這也是網格搜尋的缺陷所在，它要求遍歷所有可能引數的組合，在面對大資料集和多引數的情況下，非常耗時。這也是我通常不會使用GridSearchCV的原因，

機器學習4個常用超引數除錯方法

ML工作流中最困難的部分之一是為模型找到最好的超引數。ML模型的效能與超引數直接相關。超引數調優的越好，得到的模型就越好。調優超引數可能是非常乏味和困難的，更像是一門藝術而不是科學。

04-超引數

超引數超引數：可以簡單的理解為執行機器學習演算法之前需要指定的這個引數，kNN 演算法中的 k 就是一個最為典型的超引數。

05-網格搜尋與k近鄰演算法中更多超引數

在上一篇部落格中介紹瞭如何使用網格搜尋的方式來尋找機器學習演算法中最好的超引數。不過我們網格搜尋的過程是使用自己寫的 for 迴圈，在這個過程中，我們發現對於一些超引數而言，它們是存在相互依賴

模型中的超引數（batch_size、epoch、batch）

# epoch： 1個epoch指用訓練集中的全部樣本訓練一次，此時相當於batch_size 等於訓練集的樣本數。

使用keras為什麼accuracy一直為0_Keras乾貨|神經網路模型超引數調優

技術標籤：使用keras為什麼accuracy一直為0 在目前神經網路超引數調整的研究中，tensorflow/keras社群開發出了一款自動化調參工具 keras-tuner，通過keras-tuner我們在使tensorflow/keras 進行工程實踐時，在

吳恩達深度學習課件_吳恩達深度學習筆記02.改善深層神經網路 W3.超引數除錯、Batch Norm和程式框架...

技術標籤：吳恩達深度學習課件 1. 除錯處理2. 為超引數選擇合適的範圍3. 超引數除錯的實踐4. 歸一化網路的啟用函式5. 將 Batch Norm 擬合進神經網路6. Batch Norm 為什麼奏效7. 測試時的 Batch Norm8. Softmax

三種超引數優化方法詳解，以及程式碼實現

超引數調優方法：網格搜尋，隨機搜尋，貝葉斯優化等演算法。 1、分別對幾種調有方法進行了實驗，實驗初始資料如下：

Ng深度學習筆記超引數除錯和Batch正則化

超引數除錯與batch正則化除錯處理（Tuning process）為超引數選擇合適的範圍（Using an appropriate scale to pick hyperparameters）超引數除錯的實踐歸一化網路的啟用函式將 Batch Norm 擬合進神經網路

拓端tecdat|R語言進行支援向量機迴歸SVR和網格搜尋超引數優化

原文連結：http://tecdat.cn/?p=23305 原文出處：拓端資料部落公眾號在這篇文章中，我將展示如何使用R語言來進行支援向量迴歸SVR。

超引數優化器 - GridSearchCV（網格搜尋）

為了在資料集上訓練不同的模型並且選擇效能最佳的模型，有時候雖然仍有改進的餘地，因為我們不會肯定地說這個特定模型最合適解決手頭的問題。因此，我們的目標是以任何可能的方式改進模型，影響這些模型效能的一個重

tensorflow中過擬合以及網路超引數的選擇例項筆記

import tensorflow as tf import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline

機器學習最困難的部分：超引數除錯

介紹　　維基百科上說，“Hyperparameter optimization或tuning是為學習演算法選擇一組最優的hyperparameters的問題”。

拓端tecdat：Python整合機器學習：用AdaBoost、決策樹、邏輯迴歸整合模型分類和迴歸和網格搜尋超引數優化

原文連結：http://tecdat.cn/?p=24231 原文出處：拓端資料部落公眾號 Boosting 是一類整合機器學習演算法，涉及結合許多弱學習器的預測。

09.express接受請求引數

傳參問題 1. get方式接受請求引數 get方式請求的引數會拼接在位址列的後面，引數的格式是?name=value&name=value...

機器學習中的超引數優化

筆記。超引數搜尋機器學習中四種調參方法總結 (qq.com) 超引數是在建立模型時用於控制演算法行為的引數。這些引數不能從常規訓練過程中獲得。在對模型進行訓練之前，需要對它們進行賦值。

09.尋找最好的超引數

相關推薦