sklearn 神經網路MLPclassifier引數詳解

阿新 • • 發佈：2018-11-03

class sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(100, ), activation=’relu’, solver=’adam’, alpha=0.0001, 
batch_size=’auto’, learning_rate=’constant’, learning_rate_init=0.001, power_t=0.5, max_iter=200, shuffle=True,
 random_state=None, tol=0.0001, verbose=False, warm_start=False, momentum=0.9, nesterovs_momentum=True, 
 early_stopping=False, validation_fraction=0.1, beta_1=0.9, beta_2=0.999, epsilon=1e-08, n_iter_no_change=10)[source]

引數	備註
hidden_layer_sizes	tuple，length = n_layers - 2，預設值（100，）第i個元素表示第i個隱藏層中的神經元數量。
啟用	{‘identity’，‘logistic’，‘tanh’，‘relu’}，預設’relu’ 隱藏層的啟用函式：‘identity’，無操作啟用，對實現線性瓶頸很有用，返回f（x）= x；‘logistic’，logistic sigmoid函式，返回f（x）= 1 /（1 + exp（-x））；‘tanh’，雙曲tan函式，返回f（x）= tanh（x）；‘relu’，整流後的線性單位函式，返回f（x）= max（0，x）
slover	{‘lbfgs’，‘sgd’，‘adam’}，預設’adam’。權重優化的求解器：'lbfgs’是準牛頓方法族的優化器；'sgd’指的是隨機梯度下降。'adam’是指由Kingma，Diederik和Jimmy Ba提出的基於隨機梯度的優化器。注意：預設解算器“adam”在相對較大的資料集（包含數千個訓練樣本或更多）方面在訓練時間和驗證分數方面都能很好地工作。但是，對於小型資料集，“lbfgs”可以更快地收斂並且表現更好。
alpha	float，可選，預設為0.0001。L2懲罰（正則化項）引數。
batch_size	int，optional，預設’auto’。用於隨機優化器的minibatch的大小。如果slover是’lbfgs’，則分類器將不使用minibatch。設定為“auto”時，batch_size = min（200，n_samples）
learning_rate	{‘常數’，‘invscaling’，‘自適應’}，預設’常數"。用於權重更新。僅在solver ='sgd’時使用。'constant’是’learning_rate_init’給出的恆定學習率；'invscaling’使用’power_t’的逆縮放指數在每個時間步’t’逐漸降低學習速率learning_rate_， effective_learning_rate = learning_rate_init / pow（t，power_t）；只要訓練損失不斷減少，“adaptive”將學習速率保持為“learning_rate_init”。每當兩個連續的時期未能將訓練損失減少至少tol，或者如果’early_stopping’開啟則未能將驗證分數增加至少tol，則將當前學習速率除以5。
learning_rate_init	double，可選，預設為0.001。使用初始學習率。它控制更新權重的步長。僅在solver ='sgd’或’adam’時使用。
power_t	double，可選，預設為0.5。反縮放學習率的指數。當learning_rate設定為“invscaling”時，它用於更新有效學習率。僅在solver ='sgd’時使用。
max_iter	int，optional，預設值200。最大迭代次數。solver迭代直到收斂（由’tol’確定）或這個迭代次數。對於隨機解算器（‘sgd’，‘adam’），請注意，這決定了時期的數量（每個資料點的使用次數），而不是梯度步數。
shuffle	bool，可選，預設為True。僅在solver ='sgd’或’adam’時使用。是否在每次迭代中對樣本進行洗牌。
random_state	int，RandomState例項或None，可選，預設無隨機數生成器的狀態或種子。如果是int，則random_state是隨機數生成器使用的種子;如果是RandomState例項，則random_state是隨機數生成器;如果為None，則隨機數生成器是np.random使用的RandomState例項。
tol	float，optional，預設1e-4 優化的容忍度，容差優化。當n_iter_no_change連續迭代的損失或分數沒有提高至少tol時，除非將learning_rate設定為’adaptive’，否則認為會達到收斂並且訓練停止。
verbose	bool，可選，預設為False 是否將進度訊息列印到stdout。
warm_start	bool，可選，預設為False，設定為True時，重用上一次呼叫的解決方案以適合初始化，否則，只需擦除以前的解決方案。請參閱詞彙表。
momentum	float，預設0.9，梯度下降更新的動量。應該在0和1之間。僅在solver ='sgd’時使用。
nesterovs_momentum	布林值，預設為True。是否使用Nesterov的勢頭。僅在solver ='sgd’和momentum> 0時使用。
early_stopping	bool，預設為False。當驗證評分沒有改善時，是否使用提前停止來終止培訓。如果設定為true，它將自動留出10％的訓練資料作為驗證，並在驗證得分沒有改善至少為n_iter_no_change連續時期的tol時終止訓練。僅在solver ='sgd’或’adam’時有效
validation_fraction	float，optional，預設值為0.1。將訓練資料的比例留作早期停止的驗證集。必須介於0和1之間。僅在early_stopping為True時使用
beta_1	float，optional，預設值為0.9，估計一階矩向量的指數衰減率應為[0,1)。僅在solver ='adam’時使用
beta_2	float，可選，預設為0.999,估計一階矩向量的指數衰減率應為[0,1)。僅在solver ='adam’時使用
epsilon	float，optional，預設值1e-8, adam穩定性的價值。僅在solver ='adam’時使用
n_iter_no_change	int，optional，預設值10,不符合改進的最大曆元數。僅在solver ='sgd’或’adam’時有效

屬性	備註
classes_	array or list of array of shape （n_classes，）每個輸出的類標籤。
loss_	float,使用損失函式計算的當前損失。
coefs_	list，length n_layers - 1,列表中的第i個元素表示對應於層i的權重矩陣。
intercepts_	list，length n_layers - 1,列表中的第i個元素表示對應於層i + 1的偏置向量。
n_iter_	int，迭代次數。
n_layers_	int,層數。
n_outputs_	int,輸出的個數。
out_activation_	string，輸出啟用函式的名稱。

方法	備註
fit（X，y）	使模型適合資料矩陣X和目標y。
get_params（[deep]）	獲取此估算器的引數。
predict（X）	使用多層感知器分類器進行預測
predict_log_proba（X）	返回概率估計的對數。
predict_proba（X）	概率估計。
score（X，y [，sample_weight]）	返回給定測試資料和標籤的平均準確度。
set_params（** params）	設定此估算器的引數。

sklearn 神經網路MLPclassifier引數詳解

class sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(100, ), activation=’relu’, solver=’adam’, alpha=0.0001, batch_size=’auto’, learnin

sklearn 神經網路 MLPClassifier 引數詳解

轉載自 http://blog.csdn.net/haiyu94/article/details/53001726引數說明： 1. hidden_layer_sizes :元祖格式，長度=n_layers-2, 預設(100，），第i個元素表示第i個隱藏層的神經元的個數。

機器學習中Logistic損失函式以及神經網路損失函式詳解

機器學習中最重要的三個部分為網路結構、損失函式、優化策略。而其中以損失函式最難以理解，主要原因是需要較強的數學知識，其中用的最多的就是引數估計。所謂引數估計就是：對未知引數θ進行估計時，在引數可能的取值範圍內選取，使“樣本獲得此觀測值”的概率最大的引數作為θ的估計，這樣選定的有利於”

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

轉自：https://www.cnblogs.com/charlotte77/p/7759802.html 上篇文章我們給出了用paddlepaddle來做手寫數字識別的示例，並對網路結構進行到了調整，提高了識別的精度。有的同學表示不是很理解原理，為什麼傳統的機

BP神經網路計算過程詳解，用筆手算一遍弄懂反向傳播

手算BP神經網路現在很多人都說，做it門檻很低，腦子靈活點，願意去熬的，培訓個幾個月就可以，無非是調調函式而已。確實，現在一些程式設計師的工作，調調函式掌握得好的話，也是能夠勝任的。但是，想要更進一步，還得不斷提升自己，努力理解各種演算法結構。 (類)

神經網路語言模型詳解

1 簡介語言模型是自然語言處理領域的基礎問題，其在詞性標註、句法分析、機器翻譯、資訊檢索等任務中起到了重要作用。簡而言之，統計語言模型表示為：在詞序列中，給定一個詞和上下文中所有詞，這個序列出現的概率，如下式，其中，是序列中第詞，，可以使用近似，這就是n-gram語言模型，詳細請閱讀[我們是這樣

深度學習 CNN卷積神經網路 LeNet-5詳解

卷積神經網路（ Convolutional Neural Network, CNN）：是一種常見的深度學習架構，受生物自然視覺認知機制(動物視覺皮層細胞負責檢測光學訊號)啟發而來，是一種特殊的多層前饋神經網路。它的人工神經元可以響應一部分覆蓋範圍

吳恩達深度學習課程筆記之卷積神經網路基本操作詳解

卷積層 CNN中卷積層的作用： CNN中的卷積層，在很多網路結構中會用conv來表示，也就是convolution的縮寫。卷積層在CNN中扮演著很重要的角色——特徵的抽象和提取，這也是CNN區別於傳統的ANN或SVM的重要不同。對於圖片而

Random Forest（sklearn引數詳解)

本篇不是介紹RF的，關於RF網上有很多通俗易懂的解釋西瓜書與統計學習方法等很多教材中的解釋也都足夠本篇僅針對如何使用sklearn中的RandomForestClassifier作記錄程式碼案例： class sklearn.ensemble.RandomForestClass

深度學習 --- 卷積神經網路CNN（LeNet-5網路學習演算法詳解）

上一節我們詳細探討了LeNet-5網路的架構，但是還沒有解釋該網路是如何進行學習的，如何更新權值的，本節將接著上一節進一步CNN的學習機制和權值更新過程，這裡請大家一定要對CNN網路有一個清晰的認識，知道每一層是做什麼的，為什麼這樣設定。原因在哪等。大家在學習的過程中需要多問自己幾個為什麼，這樣

對SVM與核函式的理解及sklearn引數詳解

支援向量機是在深度學習流行開來之前，效能表現最好的一種機器學習方法。在看這篇blog之前，預設讀者已經有了對支援向量機的基本概念的認識。一、支援向量機的進一步理解支援向量機的優化目標在邏輯迴歸優化目標基礎上進一步產生的。具體優化目標不說了，參看各種svm的書籍和部落格

【Caffe】網路引數詳解（Alexnet舉例）

本文為博主學習caffe的相關筆記。在caffe框架中，網路的各個層的引數可以自己配置。檔名一般是train_val.prototxt。一、Alexnet： 1. 資料層。資料層一般作為網路的第一層，由cpu讀取資料庫中的資料，後面的層的計算由gpu進行。 #資料層（第

sklearn.ensemble.RandomForest 引數詳解

RandomForestRegressor 引數 sklearn.ensemble.RandomForestRegressor( n_estimators=10,

java網路程式設計tcp協議之backlog引數詳解

backlog是ServerSocket類中的引數，用來指定ServerSocket中等待客戶端連線佇列的最大數量，並且每呼叫一次

mencoder和ffmpeg引數詳解2 （轉）

有很多軟體能夠擷取影片影象、合併影象，但如果影片太多，比如視訊網站為使用者上傳的影象生成預覽圖之類的，人工在gui方式下操作就不可取了，我們需要在命令列方式下來擷取、合併。首先，擷取影片影象使用最多的就是mplayer或者ffmpeg，我用mplayer比較熟，本文就以此為例了，ffmpe

學習筆記--JDK中的URLConnection引數詳解

JDK中的URLConnection引數詳解針對JDK中的URLConnection連線Servlet的問題,網上有雖然有所涉及,但是隻是說明了某一個或幾個問題，是以FAQ的方式來解決的，而且比較零散，現在對這個類的使用就本人在專案中的使用經驗做如下總結： 1:>

MySQL 8.0.12 mysqlbinlog命令引數詳解

1.版本號不同： # /usr/local/mysql57/bin/mysqlbinlog --version /usr/local/mysql57/bin/mysqlbinlog Ver 3.4 for linux-glibc2.12 at x86_64 # /usr/local/mysql8

maven配置引數詳解

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apach

資料庫mysqldump指令引數詳解

資料庫mysqldump命令引數詳解 --all-databases , -A 匯出全部資料庫。 mysqldump -uroot -p --all-databases --all-tablespaces , -Y 匯出全部表空間。 mysqldump -uroot -p --all-databa

jQuery非同步請求ajax()之complete引數詳解

請求完成後回撥函式 (請求success 和 error之後均呼叫)。這個回撥函式得到2個引數：XMLHTTPRequest) 物件和一個描述請求狀態的字串("success", "notmodified", "nocontent"，"error", "timeout", "abort", 或者 "

sklearn 神經網路MLPclassifier引數詳解

相關推薦