dropout解決過擬合

阿新 • • 發佈：2018-12-12

原理就是在第一次學習的過程中，隨即忽略一些神經元和神經的連結。使得神經網路變得不完整。一次一次。。。。。每一次得出的結果不依賴某一個引數。這樣就解決了過擬合問題。

import tensorflow as tf
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelBinarizer

#load data
digits = load_digits()
X = digits.data
y = digits.target
y = LabelBinarizer().fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)

# 傳入的引數有輸入層，輸入大小，輸出大小，還有一個激勵函式，預設是NONE(線性函式)
def add_layer(inputs, in_size, out_size, layer_name, activation_function=None, ):
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))  # 定義權重為隨機變數，因為隨機變數生成初始變數要比0好很多。形狀是【2】【3】：2行3列
    # 機器學習推薦變數不為0.他的size是：1行our_size列
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases # matmul是矩陣的乘法。還沒被啟用的值存在這個變數中
    #將這個結果50%不考慮 其實就是dropout
    Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    tf.summary.histogram(layer_name + '/outputs', outputs)
    return outputs


#define placeholder for input.784個畫素點
keep_prob = tf.placeholder(tf.float32)#需要定義一個引數，保持多少的如果不被drop掉
xs = tf.placeholder(tf.float32, [None, 64]) #X的是8X8的64個單位
ys = tf.placeholder(tf.float32, [None, 10]) #輸出是十個單位，分別描述0123456789

#add output layer.  softmax一般是用來做分類的函式
l1 = add_layer(xs, 64, 50, 'l1',activation_function=tf.nn.tanh)
prediction = add_layer(l1, 50, 10, 'l2', activation_function=tf.nn.softmax)

#the error between prediction and real data.在softmax來說，這個cross_entropy演算法做分類，生成分類演算法
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1]))#loss
tf.summary.scalar('loss', cross_entropy)
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)


sess = tf.Session()
merged = tf.summary.merge_all()
#summary writer goes in here
train_writer = tf.summary.FileWriter("A://logs/train", sess.graph)
test_writer = tf.summary.FileWriter("A://logs/test", sess.graph)

#important stetp
if int((tf.__version__).split('.')[1]) < 12 and int((tf.__version__).split('.')[0]) < 1:
    init = tf.initialize_all_variables()
else:
    init = tf.global_variables_initializer()
sess.run(init)

for i in range(500):
    sess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 0.5})#一般會有50%的結果(被)drop
    if i % 50 == 0:
        #記錄loss
        train_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  #記錄result的時候不要drop任何東西
        test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test, keep_prob: 1})
        #載入到writer,第i次學習
        train_writer.add_summary(train_result, i)
        test_writer.add_summary(test_result, i)

dropout解決過擬合

原理就是在第一次學習的過程中，隨即忽略一些神經元和神經的連結。使得神經網路變得不完整。一次一次。。。。。每一次得出的結果不依賴某一個引數。這樣就解決了過擬合問題。 import tensorflow as tf from sklearn.datasets import load_digits f

過擬合是什麽？如何解決過擬合？l1、l2怎麽解決過擬合

pad rap 模型 details sdn data- ria article 特征 1. 過擬合是什麽？　https://www.zhihu.com/question/264909622 那個英文回答就是說h1、h2屬於同一個集合，實際情況是h2比h1錯誤率低，

tensorflow學習之路---解決過擬合

應該神經元 drop 想去 var ram 常用圖片 result ‘‘‘ 思路：1、調用數據集 2、定義用來實現神經元功能的函數（包括解決過擬合） 3、定義輸入和輸出的數據4、定義隱藏層（函數）和輸出層（函數） 5、分析誤差和優化數據（改變權重）6、執行神經網絡 ‘‘

正則化——解決過擬合問題

算法 too align 得到 bubuko 技術分享適合太多的 mod 線性回歸例子如果 \[{h_\theta }\left( x \right) = {\theta _0} + {\theta _1}x\] 通過線性回歸得到的曲線可能如下圖這種情況下，曲線對

CS229 5.用正則化(Regularization)來解決過擬合

1 過擬合過擬合就是訓練模型的過程中，模型過度擬合訓練資料，而不能很好的泛化到測試資料集上。出現over-fitting的原因是多方面的： 1）訓練資料過少，資料量與資料噪聲是成反比的，少量資料導致噪聲很大 2 ）特徵數目過多導致模型過於複雜，如下面的圖所示：看上圖中的多項式迴歸（Polyn

吳恩達機器學習（五）正則化（解決過擬合問題）

目錄 0. 前言學習完吳恩達老師機器學習課程的正則化，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。 0. 前言在分類或者回歸時，通常存在兩個問題，“過擬合”（overfitting）和“欠擬合”（underfitting）. 過擬

（五）用正則化(Regularization)來解決過擬合

1 過擬合過擬合就是訓練模型的過程中，模型過度擬合訓練資料，而不能很好的泛化到測試資料集上。出現over-fitting的原因是多方面的： 1）訓練資料過少，資料量與資料噪聲是成反比的，少量資料導致噪聲很大 2 ）特徵數目過多導致模型過於複雜，如下面的圖所示：看上圖中的多

3.L1和L2的區別；L1為什麼能稀疏矩陣L2不能；L2為什麼能解決過擬合

1.L1和L2的區別 L1:預測值與實際值差值的絕對值之和 L2:預測值與實際值差值的平方之和 2.L1為什麼能稀疏矩陣L2不能: 矩陣指的是模型引數組成的矩陣，稀疏是指模型引數很多是0。為什麼L1可以呢，從一個特徵的模型來觀察，損失函式為 F(w)=f+

如何解決過擬合與欠擬合

下面這張經典的圖展示了欠擬合（第一個）與過擬合（第三個）。欠擬合模型在訓練集上學習的不夠好，經驗誤差大，稱為欠擬合。模型訓練完成

TensorFlow學習---tf.nn.dropout防止過擬合

一、 Dropout原理簡述： tf.nn.dropout是TensorFlow裡面為了防止或減輕過擬合而使用的函式，它一般用在全連線層。 Dropout就是在不同的訓練過程中隨機扔掉一部分神經元。也就是讓某個神經元的啟用值以一定的概率p，讓其停止工作，這次訓練過程中不更新

怎麼解決過擬合與欠擬合

一.過擬合在訓練資料不夠多時，或者over-training時，經常會導致over-fitting（過擬合）。其直觀的表現如下圖所所示。隨著訓練過程的進行，模型複雜度，在training data上的error漸漸減小。可是在驗證集上的error卻反而漸漸增大——

教你簡單解決過擬合問題（附公式）

作者：Ahmed Gad翻譯：韓海疇校對：丁楠雅本文約2000字，建議閱讀5分鐘。本文帶大家認識

TensorFlow中的Dropout防止過擬合overfiting

關於Dropout的詳細內容可參考論文 "Dropout: A Simple Way to Prevent Neural Networks from Overfitting"論文 Dropout 是一個降低過擬合的正則化技術。他在網路中丟棄一部分神經單元，以及與它們的前後續

解決過擬合的方式（一）：正則化

一、過擬合監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型

如何解決過擬合（overfitting）問題？

什麼是過擬合？為了得到一致假設而使假設變得過度嚴格稱為過擬合。過擬合的模型一般對訓練資料表現很好，而對測試資料表現很差。如何解決過擬合問題？ early stopping：可以設定一個迭代截斷的閾值，到了這個閾值迭代終止；也可以設定兩次迭代之間的accuracy提高

【轉載】TensorFlow學習---tf.nn.dropout防止過擬合

轉載自：http://blog.csdn.net/huahuazhu/article/details/73649389 尊重原創遇到tf.nn.dropout問題時，在網上看到這篇博文，覺得不錯，所以轉載方便自己以後學習，如侵犯版權，請告知博主刪除一、 Dropout原理簡述： tf.nn.drop

深度學習中解決過擬合的方法

1. 正則化(regularization)正則化是指修改學習演算法，使其降低泛化誤差而非訓練誤差。1) L2正則化，也稱權重衰減(weight decay)，正則項為加入正則化後，總的目標函式為：求其偏導:梯度下降更新權重:所以，加入權重衰減後會引起學習規則的

第二節：解決過擬合與梯度下降優化

lin font 默認 training 減少偏方每次性能 ilo 1、偏差與方差偏差：預測值的期望與真實值之間的差距，偏差越大，越偏離真實數據集。方差：預測值的變化範圍，離散程度，方差越大，預測結果數據的分布越散。獲得更多的訓練實例—

從頭學pytorch(七):dropout防止過擬合

上一篇講了防止過擬合的一種方式,權重衰減,也即在loss上加上一部分\(\frac{\lambda}{2n} \|\boldsymbol{w}\|^2\),從而使得w不至於過大,即不過分偏向某個特徵. 這一篇介紹另一種防止過擬合的方法,dropout,即丟棄某些神經元的輸出.由於每次訓練的過程裡,丟棄掉哪些神

20171028機器學習之線性回歸過擬合問題的解決方案

ces 函數彈性 alpha mach rom 定性 ast cep 在函數中加入一個正則項：三種方式：一、Ridge回歸（嶺回歸）：　　優點：具有較高的準確性、魯棒性以及穩定性　　缺點：求解速度慢二、Lasso回歸：　　優點：求解速度快（原理降維計算

dropout解決過擬合

相關推薦