經典網路復現（4）ResNet

阿新 • • 發佈：2022-12-10

在經過試驗發現：網路層數的增加可以有效的提升準確率沒錯，但如果到達一定的層數後，訓練的準確率就會下降了，因此如果網路過深的話，會變得更加難以訓練。

那麼我們作這樣一個假設：假設現有一個比較淺的網路（Shallow Net）已達到了飽和的準確率，這時在它後面再加上幾個恆等對映層（Identity mapping，也即y=x，輸出等於輸入），這樣就增加了網路的深度，並且起碼誤差不會增加，也即更深的網路不應該帶來訓練集上誤差的上升。而這裡提到的使用恆等對映直接將前一層輸出傳到後面的思想，便是著名深度殘差網路ResNet的靈感來源。

ResNet引入了殘差網路結構（residual network），通過這種殘差網路結構，可以把網路層弄的很深（據說目前可以達到1000多層），並且最終的分類效果也非常好，殘差網路的基本結構如下圖所示，很明顯，該圖是帶有跳躍結構的：

殘差結構

在上圖的殘差網路結構圖中，通過“shortcut connections（捷徑連線）”的方式，直接把輸入x傳到輸出作為初始結果，輸出結果為H(x)=F(x)+x，當F(x)=0時，那麼H(x)=x，也就是上面所提到的恆等對映。於是，ResNet相當於將學習目標改變了，不再是學習一個完整的輸出，而是目標值H(X)和x的差值，也就是所謂的殘差F(x) := H(x)-x，因此，後面的訓練目標就是要將殘差結果逼近於0，使到隨著網路加深，準確率不下降。
這種殘差跳躍式的結構，打破了傳統的神經網路n-1層的輸出只能給n層作為輸入的慣例，使某一層的輸出可以直接跨過幾層作為後面某一層的輸入，其意義在於為疊加多層網路而使得整個學習模型的錯誤率不降反升的難題提供了新的方向。
至此，神經網路的層數可以超越之前的約束，達到幾十層、上百層甚至千層，為高階語義特徵提取和分類提供了可行性。
下圖是一個不同架構的對比，感受下：

訓練結果：

全部都得到了提高，訓練時間變長。

寫出下面各邏輯表示式的值。設a=3,b=4,c=5。寫出下面各邏輯表示式的值。設a=3,b=4,c=5。（1）a + b > c && b == c （2）a || b + c && b - c （3）!(a > b) && !c || 1 （4）!(x = a) && (y = b)

寫出下面各邏輯表示式的值。設a=3,b=4,c=5。（1）a + b > c && b == c （2）a || b + c && b - c

圖資料分析（4）

散點圖 import matplotlib; from pandas import read_csv; import matplotlib.pyplot as plt; data = read_csv(\"5.1\\\\data.csv\")

經典網路復現（4）ResNet

經典網路復現（4）ResNet

Java進階學習之網路程式設計（4）

Centos7.4安裝openstack（queens）詳細安裝部署（五）－網路服務（neutron）安裝

網路程式設計筆記（4）——hmac模組：驗證客戶端的合法性

Docker容器技術之容器虛擬化網路（4）

深度學習——學習筆記（4）神經網路基礎迴歸

python基礎5：concurrent.futures的執行緒池方法使用網路自動化之pyton（4）：paramiko+concurrent.futures多執行緒測試，將獲取的裝置SN等資訊新增到CSV表中

TensorFlow強化學習入門（4）——深度Q網路（DQN）及其擴充套件

linux高效能伺服器程式設計---第五章Linux網路程式設計基礎API （4）

iOS——runtime（4）：淺析物件的建立

經典演演算法（1）：氣泡排序及其優化

伯陽的網路筆記（二）：HTTP基礎

伯陽的網路筆記（三）：HTTP/2

2019年Java面試題基礎系列228道（4），快看看哪些你還不會？

分散式唯一ID生成系列（4）——Redis叢集實現的分散式ID適合做分散式ID嗎

SQL學習基礎——MySQL入門（4）_JDBC資料庫連線池

資料庫（4）匯入初始化資料

瀏覽器和網路篇（一）--瀏覽器的快取機制

寫出下面各邏輯表示式的值。設a=3,b=4,c=5。寫出下面各邏輯表示式的值。設a=3,b=4,c=5。（1）a + b > c && b == c （2）a || b + c && b - c （3）!(a > b) && !c || 1 （4）!(x = a) && (y = b)

圖資料分析（4）

經典網路復現（4）ResNet

相關推薦