【PyTorch官方教程中文版學習筆記03】損失函式&更新權重

阿新 • • 發佈：2022-03-13

1. 損失函式

　　　　在深度學習中，損失反映模型最後預測結果與實際真值之間的差距，可以用來分析訓練過程的好壞、模型是否收斂等，例如均方損失、交叉熵損失等。

　　　　PyTorch中，損失函式可以看做是網路的某一層而放到模型定義中，但在實際使用時更偏向於作為功能函式而放到前向傳播過程中。

　　　　損失函式舉例：均方誤差（mean squared error）、交叉熵誤差（cross entropy error）等使用時參考手冊torch.nn — PyTorch 1.11.0 documentation

　　例項：nn.MSELoss 均方誤差

#接上篇神經網路
out = net(input)
net.zero_grad()
out.backward(torch.randn( 
1, 10))
target = torch.randn(10) # a dummy target, for example
target = target.view(1, -1) # make it the same shape as output
criterion = nn.MSELoss()
loss = criterion(out, target)
print(loss)
#輸出結果
tensor(1.7306, grad_fn=<MseLossBackward0>)
“因為input和target的是隨機torch陣，所以loss結果不固定”

2. 反向傳播

　　　　　在神經網路的學習中，尋找最優引數（權重和偏置）時，要尋找使損失函式的值儘可能小的引數。

　　　　　為了找到使損失函式的值儘可能小的地方，需要計算引數的導數（確切地講是梯度），然後以這個導數為指引，逐步更新引數的值。

　　　　　數值微分可以計算神經網路的權重引數的梯度（嚴格來說，是損失函式關於權重引數的梯度），但是計算上比較費時間。

　　　　　誤差反向傳播法則是一個能夠高效計算權重引數的梯度的方法。

　為了實現反向傳播損失，我們所有需要做的事情僅僅是使用 loss.backward()。你需要清空現存的梯度，要不然梯度將會和現存的梯度累計到一起。

net.zero_grad() # zeroes the gradient buffers of all parameters 

print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)
loss.backward()
print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

#輸出
conv1.bias.grad before backward
None #清空了現存梯度
conv1.bias.grad after backward
tensor([ 8.4274e-05,  2.4798e-03,  1.1413e-03,  2.4606e-03,  1.6488e-02,
        -7.1301e-03])

優化器

　　　　利用反向傳播，優化器應運而生。優化器可以更新引數即網路中的權重，進行模型優化、加速收斂。

　　　　常用的優化器演算法SGD, Nesterov-SGD, Adam,RMSProp等。優化演算法的設計可以作為課題深層研究，目前只需要會使用現成演算法就可以。

　　　　演算法在演算法包torch.optim。

　　　　torch.optim — PyTorch 1.11.0 documentation

optimizer = optim.SGD(net.parameters(), lr=0.01)# create your optimizer
optimizer.zero_grad()# zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()# Does the update

　　　　優化通常要經過好幾輪的for迴圈，訓練模型使得模型整體loss減小。

至此，我們在前篇
1.定義一個神經網路
2.處理輸入以及呼叫反向傳播

的基礎上繼續補充了：

3.計算損失值
4.更新網路中的權重

完成了一個典型的神經網路訓練過程。

參考文獻：

《Pytorch官方教程中文版》

《深度學習之Pytorch物體檢測實戰》

《深度學習入門：基於python的理論與實現》

【PyTorch官方教程中文版學習筆記03】損失函式&更新權重

1. 損失函式　　　　在深度學習中，損失反映模型最後預測結果與實際真值之間的差距，可以用來分析訓練過程的好壞、模型是否收斂等，例如均方損失、交叉熵損失等。

【PyTorch官方教程中文版學習筆記01】PyTorch 自動微分

autograd 包是 PyTorch 中所有神經網路的核心。首先讓我們簡要地介紹它，然後我們將會去訓練

【PyTorch官方教程中文版學習筆記02】PyTorch 神經網路

　　學前準備：　　1. python 中關於【類】的語法　　　　　　　　　2. 學會查閱官方文件Linear — PyTorch 1.10 documentation

【JavaSE學習筆記03】介面

Chapter 6. 介面介面（interface）技術，主要用來描述類具有什麼功能，而並不給出每個功能的具體實現。一個類可以實現（implement）一個或多個介面，並在需要介面的地方，隨時使用實現了相應介面的物件。

RabbitMQ訊息佇列官方教程Java學習筆記

訊息佇列 RabbitMQ是一個訊息佇列，它能夠接收和轉發訊息。這個過程就像寄快遞一樣，把物件打包給快遞小哥，快遞小哥會負責把物件派送到正確的地址。

[PyTorch 學習筆記] 4.2 損失函式

本章程式碼： https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson4/loss_function_1.py

陣列工具類Arrays【小白學Java-學習筆記05】

技術標籤：#Java的康莊大道初識Arrays工具類 java.util.Arrays是一個與資料相關的工具類，裡面提供了大量的靜態方法。用來實現陣列常見的操作.

話說StringBuilder【小白學Java-學習筆記15】

技術標籤：#Java的康莊大道 1.StringBuilder的原理 String類：字串是常量，它們的值在建立後不可以改變。字串的底層是被final修飾的陣列，不能改變，是個常量

增強for迴圈【小白學Java-學習筆記18】

技術標籤：#Java的康莊大道增強for迴圈：用來遍歷集合和陣列,不能實現對元素的刪除修改操作。格式如下

【pytorch學習筆記3】pytorch實現手寫數字識別

技術標籤：pytorch學習筆記深度學習神經網路前言我們來用手寫數字這個入門案例，拿它來熟悉一下pytorch

筆記：Pytorch官方教程-對抗樣本生成

翻譯自：https://pytorch.org/tutorials/beginner/fgsm_tutorial.html 儘管深度學習的模型越來越快速、越準確，但深入瞭解對抗學習之後，你會驚訝的發現，向影象新增微小的難以察覺的擾動可能使模型效能發生顯著改變

【MyBatis】學習筆記03：配置檔案進一步解讀（非常重要）

【Mybatis】學習筆記01：連線資料庫，實現增刪改【Mybatis】學習筆記02：實現簡單的查

【Python學習筆記七】從配置檔案中讀取引數

將一些需要更改或者固定的內容存放在配置檔案中，通過讀取配置檔案來獲取引數，這樣修改以及使用起來比較方便

【C語言/C++程式設計學習筆記】你的第一個Windows程式！高階操作~

什麼是windows程式設計？瞭解到Windows API 程式設計、Windows程式設計、Windows SDK 程式設計是一個概念。今天我們運用C語言來實現你的第一個真正的Windows程式。

【Java學習筆記一】——基本程式設計結構

宣告：本文章內容主要摘選自尚矽谷宋紅康Java教程、《Java核心卷一》、《Java語言程式設計-基礎篇》，示例程式碼部分出自本人，更多詳細內容推薦直接觀看以上教程及書籍，若有錯誤之處請指出，歡迎交流。

【Java學習筆記二】——物件與類

【C語言C++程式設計學習筆記】一種很酷的 C 語言技巧，靈活運用程式設計技巧讓你寫程式碼事半功倍！

C語言常常讓人覺得它所能表達的東西非常有限。它不具有類似第一級函式和模式匹配這樣的高階功能。但是C非常簡單，並且仍然有一些非常有用的語法技巧和功能，只是沒有多少人知道罷了。

typeScript學習筆記-03

// 1類的定義 class Person{ name:string; age:number; constructor(name:string,age:number){ this.name=name;

Netty學習筆記03-Netty核心模組元件與Google Protobuf

Netty 核心模組元件 Bootstrap、ServerBootstrap Bootstrap 意思是引導，一個 Netty 應用通常由一個 Bootstrap 開始，主要作用是配置整個 Netty 程式，串聯各個元件，Netty 中 Bootstrap 類是客戶端程式的啟動引導

Swoole 學習筆記 03

swoole版本4.2.13 粘包問題的產生和解決辦法產生原因 TCP 是流式協議沒有訊息邊界，客戶端向伺服器端傳送一次資料，可能會被伺服器端分成多次收到。客戶端向伺服器端傳送多條資料。伺服器端可能一次全部收到。

【PyTorch官方教程中文版學習筆記03】損失函式&更新權重

相關推薦