PyTorch筆記--交叉熵損失函式實現

阿新 • • 發佈：2021-08-10

交叉熵（cross entropy）：用於度量兩個概率分佈間的差異資訊。交叉熵越小，代表這兩個分佈越接近。

函式表示（這是使用softmax作為啟用函式的損失函式表示）：

（是真實值，是預測值。）

命名說明：

pred=F.softmax(logits)，logits是softmax函式的輸入，pred代表預測值，是softmax函式的輸出。

pred_log=F.log_softmax(logits)，pred_log代表對預測值再取對數後的結果。也就是將logits作為log_softmax()函式的輸入。

方法一，使用log_softmax()+nll_loss()實現

torch.nn.functional.log_softmax

(input)

　　對輸入使用softmax函式計算，再取對數。

torch.nn.functional.nll_loss(input, target)

　　input是經log_softmax()函式處理後的結果,pred_log

　　target代表的是真實值。

　　有了這兩個輸入後，該函式對其實現交叉熵損失函式的計算，即上面公式中的L。

>>> import torch
>>> import torch.nn.functional as F
>>> x = torch.randn(1, 28)
>>> w = torch.randn(10 
,28)
>>> logits = x @ w.t()
>>> pred_log = F.log_softmax(logits, dim=1)
>>> pred_log
tensor([[ -0.8779,  -6.7271,  -9.1801,  -6.8515,  -9.6900,  -6.3061,  -3.7304,
          -8.1933, -11.5704,  -0.5873]])
>>> F.nll_loss(pred_log, torch.tensor([3]))
tensor(6.8515)

logits的維度是(1, 10)這裡可以理解成是1個輸入，最終可能得到10個分類的結果中的一個。pred_log就是。

這裡的引數target=torch.tensor([3])，我的理解是，他代表真正的分類的值是在第3類（從0編號）。

使用獨熱編碼代表真實值是[0, 0, 0, 1, 0, 0, 0, 0, 0, 0]，即這個輸入它是屬於第三類的。

根據上述公式進行計算，現在我們和都已經知道了。

對其進行點乘操作

方法二，使用cross_entropy()實現

torch.nn.functional.cross_entropy(input, target)

　　這裡的input是沒有經過處理的logits,這個函式會自動根據logits計算出pred_log

　　target是真實值

>>> import torch
>>> import torch.nn.functional as F
>>> x = torch.randn(1, 28)
>>> w = torch.randn(10,28)
>>> logits = x @ w.t()
>>> F.cross_entropy(logits, torch.tensor([3]))
tensor(6.8515)

這裡我刪除了上面使用方法一的程式碼部分，x和w沒有重新隨機生成，所以計算結果是一樣的。

還在學習過程，做此紀錄，如有不對，請指正。

PyTorch筆記--交叉熵損失函式實現

交叉熵（cross entropy）：用於度量兩個概率分佈間的差異資訊。交叉熵越小，代表這兩個分佈越接近。

pytorch中交叉熵損失(nn.CrossEntropyLoss())的計算過程詳解

公式首先需要了解CrossEntropyLoss的計算過程，交叉熵的函式是這樣的：其中，其中yi表示真實的分類結果。這裡只給出公式，關於CrossEntropyLoss的其他詳細細節請參照其他博文。

語義分割單通道和多通道輸出交叉熵損失函式的計算問題

摘要本文驗證了語義分割任務下，單通道輸出和多通道輸出時，使用交叉熵計算損失值的細節問題。對比驗證了使用簡單的函式和自帶損失函式的結果，通過驗證，進一步加強了對交叉熵的理解。

softmax迴歸——原理、one-hot編碼、結構和運算、交叉熵損失、PyTorch實現

1. softmax迴歸是分類問題　　迴歸（Regression）是用於預測某個值為“多少”的問題，如房屋的價格、患者住院的天數等。

PyTorch的SoftMax交叉熵損失和梯度用法

在PyTorch中可以方便的驗證SoftMax交叉熵損失和對輸入梯度的計算關於softmax_cross_entropy求導的過程,可以參考HERE

解決pytorch 交叉熵損失輸出為負數的問題

網路訓練中，loss曲線非常奇怪交叉熵怎麼會有負數。經過排查，交叉熵不是有個負對數嗎，當網路輸出的概率是0-1時，正數。可當網路輸出大於1的數，就有可能變成負數。

[PyTorch 學習筆記] 4.2 損失函式

本章程式碼： https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson4/loss_function_1.py

PyTorch基礎——torch.nn.CrossEntropyLoss交叉熵損失

技術標籤：PyTorch交叉熵損失本文只考慮基本情況，未考慮加權。 torch.nnCrossEntropyLosss使用的公式

【PyTorch官方教程中文版學習筆記03】損失函式&更新權重

1. 損失函式　　　　在深度學習中，損失反映模型最後預測結果與實際真值之間的差距，可以用來分析訓練過程的好壞、模型是否收斂等，例如均方損失、交叉熵損失等。

Pytorch十九種損失函式的使用詳解

損失函式通過torch.nn包實現， 1 基本用法 criterion = LossCriterion() #建構函式有自己的引數

pytorch（14）損失函式

損失函式 1. 損失函式概念損失函式：衡量模型輸出與真實標籤的差異 \\[損失函式(Loss Function): Loss = f(\\hat y,y)

pytorch（16）損失函式（二）

5和6是在資料迴歸中用的較多的損失函式 5. nn.L1Loss 功能：計算inputs與target之差的絕對值

fit函式 model_Tensorflow2.0中複雜損失函式實現

技術標籤：fit函式 model Tensorflow 2.0自4月初alpha釋出以來，引起了廣泛關注。其中，谷歌攜手@fchollet(Keras作者)及其團隊對Keras庫做出了大量Tensorflow專屬的優化以及改動。再聯想到獨立(Stand alone)的K

為什麼分類問題用交叉熵損失，而不用均方誤差損失

1.損失函式角度對一個多分類問題，我們一般用onehot編碼來表示label，比如貓、老虎、狗的3分類問題，label為[ 1 , 0 , 0 ] ，交叉熵損失只於當前類別有關，與其它類別無關，

pytorch 實現cross entropy損失函式計算方式

均方損失函式：這裡 loss,x,y 的維度是一樣的，可以是向量或者矩陣，i 是下標。

Pytorch學習筆記12----損失函式nn.CrossEntropyLoss()、nn.NLLLoss()

1.CrossEntropyLoss()損失函式 nn.CrossEntropyLoss()這個損失函式用於多分類問題雖然說的是交叉熵，但是和我理解的交叉熵不一樣。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使用它來替換

【學習筆記】Pytorch深度學習—損失函式

前面學習瞭如何構建模型、模型初始化，本章學習損失函式。本章從3個方面學習，（1）損失函式的概念以及作用；（2）學習交叉熵損失函式；（3）學習其他損失函式NLL、BCE、BCEWithLogits Loss

交叉熵 pytorch中的nn.CrossEntropyLoss()函式

參考連結: https://www.cnblogs.com/JeasonIsCoding/p/10171201.html https://blog.csdn.net/qq_27095227/article/details/103775032

【學習筆記】Pytorch深度學習—損失函式（二）

5、nn.L1Loss 迴歸任務中常用的損失函式。功能：計算模型輸出inputs與真實標籤target之差的絕對值

資訊量、資訊熵、交叉熵、KL散度以及交叉損失函式的關係與理解

記事件 p p p,在各個狀態下 x i x_i xi 的概率為 p ( x i ) p(x_i) p(xi) 。(假設共n個狀態） 1、資訊量：概率越大資訊量越小。

PyTorch筆記--交叉熵損失函式實現

相關推薦