pytorch中nn.CrossEntropyLoss使用注意事項

阿新 • • 發佈：2020-12-08

技術標籤：程式碼試錯

Loss的數學表達公式：

使用程式碼樣例：

# 這樣展開就相當於每個詞正確的類別和預測的整個詞表概率分佈進行對應
# ignore_index是指忽略真實標籤中的類別
criterion = nn.CrossEntropyLoss(ignore_index=2).to(device) 
vocab_size = pre.shape[-1]
trg = trg[:,1:]
trg_tag = trg.reshape(-1).to(device) # view函式要求在同一個連續地址裡，而reshape不用
pre_tag = pre[1:].view(-1,vocab_size).to(device)
loss = criterion(pre_tag,trg_tag)

注意事項：

CrossEntropyLoss例項化之後，其兩個輸入分別是預測標籤和真實標籤，順序不要搞錯。預測標籤的大小為[N,classnum],真實樣本的大小為[N],因為該函式會把真實標籤進行one-hot表示。N不一定是batchsize大小，可以對向量進行展開，從而可以逐個樣本進行計算loss。
從公式可以看出，pytorch中的交叉熵loss其本身已使用的一個softmax約束了預測標籤輸入控制在了0-1之間，所以loss的輸入即用模型的輸出即可不需要通過softmax後再輸入loss中，否則兩個softmax可能會導致模型在訓練的過程中loss保持不變。

pytorch中nn.CrossEntropyLoss使用注意事項

技術標籤：程式碼試錯 Loss的數學表達公式：使用程式碼樣例： # 這樣展開就相當於每個詞正確的類別和預測的整個詞表概率分佈進行對應

pytorch中nn.Conv1d的用法詳解

先貼上一段official guide：nn.conv1d官方我一開始被in_channels、out_channels卡住了很久，結果發現就和conv2d是一毛一樣的。話不多說，先粘程式碼（菜雞的自我修養）

淺談pytorch池化maxpool2D注意事項

注意：在搭建網路的時候用carpool2D的時候，讓高度和寬度方向不同池化時，用如下：

淺談vue中resetFields()使用注意事項

this.$refs.frmAdd.resetFields();這句在使用中有些時候不會有啥問題，但有時候就會出問題，而且特別難纏，我原來這麼使用就沒問題啊，怎麼這裡就會有問題，查詢各種資料總結得出：

Pytorch中nn.RNN()基本用法和輸入輸出

技術標籤：深度學習python 以下均為單向RNN。 0. RNN模型結構網上教程的標準RNN結構如下圖，其實是有輸入層x、隱藏層h和輸出層y三層結構的。

【Vue】Vue 框架再使用中的一些注意事項（有效規避錯誤）

技術標籤：vue 風格指南必要的 1、元件名應該始終是多個單詞的（避免和現在以及未來的 HTML 元素衝突，因為所有的 HTML 元素都是單個單詞的）

區域性變數中返回指標注意事項

技術標籤：c 區域性變數中返回指標注意事項 1.簡介陣列返回和malloc的指標返回不一樣，首先，區域性陣列是儲存在stack的棧中，當函式執行結束之後，區域性變數的陣列就會被系統自動釋放；其次，區域性指標的ma

Redis使用過程中有哪些注意事項？看看BAT這類的公司是正確使用Redis的！！

Redis使用過程中要注意的事項 Redis使用起來很簡單，但是在實際應用過程中，一定會碰到一些比較麻煩的問題，常見的問題有

淺談vue中resetFields()使用注意事項（resetFields無效）

this.$refs.frmAdd.resetFields();這句在使用中有些時候不會有啥問題，但有時候就會出問題，而且特別難纏，我原來這麼使用就沒問題啊，怎麼這裡就會有問題，查詢各種資料總結得出：

Java中Optional使用注意事項

前言之前遇到過使用Optional之後帶來的隱含bug，現在強調記錄一下不好的用法，防止錯用。

pytorch中交叉熵損失(nn.CrossEntropyLoss())的計算過程詳解

公式首先需要了解CrossEntropyLoss的計算過程，交叉熵的函式是這樣的：其中，其中yi表示真實的分類結果。這裡只給出公式，關於CrossEntropyLoss的其他詳細細節請參照其他博文。

淺談pytorch中的BN層的注意事項

最近修改一個程式碼的時候，當使用網路進行推理的時候，發現每次更改測試集的batch size大小竟然會導致推理結果不同，甚至產生錯誤結果，後來發現在網路中定義了BN層，BN層在訓練過程中，會將一個Batch的中的資料轉變

【PyTorch】使用中注意事項

參考部落格： https://blog.csdn.net/u011276025/article/details/73826562/ 1. 把Label要轉成LongTensor格式

交叉熵 pytorch中的nn.CrossEntropyLoss()函式

參考連結: https://www.cnblogs.com/JeasonIsCoding/p/10171201.html https://blog.csdn.net/qq_27095227/article/details/103775032

c#中string的特性介紹及注意事項小結

前言 string型別在我們實際專案開發中是一個最使用的型別，string是一個引用型別這一點大家都知道，但是在實際使用過程中，大家會發現string和我們常見的引用型別使用還真不一樣，看下面的一個簡單例子：

pytorch 中pad函式toch.nn.functional.pad()的用法

padding操作是給影象外圍加畫素點。為了實際說明操作過程，這裡我們使用一張實際的圖片來做一下處理。

pytorch 中的重要模組化介面nn.Module的使用

torch.nn 是專門為神經網路設計的模組化介面，nn構建於autgrad之上，可以用來定義和執行神經網路

淺談element中InfiniteScroll按需引入的一點注意事項

大家為了節省空間，常常進行按需引入來節省空間，這裡我給大家來介紹一下element中按需引入無限滾動指令注意的事項。

Swoole 中協程的使用注意事項及協程中的異常捕獲

協程使用注意事項協程內部禁止使用全域性變數，以免發生資料錯亂；協程使用 use 關鍵字引入外部變數到當前作用域禁止使用引用，以免發生資料錯亂；

JDBC 連線 Mysql 過程中注意事項及各類問題解決方案

在JAVA連線mysql的過程中注意問題如下：　　java連線資料庫的程式碼： package javaDateBaseConnection;