基於MSELoss()與CrossEntropyLoss()的區別詳解

阿新 • • 發佈：2020-01-09

基於pytorch來講

MSELoss（）多用於迴歸問題，也可以用於one_hotted編碼形式，

CrossEntropyLoss()名字為交叉熵損失函式，不用於one_hotted編碼形式

MSELoss（）要求batch_x與batch_y的tensor都是FloatTensor型別

CrossEntropyLoss（）要求batch_x為Float，batch_y為LongTensor型別

（1）CrossEntropyLoss（）舉例說明：

比如二分類問題，最後一層輸出的為2個值，比如下面的程式碼：

class CNN (nn.Module ) :
  def __init__ ( self,hidden_size1,output_size,dropout_p) :
    super ( CNN,self ).__init__ ( )
    self.hidden_size1 = hidden_size1
    self.output_size = output_size
    self.dropout_p = dropout_p
    
    self.conv1 = nn.Conv1d ( 1,8,3,padding =1) 
    self.fc1 = nn.Linear (8*500,self.hidden_size1 )
    self.out = nn.Linear (self.hidden_size1,self.output_size ) 
 
  
  def forward ( self,encoder_outputs ) :
    cnn_out = F.max_pool1d ( F.relu (self.conv1(encoder_outputs)),2) 
    cnn_out = F.dropout ( cnn_out,self.dropout_p) #加一個dropout
    cnn_out = cnn_out.view (-1,8*500) 
    output_1 = torch.tanh ( self.fc1 ( cnn_out ) )
    output = self.out ( ouput_1)
    return output

最後的輸出結果為：

上面一個tensor為output結果，下面為target，沒有使用one_hotted編碼。

訓練過程如下：

cnn_optimizer = torch.optim.SGD(cnn.parameters(),learning_rate,momentum=0.9,\
              weight_decay=1e-5)
criterion = nn.CrossEntropyLoss()
 
def train ( input_variable,target_variable,cnn,cnn_optimizer,criterion ) :
  cnn_output = cnn( input_variable )
  print(cnn_output)
  print(target_variable)
  loss = criterion ( cnn_output,target_variable)
  cnn_optimizer.zero_grad ()
  loss.backward( )
  cnn_optimizer.step( )
  #print('loss: ',loss.item())
  return loss.item() #返回損失

說明CrossEntropyLoss()是output兩位為one_hotted編碼形式，但target不是one_hotted編碼形式。

（2）MSELoss（）舉例說明：

網路結構不變，但是標籤是one_hotted編碼形式。下面的圖僅做說明，網路結構不太對，出來的預測也不太對。

如果target不是one_hotted編碼形式會報錯，報的錯誤如下。

目前自己理解的兩者的區別，就是這樣的，至於多分類問題是不是也是樣的有待考察。

以上這篇基於MSELoss()與CrossEntropyLoss()的區別詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

基於MSELoss()與CrossEntropyLoss()的區別詳解

基於pytorch來講 MSELoss（）多用於迴歸問題，也可以用於one_hotted編碼形式， CrossEntropyLoss()名字為交叉熵損失函式，不用於one_hotted編碼形式

Mybatis中#{}與${}的區別詳解

前言在開發中使用Mybatis經常使用到#{}與${}，依舊有很多開發者對二者的使用不是很清晰，正所謂好記性不如爛筆頭，特此總結一下。

Go中recover與panic區別詳解

概念 panic 與 recover 是 Go 的兩個內建函式，這兩個內建函式用於處理 Go 執行時的錯誤。

java基礎之 “==”與“equals”區別詳解

對於初學java的人來說，在面對數值比較的時候，我們大多數會採用 “==”的方式來進行比較，但是java中給我們提供了equals()方法，這時候很多人就會忽略這兩種方式的區別，在學習中產生了很多錯誤，本文將詳細區分equ

Java抽象類與介面區別詳解

很多常見的面試題都會出諸如抽象類和介面有什麼區別，什麼情況下會使用抽象類和什麼情況你會使用介面這樣的問題。本文我們將仔細討論這些話題。

Python自定義聚合函式merge與transform區別詳解

1.自定義聚合函式，結合agg使用 2. 同時使用多個聚合函式 3. 指定某一列使用某些聚合函式

c#中(&&,||)與(&,|)的區別詳解

對於(&&,||)，運算的物件是邏輯值，也就是True/False &&相當與中文的並且，||相當於中文的或者。（叫做邏輯運算子又叫短路運算子）

Java記憶體模型與JVM執行時資料區的區別詳解

首先，這兩者是完全不同的概念，絕對不能混為一談。 1.什麼是Java記憶體模型？

MySQL中索引與檢視的用法與區別詳解

前言本文主要給大家介紹了關於MySQL中索引與檢視的使用與區別的相關內容，分享出來供大家參考學習，下面話不多說了，來一起看看詳細的介紹吧。

python中的陣列賦值與拷貝的區別詳解

具體的註解我已經寫在了程式裡面：通俗的解釋了python裡面的淺拷貝與深拷貝的不同，請看程式。

基於python cut和qcut的用法及區別詳解

我就廢話不多說了，直接上程式碼吧： from pandas import Series,DataFrame import pandas as pd

Python之指數與E記法的區別詳解

不要把自乘得到冪（也稱為求冪）和E記法弄混了 3**5表示3的5次冪，也就是3*3*3*3*3，等於243

Python實現基於socket的udp傳輸與接收功能詳解

本文例項講述了Python實現基於socket的udp傳輸與接收功能。分享給大家供大家參考，具體如下：

EventBus與Spring Event區別詳解(EventBus 事件機制,Spring Event事件機制)

本地非同步處理，採用事件機制可以使程式碼解耦，更易讀。事件機制實現模式是觀察者模式（或釋出訂閱模式），主要分為三部分：釋出者、監聽者、事件。

Python2與Python3的區別詳解

許多Python初學者都會問：我應該學習哪個版本的Python。對於這個問題，我的回答通常是“先選擇一個最適合你的Python教程，教程中使用哪個版本的Python，你就用那個版本。等學得差不多了，再來研究不同版本之間的差別

Python的賦值、深拷貝與淺拷貝的區別詳解

在python中，給一個物件賦值，實際上就是物件對記憶體空間儲存的值的引用。當我們把物件賦值給另一個變數的時候，這個變數並沒有拷貝這個物件，而只是拷貝了這個物件的引用而已。

原生JS與JQ獲取元素的區別詳解

這篇文章主要介紹了原生JS與JQ獲取元素的區別詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python_array[0][0]與array[0,0]的區別詳解

在學習python的時候，看到有些程式碼中使用array[0][0] 來提取位置元素不太明白。

webpack.DefinePlugin與cross-env區別詳解

webpack.DefinePlugin與cross-env常用於在專案工程化中定義環境變數，webpack.DefinePlugin用於在編譯期定義環境變數，意味著在程式碼中寫上process.env.NODE_ENV不會在編譯期出現錯誤提醒；cross-env庫用於在執行時

Golang中的Slice與陣列及區別詳解

在golang中有陣列和Slice兩種資料結構，Slice是基於陣列的實現，是長度動態不固定的資料結構，本質上是一個對陣列字序列的引用，提供了對陣列的輕量級訪問。那麼我們今天就給大家詳細介紹下Golang中的Slice與陣列，