語義分割單通道和多通道輸出交叉熵損失函式的計算問題

阿新 • • 發佈：2020-10-27

摘要

本文驗證了語義分割任務下，單通道輸出和多通道輸出時，使用交叉熵計算損失值的細節問題。對比驗證了使用簡單的函式和自帶損失函式的結果，通過驗證，進一步加強了對交叉熵的理解。

交叉熵損失函式

交叉熵損失函式的原理和推導過程，可以參考這篇博文，在本文，我們直接給出計算公式：

\[CE(p,q) = -(p*log(q) + (1-p)*log(1-q)) \]

其中 $ p$ 為預測的概率，$q∈[0,1]$， $q$ 為標籤，$q∈\{0,1\}$。

也就是說，對於任意一個要分類的元素，有 $p$ 概率將其預測為標籤 1對應類別的元素；有 $1-p$ 概率將其預測為標籤 0對應類別的元素（即除了前述類別外的所有其他元素）。

單通道輸出時的交叉熵損失計算

首先，假設我們研究的是一個二分類語義分割問題。

網路的輸入是一個 2×2 的影象，設定 batch_size 為 2，網路輸出單通道特徵圖。網路的標籤也是一個 2 ×2 的二進位制掩模圖（即只有0和1的單通道影象）。

我們在 pytorch 中將其定義：

import torch

# 假設輸出一個 [batch_size=2, channel=1, height=2, width=2] 格式的張量 x1
x1 = torch.tensor(
    [[[[ 0.43, -0.25],
        [-0.32, 0.69]]],

        [[[-0.29, 0.37],
          [0.54,  -0.72]]]])

# 假設標籤影象為與 x1 同型的張量 y1
y1 = torch.tensor(
    [[[[0., 0.],
        [0., 1.]]],

        [[[0., 0.],
          [1.,  1.]]]])

在進行交叉熵前，首先需要做一個 sigmoid 操作，將數值壓縮到0到1之間：

# 根據二進位制交叉熵的計算過程
# 首先進行sigmoid計算，然後與標籤影象進行二進位制交叉熵計算，最後取平均值，即為損失值

# 1. sigmoid
s1 = torch.sigmoid(x1)
s1

'''
out:
tensor([[[[0.6059, 0.4378],
          [0.4207, 0.6660]]],


        [[[0.4280, 0.5915],
          [0.6318, 0.3274]]]]
'''

然後進行交叉熵計算，由於計算的是每個畫素的損失值，所以要取個平均值：

# 2.交叉熵計算
loss_cal = -1*(y1*torch.log(s1)+(1-y1)*torch.log(1-s1))
loss_cal_mean = torch.sum(loss_cal)/torch.numel(loss_cal)
loss_cal_mean

'''
out:
tensor(0.6861)
'''

為了驗證結果，我們使用 pytorch 自帶的二進位制交叉熵損失函式計算：

# 使用torch自帶的二進位制交叉熵計算
loss_bce = torch.nn.BCELoss()(s1,y1)
loss_bce

'''
out:
tensor(0.6861)
'''

當計算損失值前沒有進行 sigmoid 操作時，pytorch 還提供了包含這個操作的二進位制交叉熵損失函式：

# 使用帶sigmoid的二進位制交叉熵計算
loss_bce2 = torch.nn.BCEWithLogitsLoss()(x1,y1)
loss_bce2

'''
out:
tensor(0.6861)
'''

可以看到，我們使用了三種方式，計算了交叉熵損失，結果一致。

多通道輸出時的交叉熵損失計算

首先，假設我們研究的是一個二分類語義分割問題。

網路的輸入是一個 2×2 的影象，設定 batch_size 為 2，網路輸出多（二）通道特徵圖。網路的標籤也是一個 2 ×2 的二進位制掩模圖（即只有0和1的單通道影象）。

我們在 pytorch 中將其定義：

# 假設輸出一個[batch_size=2, channel=2, height=2, width=2]格式的張量 x1
x1 = torch.tensor([[[[ 0.3164, -0.1922],
          [ 0.4326, -1.2193]],

         [[ 0.6873,  0.6838],
          [ 0.2244,  0.5615]]],


        [[[-0.2516, -0.8875],
          [-0.6289, -0.1796]],

         [[ 0.0411, -1.7851],
          [-0.3069, -1.0379]]]])

# 假設標籤影象為與x1同型，然後去掉channel的張量 y1 （注意兩點，channel沒了，格式為LongTensor）
y1 = torch.LongTensor([[[0., 1.],
         [1., 0.]],

        [[1., 1.],
         [0., 1.]]])

在進行交叉熵前，首先需要做一個 softmax 操作，將數值壓縮到0到1之間，且使得各通道之間的數值之和為1：

# 1.softmax
s1 = torch.softmax(x1,dim=1)
s1

'''
out:
tensor([[[[0.4083, 0.2940],
          [0.5519, 0.1442]],

         [[0.5917, 0.7060],
          [0.4481, 0.8558]]],


        [[[0.4273, 0.7105],
          [0.4202, 0.7023]],

         [[0.5727, 0.2895],
          [0.5798, 0.2977]]]])
'''

對於標籤圖，由於其張量的形狀與網路輸出張量不一樣，因此需要做一個one-hot轉換：

# 2.one-hot
y1_one_hot = torch.zeros_like(x1).scatter_(dim=1,index=y1.unsqueeze(dim=1),src=torch.ones_like(x1))
y1_one_hot

'''
out:
tensor([[[[1., 0.],
          [0., 1.]],

         [[0., 1.],
          [1., 0.]]],


        [[[0., 0.],
          [1., 0.]],

         [[1., 1.],
          [0., 1.]]]])
'''

這裡需要重點理解這個scatter_函式，他起到的作用十分關鍵，one-hot 轉換時，其實可以理解為將一個同型的全1矩陣中的元素，有選擇性的複製到全0矩陣中的過程，這裡的選擇依據就是我們的標籤圖，它決定了哪個位置和通道上的元素取值為 1 。在scatter_ 函式中，dim 決定了用於確定我們在哪個維度上開始定位要建立聯絡的元素，** **是我們選擇的依據。

按照交叉熵定義，繼續計算：

# 交叉熵計算
loss_cal = -1 *(y1_one_hot * torch.log(s1) + (1-y1_one_hot) * torch.log(1-s1)) 
loss_cal_mean = torch.sum(loss_cal)/torch.numel(s1)
loss_cal_mean

'''
out:
tensor(0.9823)
'''

我們也可以使用 pytorch 自帶的交叉熵損失函式計算：

loss_ce = torch.nn.CrossEntropyLoss()(x1,y1)
loss_ce

'''
tensor(0.9823)
'''

可以看到，兩種方式結果一樣。

結論

交叉熵本質上將一群物件擇其一進行研究，自然就變成一個二進位制問題，即是這個物件或不是這個物件，然後將標籤與概率融進公式中，計算損失值。對於每一個物件都可以計算一個損失值，求個平均值就是最後這個群體的損失值了。
不論是sigmoid或者softmax，我們都是在有目的將資料規整到0到1之間，從而形成一個概率值，sigmoid針對的是二分類問題，因此算出一個概率，另一個用一減去就到了。多分類問題，由於最後會輸出對應數量的值，softmax 能夠將這些值轉換到0到1，並滿足加起來等於1。
對於二分類語義分割問題，其實採用上述兩種方式都是可以的。

參考資料

[1] pytorch中的 scatter_()函式使用和詳解

[2] pytorch交叉熵使用方法

語義分割單通道和多通道輸出交叉熵損失函式的計算問題

摘要本文驗證了語義分割任務下，單通道輸出和多通道輸出時，使用交叉熵計算損失值的細節問題。對比驗證了使用簡單的函式和自帶損失函式的結果，通過驗證，進一步加強了對交叉熵的理解。

springboot實現單檔案和多檔案上傳

本文例項為大家分享了springboot實現單檔案/多檔案上傳的具體程式碼，供大家參考，具體內容如下

ASP.NET Core單檔案和多檔案上傳並儲存到服務端的方法

前言：　　在我們日常開發中，關於圖片，視訊，音訊，文件等相關檔案上傳並儲存到服務端中是非常常見的一個功能，今天主要是把自己在開發中常用的兩種方式記錄下來方便一下直接使用，並且希望能夠幫助到有需要的同

單例和多例的區別

所謂單bai例就是所有的請求都用一個物件來處理，du比如我們常用的service和dao層的zhi對dao象通常都是單例的，而多例則指每個請求用一個新的物件來處理，比如action;

四、SQL之單表和多表查詢

一、單表查詢 -- 萬用字元*，查詢整個表 SELECT * FROM `test_zjx`; -- 過濾條件 SELECT * FROM `test_zjx` WHERE `name`=\'zhangjx3\';

單頁面和多頁面續集

單頁面和多頁面續集一、元件化模組化上集說到，我們希望views專注頁面渲染

vant實現select效果，單選和多選

官方推薦picker，但是我們專案用picker還要搭配Popup和cell、field，維護太太麻煩，所以自己封裝一個

SpringIOC建立物件的單例和多例模式

問題: Spring容器物件根據配置檔案建立物件的時機預設發生在Spring容器物件在被建立的時候,也就是說,我們一旦獲取到Spring容器物件,意味著可以直接獲取Spring容器中的物件使用了.那麼,如果我對同一個bean物件,連續獲

2021-1 從檔案構建有向圖API 測試單點和多點可達 c++實現

技術標籤：日常練習有向圖c++ API 和無向圖Graph.h比較，只改動了幾個地方，一個翻轉圖，新增邊時只是單向新增。

Python單任務和多工選擇

開始Python的複習！（以前學的忘了好多-_-）主要參考的是Github上的一個專案：https://github.com/jackfrued/Python-100-Days

《手把手教你》系列技巧篇（三十四）-java+ selenium自動化測試-單選和多選按鈕操作-中篇（詳解教程）

1.簡介今天這一篇巨集哥主要是講解一下，如何使用list容器來遍歷單選按鈕。大致兩部分內容：一部分是巨集哥在本地弄的一個小demo，另一部分，巨集哥是利用JQueryUI網站裡的單選按鈕進行實戰。

《手把手教你》系列技巧篇（三十五）-java+ selenium自動化測試-單選和多選按鈕操作-下篇（詳解教程）

1.簡介今天這一篇巨集哥主要是講解一下，如何使用list容器來遍歷多選按鈕。大致兩部分內容：一部分是巨集哥在本地弄的一個小demo，另一部分，巨集哥是利用JQueryUI網站裡的多選按鈕進行實戰。

《手把手教你》系列技巧篇（三十六）-java+ selenium自動化測試-單選和多選按鈕操作-番外篇（詳解教程）

1.簡介　　前邊幾篇文章是巨集哥自己在本地弄了一個單選和多選的demo，然後又找了網上相關聯的例子給小夥伴或童鞋們演示了一下如何自動化測試，這一篇巨集哥在網上找了一個問卷調查，給小夥伴或童鞋們來演示一下。

python+appium自動化測試-單點和多點觸控操作

一、TouchAction TouchAction類主要用於模擬手勢操作，如點選、短按、長按、移動操作。

Spring中Bean的單例和多例

在Spring中，bean可以被定義為兩種模式：prototype（多例）和singleton（單例） singleton（單例）：只有一個共享的例項存在，所有對這個bean的請求都會返回這個唯一的例項。

CentOS7 單節點和多節點 HPL測試

前置工作：安裝OpenBLAS; 安裝Mpich 官網下載壓縮包到/opt目錄 cd /opt && wget https://www.netlib.org/benchmark/hpl/hpl-2.3.tar.gz

PyTorch的SoftMax交叉熵損失和梯度用法

在PyTorch中可以方便的驗證SoftMax交叉熵損失和對輸入梯度的計算關於softmax_cross_entropy求導的過程,可以參考HERE

解決pytorch 交叉熵損失輸出為負數的問題

網路訓練中，loss曲線非常奇怪交叉熵怎麼會有負數。經過排查，交叉熵不是有個負對數嗎，當網路輸出的概率是0-1時，正數。可當網路輸出大於1的數，就有可能變成負數。

影象分割套件PaddleSeg全面解析（七）損失函式解析

技術標籤：深度學習神經網路目前PaddleSeg套件的動態圖版本只支援一種損失函式Cross Entroy Loss(交叉熵)。Cross Entroy Loss是一種很常用的損失函式，在影象分類中基本都會用到。一般在影象分類中，神經網路最

softmax迴歸——原理、one-hot編碼、結構和運算、交叉熵損失、PyTorch實現

1. softmax迴歸是分類問題　　迴歸（Regression）是用於預測某個值為“多少”的問題，如房屋的價格、患者住院的天數等。

語義分割單通道和多通道輸出交叉熵損失函式的計算問題

摘要

交叉熵損失函式

單通道輸出時的交叉熵損失計算

多通道輸出時的交叉熵損失計算

結論

參考資料

相關推薦