4、交叉熵與softmax

阿新 • • 發佈：2021-12-30

1、交叉熵的來源

一條資訊的資訊量大小和它的不確定性有很大的關係，一句話如果需要很多外部資訊才能確定，我們就稱這句話的資訊量比較大。比如你聽到“雲南西雙版納下雪了”，那你需要去看天氣預報、問當地人等等查證（因為雲南西雙版納從沒下過雪）。相反，如果和你說“人一天要吃三頓飯”，那這條資訊的資訊量就很小，因為這條資訊的確定性很高。

將事件x_0的資訊量定義如下（其中p(x_0)表示事件x_0發生的概率）：

熵是表示隨機變數不確定的度量，是對所有可能發生的事件產生的資訊量的期望。公式如下：

相對熵又稱KL散度，用於衡量對於同一個隨機變數x的兩個分佈p(x)和q(x)之間的差異。在機器學習中，p(x)常用於描述樣本的真實分佈，例如[1,0,0,0]表示樣本屬於第一類，而q(x)則常常用於表示預測的分佈，例如[0.7,0.1,0.1,0.1]。顯然使用q(x)來描述樣本不如p(x)準確，q(x)需要不斷地學習來擬合準確的分佈p(x)。 KL散度的公式如下：

KL散度的值越小表示兩個分佈越接近。

我們將KL散度的公式進行變形，得到：前半部分就是p(x)的熵，後半部分就是我們的交叉熵：機器學習中，我們常常使用KL散度來評估predict和label之間的差別，但是由於KL散度的前半部分是一個常量，所以我們常常將後半部分的交叉熵作為損失函式，其實二者是一樣的。分類問題中，loss函式不使用MSE

4、交叉熵與softmax

4、交叉熵與softmax

python編寫softmax函式、交叉熵函式例項

資訊量、資訊熵、交叉熵、KL散度以及交叉損失函式的關係與理解

softmax迴歸——原理、one-hot編碼、結構和運算、交叉熵損失、PyTorch實現

probability and statistic(5) 資訊量、交叉熵、夏農熵、KL散度

pytorch（十五）：交叉熵和softmax

資訊熵，交叉熵與KL散度

Machine Learning 學習筆記 03 最小二乘法、極大似然法、交叉熵

『現學現忘』Git基礎 — 4、Git下載與安裝

熵、KL散度（相對熵）、交叉熵

PyTorch的SoftMax交叉熵損失和梯度用法

管理使用者和組、 tar備份與恢復、 cron計劃任務-雲端計算學習(4)

Softmax-with-Loss 層（Softmax 函式和交叉熵誤差）的計算說明

《Kafka筆記》4、Kafka架構，與其他元件整合

4、整合環境Pycharm的安裝與配置

【JS高階程式設計(第4版)學習筆記】第四章變數、作用域與記憶體

第2章 Spring MVC基礎：4、表單標籤庫與資料繫結

《原神攻略》1.4版溫迪培養指南技能介紹、出裝與輸出手法教學

《原神攻略》1.4版凱亞培養指南出裝、天賦解析與隊伍搭配建議

一、redis 初識-4.redis服務啟動與關閉

4、交叉熵與softmax

相關推薦