交叉熵

阿新 • • 發佈：2017-06-27

就會分布 tex 交叉熵最小分享相等 gen 最小值

交叉熵可在神經網絡(機器學習)中作為損失函數，p表示真實標記的分布，q則為訓練後的模型的預測標記分布，交叉熵損失函數可以衡量真實分布p與當前訓練得到的概率分布q有多麽大的差異。

相對熵（relative entropy）就是KL散度（Kullback–Leibler divergence），用於衡量兩個概率分布之間的差異。

對於兩個概率分布 $技術分享$ 和 $技術分享$ ，其相對熵的計算公式為：

$技術分享$

註意：由於 $技術分享$ 和 $技術分享$ 在公式中的地位不是相等的，所以 $技術分享$ 。

相對熵的特點，是只有 $技術分享$ 時，其值為0。若 $技術分享$ 和 $技術分享$ 略有差異，其值就會大於0。

相對熵公式的前半部分 $技術分享$ 就是交叉熵（cross entropy）。

若 $技術分享$ 是數據的真實概率分布， $技術分享$ 是由數據計算得到的概率分布。機器學習的目的就是希望 $技術分享$

盡可能地逼近甚至等於 $技術分享$ ，從而使得相對熵接近最小值0。由於真實的概率分布是固定的，相對熵公式的後半部分 $技術分享$ 就成了一個常數。那麽相對熵達到最小值的時候，也意味著交叉熵達到了最小值。對 $技術分享$ 的優化就等效於求交叉熵的最小值。另外，對交叉熵求最小值，也等效於求最大似然估計（maximum likelihood estimation）。

註意：交叉熵是衡量分布p與分布q的相似性，以前認為交叉熵的相似性越大，交叉熵的值就應該越大。但通過上面的推到可以看出，交叉熵得到兩個分布的相似性是根據相對熵來的，所以相似性越大，交叉熵的值應該越小。

交叉熵

就會分布 tex 交叉熵最小分享相等 gen 最小值交叉熵可在神經網絡(機器學習)中作為損失函數，p表示真實標記的分布，q則為訓練後的模型的預測標記分布，交叉熵損失函數可以衡量真實分布p與當前訓練得到的概率分布q有多麽大的差異。相對熵（relative en

交叉熵

交叉熵

信息熵，交叉熵，KL散度

KL散度、交叉熵與極大似然的友誼

通俗的解釋交叉熵與相對熵

Tensorflow四種交叉熵函數計算公式：tf.nn.cross_entropy

[吃藥深度學習隨筆] 交叉熵

損失函數之交叉熵

談談交叉熵損失函數

TensorFlow筆記-06-神經網絡優化-損失函數,自定義損失函數,交叉熵

均方誤差和交叉熵損失函數比較

為什麽交叉熵可以用於計算代價函數

Tensorflow 兩個交叉熵損失函式的區別

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

交叉熵與softmax函式

最大似然損失和交叉熵損失函式的聯絡

熵(Entropy),交叉熵(Cross-Entropy),KL-鬆散度(KL Divergence),似然（Likelihood）

交叉熵與KL散度

熵、資訊量、資訊熵、交叉熵-個人小結

交叉熵損失函式及Tensorflow實現

似然函式和最大似然估計與機器學習中的交叉熵函式之間的關係

交叉熵

相關推薦