Cross-Entropy Error、Classification Error、Mean Squared Error

阿新 • • 發佈：2018-11-20

一、引言

神經網路中，損失函式的選擇希望能夠有以下效果：
1、不同的預測結果能夠產生不同的損失，越好的結果損失要越小
2、在損失較大的情況下，學習的速率要相對較快

二、對比

1、區分性

假設有以下兩組資料，computed代表計算出來的概率，targets代表實際的標籤，correct代表分類結果是否正確

資料組1：

在這裡插入圖片描述

資料組2：

在這裡插入圖片描述

Classification Error

可以看到資料組1的分類損失為：1/3=0.33，其中樣本1和樣本2只是剛剛好達到正確分類的概率值，而樣本3就偏離正確分類非常遠；
而資料組2的分類損失為：1/3=0.33，其中樣本1和樣本2相對較好的分到了正確的類別，而樣本3距離正確的類別也不是相當遠。
但以上兩者的損失均為0.33，實際並沒有體現出兩者的區別，放到模型中，即是體現不出訓練的效果。

Mean Squared Error

對於MSE，同樣可以計算其損失：
在資料組1中，樣本1的平方損失為：(0.3 - 0)^2 + (0.3 - 0)^2 + (0.4 - 1)^2 = 0.09 + 0.09 + 0.36 = 0.54
相當於資料組1的MSE損失為：(0.54 + 0.54 + 1.34) / 3 = 0.81；
同樣，資料組2的MSE損失為：(0.14 + 0.14 + 0.74) / 3 = 0.34。
相比於分類損失，均方損失較好的體現了兩組資料的不同。

Cross-Entropy Error

對於交叉熵，同樣計算其損失，具體計算公式就不列舉了，如下：
資料組1的平均交叉熵損失為：-(ln(0.4) + ln(0.4) + ln(0.1)) / 3 = 1.38；
資料組2的平均交叉熵損失為：-(ln(0.7) + ln(0.7) + ln(0.3)) / 3 = 0.64。
交叉熵損失同樣能夠體現出兩組資料的區別。

從區分性可以得到，分類損失表現最差，均方損失與平均交叉熵損失表現較為良好。

2、學習速率

Mean Squared Error

在談及學習速率時，實際上談論的是什麼呢？在神經網路中，拋開learning rate這個引數，假設存在一個簡單網路：
在這裡插入圖片描述
在反向傳播時，通過計算代價函式的偏導 $\partial C / \partial w$

∂C/∂w

\partial C / \partial w

和

∂C/∂b

來改變權重與偏置，所以實際上說學習速率慢說的是偏導很小。
對於上述簡單網路，其表示式為z=wx+b，啟用函式選擇sigmoid，則有a=σ(z)，假設存在樣本x=1，y=0，根據均方根損失函式有，
在這裡插入圖片描述

在這裡插入圖片描述

對損失函式求偏導，可得，
在這裡插入圖片描述

在這裡插入圖片描述

可以看到，最終偏導的大小有a與σ的偏導同時決定，再看看σ的圖形：
在這裡插入圖片描述

在這裡插入圖片描述

由影象可以看到，當輸出接近1時，曲線變得非常平坦，相應的偏導變得非常小，也就是學習速度變慢了，這也是經常被提到的啟用函式飽和。
所以均方損失面對以上情況時，效果較差。

Cross-Entropy Error

假設存在以下網路， $z=\sum_j w_jx_j+b$ ， $a=σ(z)$ ，樣本x，標籤為y，
在這裡插入圖片描述
那麼交叉熵損失函式可定義為，

對損失函式求偏導，可得，

到這裡可以看到，最終偏導由σ(z)-y決定，即是由預測的結果與實際標籤的損失決定，誤差越大學習速度越快。

由學習速度可以看到，交叉熵相對均方損失表現更好。

三、其他

1、https://jamesmccaffrey.wordpress.com/2013/11/05/why-you-should-use-cross-entropy-error-instead-of-classification-error-or-mean-squared-error-for-neural-network-classifier-training/
2、https://yq.aliyun.com/ziliao/576107

Cross-Entropy Error、Classification Error、Mean Squared Error

一、引言神經網路中，損失函式的選擇希望能夠有以下效果： 1、不同的預測結果能夠產生不同的損失，越好的結果損失要越小 2、在損失較大的情況下，學習的速率要相對較快二、對比 1、區分性假設有以下兩組資料，computed代表計算出來的概率，targets代表實際的標籤，

Minimum Mean Squared Error (MMSE)最小均方誤差

square 估計 div 表示函數誤差 chat 求和最大均方誤差（Mean Squared Error, MSE）是衡量“平均誤差”的一種較方便的方法。可以評價數據的變化程度。均方根誤差是均方誤差的算術平方根。最小二乘（LS）問題是這樣一類優化問題，目標函

bias & variance 以及 Mean squared error

標籤： machine_learning bias & variance Estimator（估計量）: a function of the data that is used to infer the value of an unknown p

"兩步走方法"解析損失函式：mean square error，cross entropy，softmax，SVM

本文試圖將四類最基礎也最常用的損失函式進行統一歸納，以明白各自的區別，加深對他們的記憶和理解。本文會從兩個步驟分析損失函式，第一個是從輸入到模型的輸出，第二個是從模型的輸出到損失函式的計算。第一個步奏，從輸入到模型的輸出。我先解釋一下什麼是模型的輸出。比如當我們訓練好了一個迴歸模型，

快速定位性能瓶頸，檢查出所有資源（CPU、內存、磁盤IO等）的利用率（utilization）、飽和度（saturation）和錯誤（error）度量,即USE方法

sta lin system 1.8 磁盤 AI during run 5.7 通過分析mpstat的iowait和iostat的util%，判斷IO瓶頸 IO瓶頸往往是我們可能會忽略的地方（我們常會看top、free、netstat等等，但經常會忽略IO的負載情況），

nodejs連線Access資料庫，出現Error: Spawn C:\WINDOWS\SysWOW64\cscript.exe error Java專案生成可執行jar包、exe檔案以及在Windows下的安裝檔案

因為集成了第三方的資料庫，所以需要獲取資料庫的資料使用 var connection = ADODB.open('Provider=Microsoft.Jet.OLEDB.4.0;Data Source='+config.id_path+';');

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

【docker】docker啟動、重啟、關閉命令，附帶：docker啟動容器報錯：docker: Error response from daemon: driver failed programming external connectivity on endpoint es2-node

在關閉並放置centos 的防火牆重啟之後【操作：https://www.cnblogs.com/sxdcgaq8080/p/10032829.html】啟動docker容器就發現開始報錯： [[email protected] elasticSearch]# docker run -d

【Ubuntu】Windows 遠端桌面連線ubuntu及xrdp的一些小問題（遠端桌面閃退、連線失敗、tab補全功能，無選單欄，error - problem connecting ）【轉】

轉：https://blog.csdn.net/u014447845/article/details/80291678 1、遠端桌面閃退，shell可以用的問題：（1）需要在該使用者目錄建立一個.xsession：touch .xsession（2）裡面寫“xfce4-session”一句話就行：echo

關於Logistic Regression、Softmax Loss和Cross-entropy的隨筆

最近看深度學習影象分類的相關知識的時候，發現對於Softmax損失函式的相關概念沒有搞明白，因此講設計到的相關知識一些梳理，供大家參考。本文以CIFAR-10資料集圖片分類任務為例展開，定義第i 個輸入樣本xi ，輸出yi ，圖片共有10類（k=0,1

Sql的各種連接用法(cross join、inner join、full join)

集合 xxx table int cross 同時 targe ont 右外連接 1.名詞解釋：笛卡爾乘積：笛卡爾乘積是指在數學中，兩個集合X和Y的笛卡爾積，又稱直積，表示X x Y ，第一個對象是X的成員，而第二個對象是Y的所有可能有序列的其中的一

SQL的各種連接（cross join、inner join、full join)的用法理解

選擇 join 返回要求重復元組連接相同 where SQL中的連接可以分為內連接，外連接，以及交叉連接。 1. 交叉連接CROSS JOIN 如果不帶WHERE條件子句，它將會返回被連接的兩個表的笛卡爾積，返回結果的行數等於兩個表行數的乘積；舉例,下列A、

MySQL - LEFT JOIN、RIGHT JOIN、INNER JOIN、CROSS JOIN、FULL JOIN

一、Join語法概述 join 用於多表中欄位之間的聯絡，語法如下： ... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona table1:左表；table2:右表。 JOIN 按照功能大致分為如下三類： INNER

Connectionist Temporal Classification(CTC)、音識別模型小型綜述和一個簡易的語音識別模型的tensorflow實現

CTC是一種端到端的語音識別技術，他避免了需要字或者音素級別的標註，只需要句子級別的標註就可以進行訓練，感覺非常巧妙，也很符合神經網路浪潮人們的習慣。特別是LSTM+CTC相較於之前的DNN+HMM，LSTM能夠更好的捕捉輸入中的重要的點（LSTM隨著狀態數目增加引數呈線性增加，而HMM會平

Join操作集合 INNER JOIN、LEFT/RIGHT JOIN、FULL JOIN、CROSS JOIN

假設兩張表：t1 和 t2。它們的資料如下。 id name id name -- ---- -- ---- 1 Pirate 1 Rutabaga 2 Monkey 2 Pirate 3 Ninja 3

LEFT JOIN、RIGHT JOIN、INNER JOIN、CROSS JOIN、FULL JOIN

一、Join語法概述 join 用於多表中欄位之間的聯絡，語法如下： ... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona table1:左表；table2:右表。 JOIN 按照功能大致分為如下三類：

顯著性目標檢測模型評價指標（一）——平均絕對誤差：Mean Absolute Error(MAE)

顯著性目標檢測模型評價指標之平均絕對誤差(MAE)原理與實現程式碼目錄一、顯著性目標檢測簡介顯著性目標(Salient Object)：當我們在看一張圖片時，注意力首先會落在我們所感興趣的物體部分。比如我們看到一張畫有羊

【NumPy】之常見運算（min、max、mean、sum、exp、sqrt、sort、乘法、點積、物件拼接/切分）

____tz_zs 之前把 numpy 資料寫在了同一篇部落格裡，發現非常難以查閱，於是按功能切分開來。運算 ndarray.min() / np.min(ndarray) ndarray.max() / np.max(ndarray) ndarray.m

Spam classification(垃圾郵件分類)—SVM、Logistic分類、SEA-Logistic(深度網路)分類

<span style="color:#3333ff;font-size:18px; font-weight: bold; font-family: 'Times New Roman';">%STEP 2: 初始化引數和load資料 </span><span style="fon

(最短路徑算法整理)dijkstra、floyd、bellman-ford、spfa算法模板的整理與介紹

void empty borde fast 默認 grand else 理解 scan 這一篇博客以一些OJ上的題目為載體。整理一下最短路徑算法。會陸續的更新。。。一、多源最短路算法——floyd算法 floyd算法主要用於求隨意兩點間的最短路徑。也成