損失函式的選擇

阿新 • • 發佈：2018-11-04

損失函式的迭取取決於輸入標籤資料的型別:如果輸入的是實數,無界的值,損失函式使用平方差;如果輸入的標籤是位向量(分類標誌)使用交叉熵會更合適

均值平方差(Mean Squared Error, MSE)也稱均方誤差
神經網路中:表達預測值與真實值之間的差異
數理統計中:指引數估計值與引數真值之差平方的期望值
均方誤差的值越小,表明模型越好

MSE: Mean Squared Error

均方誤差是指引數估計值與引數真值之差平方的期望值;
MSE可以評價資料的變化程度，MSE的值越小，說明預測模型描述實驗資料具有更好的精確度。
$$ MSE = \frac{1}{N}\sum_{t=1}^{N}\left ( obersved_{t} - predicted_{t} \right )^{2} $$
程式寫法:

MSE=tf.reduce_mean(tf.pow(tf.sub(logits, outputs), 2.0))
MSE=tf.reduce_mean(tf.square(tf.sub(logits, outputs)))
MSE=tf.reduce_mean(tf.square(logits - outputs))

RMSE

均方誤差:均方根誤差是均方誤差的算術平方根
$$ RMSE = \sqrt{\frac{1}{N}\sum_{t=1}^{N} \left ( obersved_{t} - predicted_{t} \right)^{2} } $$
程式寫法:

RMSE=tf.sqrt(tf.reduce_mean(tf.pow(tf.sub(logits, outputs), 2.0)))

MAE :Mean Absolute Error

平均絕對誤差是絕對誤差的平均值
平均絕對誤差能更好地反映預測值誤差的實際情況.
$\widehat{y}$ 表示預測值 $y$ 表示真實值
$$ MAE = \frac{1}{N}\sum_{t=1}^{N}\left | (\widehat{y}-y) \right | $$
程式寫法:

MAE=tf.reduce_mean(tf.abs(tf.sub(logits, label)))

SD :standard Deviation

標準差:標準差是方差的算術平方根。標準差能反映一個數據集的離散程度。平均數相同的兩組組資料，標準差未必相同。
$u$表示平均值$\left ( u = \frac{1}{N}\left ( x_{1}+\cdot \cdot \cdot + x_{N} \right ) \right )$
$$ SD = \sqrt{\frac{1}{N}\sum_{t=1}^{N}\left ( x_{i}-u \right )^{2}} $$
程式寫法:

SD=tf.sqrt(tf.reduce_mean(tf.pow(tf.sub(x_i-u), 2.0)))

損失函式的選擇

MSE: Mean Squared Error

RMSE

MAE :Mean Absolute Error

SD :standard Deviation

損失函式的選擇

斯坦福大學機器學習筆記——聚類（k-均值聚類演算法、損失函式、初始化、聚類數目的選擇）

如何選擇迴歸損失函式

yolo v2 損失函式原始碼解讀

tensflow自定義損失函式

Tensorflow 兩個交叉熵損失函式的區別

神經網路的損失函式

CS231n——機器學習演算法——線性分類（下：Softmax及其損失函式）

CS231n——機器學習演算法——線性分類（中：SVM及其損失函式）

【機器學習】一文讀懂機器學習常用損失函式

最大似然損失和交叉熵損失函式的聯絡

損失函式震盪不收斂可能原因：tf.train.shuffle_batch

交叉熵損失函式及Tensorflow實現

機器學習中常用損失函式

損失函式總結

Tensorflow 損失函式及學習率的四種改變形式

《機器學習》筆記---2 模型的損失函式與正則化

啟用函式損失函式優化器

softmax損失函式在 mnist 上的二維分佈

損失函式正則化方法

損失函式的選擇

MSE: Mean Squared Error

RMSE

MAE :Mean Absolute Error

SD :standard Deviation

相關推薦