損失函式 loss function 總結（轉）

阿新 • • 發佈：2019-01-01

目標函式，或稱損失函式，是網路中的效能函式，也是編譯一個模型必須的兩個引數之一。由於損失函式種類眾多，下面以keras官網手冊的為例。

在官方keras.io裡面，有如下資料：

mean_squared_error或mse
mean_absolute_error或mae
mean_absolute_percentage_error或mape
mean_squared_logarithmic_error或msle
squared_hinge
hinge
binary_crossentropy（亦稱作對數損失，logloss）

categorical_crossentropy：亦稱作多類的對數損失，注意使用該目標函式時，需要將標籤轉化為形如(nb_samples, nb_classes)的二值序列
sparse_categorical_crossentrop：如上，但接受稀疏標籤。注意，使用該函式時仍然需要你的標籤與輸出值的維度相同，你可能需要在標籤資料上增加一個維度：np.expand_dims(y,-1)
kullback_leibler_divergence:從預測值概率分佈Q到真值概率分佈P的資訊增益,用以度量兩個分佈的差異.
cosine_proximity：即預測值與真實標籤的餘弦距離平均值的相反數

mean_squared_error

　　顧名思義，意為均方誤差，也稱標準差，縮寫為MSE，可以反映一個數據集的離散程度。

　　標準誤差定義為各測量值誤差的平方和的平均值的平方根，故又稱為均方誤差。

　　公式：

　　公式意義：可以理解為一個從n維空間的一個點到一條直線的距離的函式。（此為在圖形上的理解，關鍵看個人怎麼理解了）

mean_absolute_error

　　譯為平均絕對誤差，縮寫MAE。

　　平均絕對誤差是所有單個觀測值與算術平均值的偏差的絕對值的平均。

　　公式：（fi是預測值，yi是實際值,絕對誤差)

mean_absolute_percentage_error

　　譯為平均絕對百分比誤差，縮寫MAPE。

　　公式：（At表示實際值，Ft表示預測值）

mean_squared_logarithmic_error

　　譯為均方對數誤差,縮寫MSLE。

　　公式：（n是整個資料集的觀測值，pi為預測值，ai為真實值）

squared_hinge

　　公式為max(0,1-y_true*y_pred)^2.mean(axis=-1)，取1減去預測值與實際值的乘積的結果與0比相對大的值的平方的累加均值。

hinge

　　公式為為max(0,1-y_true*y_pred).mean(axis=-1)，取1減去預測值與實際值的乘積的結果與0比相對大的值的累加均值。

Hinge Loss 最常用在 SVM 中的最大化間隔分類中，

　　對可能的輸出 t = ±1 和分類器分數 y，預測值 y 的 hinge loss 定義如下：

　　L(y) = max(0,1-t*y)

　　看到 y 應當是分類器決策函式的“原始”輸出，而不是最終的類標。例如，線上性的 SVM 中

　　y = w*x+b

　　可以看出當 t 和 y 有相同的符號時（意味著 y 預測出正確的分類）

　　|y|>=1

　　此時的 hinge loss

　　L(y) = 0

　　但是如果它們的符號相反

　　L(y)則會根據 y 線性增加 one-sided error。（譯自wiki）

binary_crossentropy

　　即對數損失函式，log loss，與sigmoid相對應的損失函式。

　　公式：L(Y,P(Y|X)) = -logP(Y|X)

該函式主要用來做極大似然估計的，這樣做會方便計算。因為極大似然估計用來求導會非常的麻煩，一般是求對數然後求導再求極值點。

　　損失函式一般是每條資料的損失之和，恰好取了對數，就可以把每個損失相加起來。負號的意思是極大似然估計對應最小損失。

categorical_crossentropy

　　多分類的對數損失函式，與softmax分類器相對應的損失函式，理同上。

　　tip：此損失函式與上一類同屬對數損失函式，sigmoid和softmax的區別主要是，sigmoid用於二分類，softmax用於多分類（小編還在入門階段，，對於兩種對數損失函式的區別不甚清楚，推導也不大懂，歡迎大神補充，謝謝）。

sparse_categorical_crossentrop

　　在上面的多分類的對數損失函式的基礎上，增加了稀疏性（即資料中多包含一定0資料的資料集），如目錄所說，需要對資料標籤新增一個維度np.expand_dims(y,-1)。

kullback_leibler_divergence

　　（譯自WIKI）

　　對於離散隨機變數，其概率分佈P 和 Q的KL散度可按下式定義為

　　即按概率P求得的P和Q的對數差的平均值。KL散度僅當概率P和Q各自總和均為1，且對於任何i皆滿足

　　Q(i)>0及P(i)>0時，才有定義。式中出現0Ln0的情況，其值按0處理。

　　對於連續隨機變數，其概率分佈P和Q可按積分方式定義為

　　其中p和q分別表示分佈P和Q的密度。

　　更一般的，若P和Q為集合X的概率測度，且Q關於P絕對連續，則從P到Q的KL散度定義為

　　其中，假定右側的表達形式存在，則為Q關於P的R–N導數。

　　相應的，若P關於Q絕對連續，則

　　即為P關於Q的相對熵，用以度量兩個分佈的差異。

cosine_proximity

　　此方法用餘弦來判斷兩個向量的相似性。

　　設向量 A = (A1,A2,...,An)，B = (B1,B2,...,Bn)，則有

　　餘弦值的範圍在[-1,1]之間，值越趨近於1，代表兩個向量的方向越趨近於0，他們的方向更加一致。相應的相似度也越高。

損失函式 loss function 總結（轉）

目標函式，或稱損失函式，是網路中的效能函式，也是編譯一個模型必須的兩個引數之一。由於損失函式種類眾多，下面以keras官網手冊的為例。在官方keras.io裡面，有如下資料： mean_squared_error或mse mean_absolute_err

C++中的函式指標和函式物件總結（轉）

篇一、函式指標函式指標：是指向函式的指標變數，在C編譯時，每一個函式都有一個入口地址，那麼這個指向這個函式的函式指標便指向這個地址。函式指標的用途是很大的，主要有兩個作用：用作呼叫函式和做函式的引數。函式指標的宣告方法：資料型別標誌符（指標變數名）（形參列表）；一般函式的宣告為: int func ( i

最詳細的 Android Toolbar 開發實踐總結（轉）

activity resource listener nba flat xmlns mat https ons 轉自：http://www.codeceo.com/article/android-toolbar-develop.html 過年前發了一篇介紹 Transluc

C++中的static關鍵字的總結（轉）

blank protected .com 如果發現內部實現屬於 out 服務　C++的static有兩種用法：面向過程程序設計中的static和面向對象程序設計中的static。前者應用於普通變量和函數，不涉及類；後者主要說明static在類中的作用。 1.面向過程

erlang程序優化點的總結（轉）

數據庫機器 ria 嚴重多線程分別是簡單構造代碼實現註意，這裏只是給出一個總結，具體性能需要根據實際環境和需要來確定霸爺指出，新的erlang虛擬機有很多調優啟動參數，今後現在這個方面深挖一下。 1. 進程標誌設置：消息和binary內

Java IO流學習總結（轉）

rar output 出現 arr system 不存在技術分享輸出寫入原文地址：http://www.cnblogs.com/oubo/archive/2012/01/06/2394638.html Java流操作有關的類或接口： Java流類圖結構：

C#中WinForm程序退出方法技巧總結（轉）

ren sender body 登錄 ble 按鈕動作打開 alt 一、關閉窗體在c#中退出WinForm程序包括有很多方法，如:this.Close(); Application.Exit();Application.ExitThread(); System.E

常見性能優化策略的總結（轉）

觸發 air 技術敏捷返回好的依賴 pan 支付看到一篇好文，轉過來好好學習閱讀目錄代碼數據庫緩存異步 NoSQL JVM調優多線程與分布式度量系統（監控、報警、服務依賴管理）案例一：商家與控制區關系的刷新job 案例二：POI緩存設計與實現

前端筆記----jquery入門知識點總結（轉）

outer 尺寸對象層級 ani 入門 fontsize fun click http://www.cnblogs.com/cwp-bg/p/7633623.html 一、jquery的加載方法 $(document).ready(function(){js代碼});

安卓手機GPU OpenCL總結（轉）

性能網上 gin bsp 策略測試的公司 ocl adding 前段時間，把市面上手機GPU OpenCL支持情況做了一個總結。總結如下：目前,手機 GPU 市面有四個公司產品:Qualcomm, Imagination Technologies,ARM, Viva

Linux命令總結（轉）

查看登陸 oca 下一個同時找到刪除用戶 mtime 高亮數值 1.ls [選項] [目錄名 | 列出相關目錄下的所有目錄和文件 -a 列出包括.a開頭的隱藏文件的所有文件 -A 通-a，但不列出"."和".." -l 列出文件的詳細信息 -c 根據ctim

Fiddler 抓包工具總結（轉）

人的現在手機 inspect bubuko lec 開啟區分 cmd 閱讀目錄 1. Fiddler 抓包簡介 1）. 字段說明 2）. Statistics 請求的性能數據分析 3）. Inspectors 查看數據內容

標準C++中的string類的用法總結（轉）

spa 大小它的 world 包括文本語法 ner append() 轉自：http://www.cnblogs.com/xFreedom/archive/2011/05/16/2048037.html 相信使用過MFC編程的朋友對CString這個類的印象應該

Altium Designer 精心總結（轉）

subject sig efault ica thread bject spa .html 技術 https://blog.csdn.net/qq_29350001/article/details/52199356 設置鋪銅間距規則，Electrical-Cle

HttpServletRequest 各種方法總結（轉）

請求客戶端 values AI 服務器程序去重 request 字符串重新　　HttpServletRequest對象代表客戶端的請求，當客戶端通過HTTP協議訪問服務器時，HTTP請求頭中的所有信息都封裝在這個對象中，開發人員通過這個對象的方法，可以獲得客戶這些信

Linux虛擬地址空間布局以及進程棧和線程棧總結（轉）

開始系統初始後來文本 lov fault 和數 ps命令變量大小一：Linux虛擬地址空間布局（轉自：Linux虛擬地址空間布局) 在多任務操作系統中，每個進程都運行在屬於自己的內存沙盤中。這個沙盤就是虛擬地址空間(Virtual Address Spac

Butterknife--Android Butterknife使用方法總結（轉）

black inner 混淆 ora RoCE max 通過要點 vat 原文鏈接：http://blog.csdn.net/donkor_/article/details/77879630 前言： ButterKnife是一個專註於Android系統的View註入框架,

19 Python標準異常總結（轉）

oar peer ror 變量 assert 屬性 nta 叠代 keyerror Python標準異常總結 AssertionError 斷言語句（assert）失敗 AttributeError 嘗試訪問未知的對象屬性

多年iOS開發經驗總結（轉）

1、設定UILabel行間距 NSMutableAttributedString* attrString = [[NSMutableAttributedString alloc] initWithString:label.text];

python包-numpy的函式和屬性總結（一）

NumPy是高效能科學計算和資料分析的基礎包。接下來為大家總結一些它的一些基礎知識。目錄 0.匯入numpy的包 1.資料型別 2.常用函式 3.NumPy.ndarray的屬性 4.NumPy.ndarray的函式 5.NumPy.ndarray的索引與切片

損失函式 loss function 總結（轉）

相關推薦