cs231n-assignment1-SVM/Softmax/two-layer-nets梯度求解

阿新 • • 發佈：2019-01-25

上週完成了cs231n的assignment1,作業中的難點是SVM/Softmax/two-layer-nets的梯度求導，特此寫篇部落格進行總結。
作業assignment1的資源連結在這裡：http://download.csdn.net/detail/pjia_1008/9797177

SVM梯度求導
SVM的梯度求導要考慮兩種情況，j==yi 和 j!=yi，此處 j表示誤分類項，yi表示正確分類的項。比如，輸入貓的圖片，共有三個進行預測的類別：狗、貓和車。在進行預測的時候“貓”這一項就是ground true正確分類的項，其餘兩項“狗”和“車”就是誤分類的項。可以根據course note中的例子進行理解：

分別對這兩種情況進行梯度求導，以下為筆記中的梯度求導公式：

乍一看感覺怎麼這麼複雜，其實括號裡面是個指示函式，對應原函式max的求導，只有在損失項大於零的時候，對應的求導值才大於零，上面的式子可以轉換如下，更易於理解：

第一種情況，j==yi,是針對正確項的梯度進行求偏導，也就是-WyiXi這一項；第二種情況，j!=yi,是針對誤分類項的梯度進行求導，WjXi這一項。這裡的分情況求導的思想也適用於Softmax和two-layer-nets的梯度求導。
Softmax梯度求導
Softmax與SVM，只是換了個損失函式，求導的思想類同，也需要分兩種情況 j==yi 和 j!=yi , Softmax損失函式和求導步驟公式如下：

具體看一下這個損失函式，這裡的 f 對應著scores

所以，這裡要運用鏈式法則，對梯度求偏導一共有兩層：

dscores/dw比較簡單，主要解釋dloss/dscores：
j!=yi 針對錯誤項分母進行求偏導：

j==yi 針對分子進行求偏導：

dloss/dscores到這裡就完成了，再繼續求dscores/dw=x,最終再乘上dloss/dscores就完成了softmax的梯度求導了！
two-layer-nets梯度求導
兩層神經網路最後採用了softmax作為歸一化輸出，所以dloss/dscores的求導與softmax的求導相同，完成dloss/dscores求導後再依次向前一層w2求偏導，RELU求偏導，w1求偏導，這裡不再重複贅述。

cs231n的視訊課中說computing the gradient 使用 analytically with calculus是error prone to implement,是因為運用微分求導時，首先需要通過損失函式進行手動梯度求導公式的推導，這裡面涉及分情況和分層，當神經網路的層數加深的時候，這個求偏導過程涉及的求導步驟也隨之增多，極易出錯，所以要使用後期的gradient check

cs231n-assignment1-SVM/Softmax/two-layer-nets梯度求解

上週完成了cs231n的assignment1,作業中的難點是SVM/Softmax/two-layer-nets的梯度求導，特此寫篇部落格進行總結。作業assignment1的資源連結在這裡：http://download.csdn.net/detail/

CS231N assignment1 SVM

from cs231n.classifiers.softmax import softmax_loss_naive 線性分類器SVM,分成兩個部分 1.a score function that maps the raw data to class scores,也就是所謂的ｆ(w,x)

斯坦福CS231n assignment1：softmax損失函式求導

斯坦福CS231n assignment1：softmax損失函式求導在前文斯坦福CS231n assignment1：SVM影象分類原理及實現中我們講解了利用SVM模型進行影象分類的方法，本文我們講解影象分類的另一種實現，利用softmax進行影象分類。

cs231n assignment1 關於svm_loss_vectorized中程式碼的梯度部分

個人覺得svm和softmax的梯度部分是這份作業的難點，參考了一些程式碼覺得還是難以理解，網上似乎也沒有相關的解釋，所以想把自己的想法貼出來，提供一個參考。首先貼上參考的程式碼： def svm_loss_vectorized(W, X, y,

CS231N assignment1——SVM

Multiclass Support Vector Machine exercise Complete and hand in this completed worksheet (including its outputs and any supporting

CS231n assignment1 -- Two-layer neural network

接近assignment1的尾聲了，這次我們要完成的是一個兩層的神經網路，要求如下： RELU使用np.maximum()即可； Softmax與作業上個part相同，可以直接照搬。不同的地方在求導，兩個全連線層，共有W1 b1 W2 b2四個引數。對於它

CS231n 作業1 SVM+softmax+兩層神經網絡

clas 天都 dao mar ref har svm .com 成了大概用了有小半個月的時間斷斷續續的完成了作業1，因為期間每天都還在讀論文，所以進度有些落後，不過做完感覺也是收獲頗豐。附上地址 http://note.youdao.com/noteshare?id=

cs231n作業：assignment1 - svm

title: ‘cs231n作業：assignment1 - svm’ id: cs231n-1h-2 tags: cs231n homework categories: AI Deep Learning date: 2018-09-27 14:17:45

斯坦福深度學習課程cs231n assignment1作業筆記三：softmax實現相關

任務實現向量化的損失函式實現向量化的梯度計算分析梯度與數值梯度的驗證使用驗證集來選擇超引數使用SGD優化方法視覺化權重理論知識 softmax損失函式令W為權重矩陣，大小為D×C；x為輸入，大小為1×D；b為偏置項，大小為1×C。那麼模型的輸

斯坦福cs231n課程記錄——assignment1 SVM

目錄 SVM原理某些API解釋 SVM實現作業問題記錄 SVM優化 SVM運用參考文獻一、SVM原理線性SVM分類是給每一個樣本一個分數，其正確的分數應該比錯誤的分數大。在實際分類中，為了提高分類器的魯棒性，我們希望正確的分數比

cs231n 卷積神經網路與計算機視覺 2 SVM softmax

linear classification 上節中簡單介紹了影象分類的概念，並且學習了費時費記憶體但是精度不高的knn法，本節我們將會進一步學習一種更好的方法，以後的章節中會慢慢引入神經網路和convolutional neural network。這種新的演

cs231n assignment1--Softmax

svm實現完了，這部分會相對比較輕鬆，大部分和svm類似。關於梯度的推導，我主要參考這篇文章 http://www.jianshu.com/p/004c99623104multiclass 梯度推導：向量化的實現和svm類似，實現過svm應該不難

斯坦福深度學習課程cs231n assignment1作業筆記二：SVM實現相關

前言本次作業需要完成：實現SVM損失函式，並且是完全向量化的實現相關的梯度計算，也是向量化的使用數值梯度驗證梯度是否正確使用驗證集來選擇一組好的學習率以及正則化係數使用SGD方法優化loss 視覺化最終的權重程式碼實現使用for迴圈計算SVM

cs231n 卷積神經網路與計算機視覺 2 SVM softmax

linear classification 上節中簡單介紹了影象分類的概念，並且學習了費時費記憶體但是精度不高的knn法，本節我們將會進一步學習一種更好的方法，以後的章節中會慢慢引入神經網路和convolutional neural network。這種新的演算法有兩

視頻顯著性檢測-----Predicting Video Saliency using Object-to-Motion CNN and Two-layer Convolutional LSTM

layer lin -- 分享圖片組合 object idt red 9.png 幀內顯著性檢測：將卷積網絡的多層特征進行組合通過unsampling 得到粗顯著性預測；幀間顯著性檢測：（粗檢測結果+新卷積網絡的特征圖，最後+之前卷積網絡的卷積特征輸入到LST

CS231N assignment1

位置元素 rand ali num 計算 ini itl 分享圖片 # Visualize some examples from the dataset. # We show a few examples of training images from each cla

svm 損失函式以及其梯度推導

一般而言，score_matrix=WX W是係數矩陣，X是data_matrix，這兒是學習cs231n的筆記，為了與其程式碼內w，x的含義保持一致，以下統一使用XW來計算score_matrix。背景是用svm實現圖片分類，輸入引數如下： N 代表樣品個數，D 代表畫素個數，C代表

CS231n Assignment1總結

lecture3一些關於鏈式法則的基本知識。下面是對assignment1的程式碼一些關鍵點或者有意思實現的總結參考答案：https://github.com/sharedeeply/cs231n-assignment-solution/blob/master/assignment1/

影象與機器學習-2-基礎知識及cs231n/assignment1

part 1 機器學習基礎知識：包括線性迴歸，邏輯迴歸，交叉熵，softmax,KNN,神經網路中梯度的傳遞思想。關於線性迴歸和邏輯迴歸部分的知識，可以參考這個部落格的內容，就不再累述：http://blog.csdn.net/viewcode/article/details/8

CS231n assignment1 Q5 Level Representations: Image Feature

這個作業是討論對影象畫素進行進一步計算得到的特徵來訓練線性分類器是否可以提高效能。對於每張圖，我們會計算梯度方向直方圖(HOG)特徵和用HSV（Hue色調，Saturation飽和度,Value明度）顏色空間的色調特徵。把每張圖的梯度方向直方圖和顏色直方圖特徵合併形成我們最後的特徵向量。 HOG大致可以捕捉

cs231n-assignment1-SVM/Softmax/two-layer-nets梯度求解

相關推薦