1. 程式人生 > >DNN反向傳播推導的嚴格表述

DNN反向傳播推導的嚴格表述

  近期把DNN的反向傳播又好好的研究了一下。之前一直有疑慮是因為很多文件裡邊出現z(l+1)z(l)這種表示式,然後z(l+1)z(l)還是矩陣,這下就變得非常煩人了,因為沒有哪本數學書定義了矩陣對矩陣的導數。只有標量函式對矩陣,矩陣對標量,標量對向量,向量對標量以及向量對向量。所以我覺得有必要在好好把這塊弄一下,寫清楚。

  首先是DNN的模型:

(1028){z(l+1)=θ(l+1)
a(l)+b(l+1)1T,a(l)=g(z(l+1)),l=1,2,3,,NJ=J(a(N))

這裡邊,a(1)=X也就是輸入,1是列向量。然後:

(1029)X=(||X1Xm||)
也就是說,一共有m個樣本。

  通常的文章怎麼描述的呢?定義δ(l)=Jz(l),假如計算出了δ(l)那麼Jθ(l)=Jz(l)z(l)θ(l),然後