1. 程式人生 > >機器學習常見的矩陣求導總結

機器學習常見的矩陣求導總結

常見求導公式

1.

(xTAx)x=(AT+A)xx為向量

2.
tr(XTX)X=2XX為矩陣

3.
tr(XTAX)X=(A+AT)XX為向量

4.
tr(ATB)A=BX為向量

5.
tr(X)X=IX為向量

6.
((yXw)T(yXw))w=2XT(Xwy)

  其中w為向量,X為矩陣

證明

幾個定理

證明以上公式之前,先看幾個定理。

  1. 命題:如果
    df(X)=tr(AdX)

        那麼
    f(X)X=AT

    對向量x也是如此。
  2. tr(ATB)=tr(BTA)
  3. (dX)T=(dx)T
  4. d(tr(X))=t
    r(dX)

公式證明

  1. (xTAx)x=(AT+A)xx為向量

    證明:首先將標量函式寫成跡函式形式,然後利用矩陣乘積的微分易得df(x)=d(tr(xTAx))=tr[(dx)TAx+xTAdx]=tr([dxTAx]T+xTAdx)=tr(xTATdx+xTAdx)=tr(xT(A+AT)dx)
    由命題可知:tr(xTAx)x=[xT(A+