1. 程式人生 > >機器學習中的求導

機器學習中的求導

基礎知識

機器學習中常見函式求導

  • 冪次
    ( x u ) =

    u x u 1 (x^u)^\prime=ux^{u-1}

  • 指數
    ( e x ) =

    e x (e^x)^\prime=e^{x}

  • 對數
    ( log a x ) = 1 x ln a (\log _ax)^\prime=\frac{1}{x\ln a}
    ( l n x ) = 1 x (ln x)^\prime=\frac{1}{x}

求導四則運算

( u ± v ) = u ± v (u \pm v) = u^\prime \pm v^\prime
( C u ) = C u (Cu)^\prime=Cu^\prime
( u v ) = u v + u v (uv)^\prime=u^\prime v + u v^\prime
( u v ) = u v u v v 2 (\frac{u}{v})^ \prime=\frac{u^\prime v - uv^\prime}{v^2}
顯然除法的公式可以從乘法公式推匯出來

複合函式求導

一個函式的自變數是另一個函式的因變數,前者稱為複合函式。
y = f ( g ( x ) ) y=f(g(x)) 其中 y = f ( u ) y=f(u) , u = g ( x ) u=g(x) 都可導,則

d y d x = d f d g d g d x \frac{dy}{dx}=\frac{df}{dg}\frac{dg}{dx}

上面比較簡單,因為 f f 中只有一個函式 g g , 如果
y = f ( g 1 ( x ) , g 2 ( x ) , g 3 ( x ) , . . . , g n ( x ) ) y=f(g_1(x), g_2(x),g_3(x),...,g_n(x))

d y d x = i = 1 n d f d g i d g i d x \frac{dy}{dx}=\sum_{i=1}^{n}\frac{df}{dg_i}\frac{dg_i}{dx}

f f 中包括多個函式,則每個函式都對 x x 求導,結果相加

再複雜一點
y = f ( g 1 ( x 1 , x 2 , x 3 , . . . , x m ) , g 2 ( x 1 , x 2 , x 3 , . . . , x m ) , g 3 ( x 1 , x 2 , x 3 , . . . , x m ) , . . . , g n ( x 1 , x 2 , x 3 , . . . , x m ) ) y=f(g_1(x_1,x_2,x_3,...,x_m), g_2(x_1,x_2,x_3,...,x_m),g_3(x_1,x_2,x_3,...,x_m),...,g_n(x_1,x_2,x_3,...,x_m))