softmax函式的定義及求導
阿新 • • 發佈:2019-01-24
本文中
在監督式的深度學習中,輸入通常是一個向量,用
- 標量。
y 表示輸入x 屬於某一類別的概率。 - 向量。此時輸入
x 可能屬於多個類別。y=(y0,y1,...,yn) 。元素yi 代表向量屬於類別i 的可能性。數值越大,可能性越高。但是,深度學習模型輸出的yi 不必然是介於0和1之間的概率值,softmax 函式的作用就是對向量進行歸一化,生成概率值。
也就是說,
圖中表示了從輸入到輸出的一個轉換過程,引數有6個,可以寫成一個矩陣的形式。
針對這個具體例子則有。
為了方便書寫,令