Softmax 函式的特點和作用(轉載)
阿新 • • 發佈:2019-02-04
Logistic 分類器
分類問題,是機器學習裡最基礎的問題。
我們從最簡單的二分類任務開始考慮,假設我們要分類西瓜是否成熟的話,則對於每一個西瓜來說,就有兩種結果:。首先我們必須自己知道如何判斷一個西瓜“熟”或者“不熟”,或者是根據顏色,或者是敲打的聲音,這是下一步我們將其轉成數學的對映關係的基礎。
為了建立數學模型,我們必須將這個判斷西瓜是否成熟的任務轉換成數學關係。假設“熟”對應於數軸上的“1”,不熟對應於數軸上的“0”。下一步我們需要找到兩個對映關係,。
- 將需要分類的西瓜樣本(假設為)對映到一個數軸上,;
- 再使用將第一個對映的結果對映到標籤分類上。
假設分類標記為,通常我們會選擇這樣一個階躍函式從而建立起第二個對映:
但是這樣的階躍函式,由於是不連續的,在計算過程中不可導,因此,一般用一個對數機率函式(logistic function)來替代。需要注意的是,這種替代並不是唯一的。對數機率函式(logistic function)有這樣的形式:
它的函式影象是這樣的:
可以看出,在
softmax函式
對於二分類任務,由於結果只有兩種,將樣本對映到數軸上。而拓展到多分類任務時,假設有種結果,那麼會對映到一個維向量()當中。向量中的每一維,都對應著一個可能的分類結果(或1)。由於結果是互斥的,所以存在以下種形式:
先看下softmax函式的公式:
Softmax 的輸出表徵了不同類別之間的相對概率。
假設最後輸出的向量是: