深度學習第四課第三週
阿新 • • 發佈:2019-01-06
Object Detection
1.Object localization
以前的分類問題經過softmax後輸出其屬於哪一類即可,對於目標定位,經過softmax後還得多輸出其位置資訊。
bx,by是位置,bw和bh是寬度和高度。
這裡輸出假設分類定位問題是隻有一個物件,當影象中有目標時pc=1,列表中還會包含位置資訊(bw,bh,bx,by),c1=1代表目標是pedestrain,c2=1代表目標是car,c3=1代表目標是motorcycle.當沒有車時,當pc=0時說明目標不存在,其它引數這時就無意義了。
2 Landmark Detection
3.Convolutional implementation of sliding windows
這裡把全連線層用卷積層代替,在數學上效果一樣。
使用滑動視窗,不需要把輸入圖片分割成多個子集(傳統的是把一張圖片裁剪多塊分別丟入卷積網路分析,效率較低,而且會有很多計算重複),分別執行前向傳播,而是把整張圖片輸入,這樣共有區域可以共享很多計算,一次性得到所有預測值。
4.Intersection over union
簡單來說就是用交集初除上並集,衡量定位效果的。