1. 程式人生 > >深度學習第四課第三週

深度學習第四課第三週

Object Detection

1.Object localization

這裡寫圖片描述
以前的分類問題經過softmax後輸出其屬於哪一類即可,對於目標定位,經過softmax後還得多輸出其位置資訊。
這裡寫圖片描述
bx,by是位置,bw和bh是寬度和高度。
這裡寫圖片描述
這裡輸出假設分類定位問題是隻有一個物件,當影象中有目標時pc=1,列表中還會包含位置資訊(bw,bh,bx,by),c1=1代表目標是pedestrain,c2=1代表目標是car,c3=1代表目標是motorcycle.當沒有車時,當pc=0時說明目標不存在,其它引數這時就無意義了。

2 Landmark Detection

這裡寫圖片描述

3.Convolutional implementation of sliding windows

這裡寫圖片描述
這裡把全連線層用卷積層代替,在數學上效果一樣。
這裡寫圖片描述
使用滑動視窗,不需要把輸入圖片分割成多個子集(傳統的是把一張圖片裁剪多塊分別丟入卷積網路分析,效率較低,而且會有很多計算重複),分別執行前向傳播,而是把整張圖片輸入,這樣共有區域可以共享很多計算,一次性得到所有預測值。

4.Intersection over union

這裡寫圖片描述
簡單來說就是用交集初除上並集,衡量定位效果的。

More generally, IoU is a measure of the overlap between two bounding boxes.