triplet loss
因為待遇低,因為工作不開心,已經嚴重影響了自己的工作積極性和工作效率,這幾天發覺這樣對自己實在是一種損失,決定提高工作效率,減少工作時間。
說說最近做的tracking, multi-object tracking。
object tracking首先要有object才能tracking是吧,而學術上研究的大多數single object tracking,其實就是單目標跟蹤,就是開始你畫個區域,告訴算法你要跟蹤的是那個東西,然後接下來的視頻裏,把這個東西框出來。而實際應用的多是multi-object tracking,就是找出來所有目標,然後自己去跟蹤。以下說的都是multi-object tracking.
目前deep learning如火如荼的時代,tracking也無法逃避Deep learning的魔掌的。目前的思路,效果比較好的就是檢測時用深度學習檢測,而匹配時,不再簡單的用位置匹配,而是用該object的深度特征進行匹配,這樣用的原因當然有多種,一種是比位置更加魯棒,隔了多幀,位置已經跑遠了,可能也沒關系的,再者這種特征匹配能更好地處理遮擋的問題,至少比位置匹配更能處理遮擋問題。當然跟蹤還是用kalman濾波做一下平滑處理,哈哈,其實我以前做多目標跟蹤時不用kalman,直接匹配上了就是了,不做預測不做平滑啥的。
其中檢測,目前不少都用的是靜態圖像的檢測機制,但是我覺得下一波應該就是基於視頻的目標檢測吧,當然工作已經有不少了,可以去imagenet競賽官網去看看做的比較好的那幾家看看,基本代表了先進性吧。
而深度特征,目前更多的是用行人重識別的思路進行模型訓練的,我本來是想用以前做人臉比對的模型simese loss訓練網絡的,因為之前最開始用這個網絡訓練人臉比對的工作時,我找的代碼,訓練效果還挺好的,後來借用到汽車的特征,效果也提升很多。但是看了一下,大家都用triplet loss來做,我也想用這個來試試。說實話,triplet loss不好訓練。找了好幾份代碼,都不好訓練,後來github上找了一個別人有實現結果的代碼,我就改變了一下輸入還是不行,下降不了,後來改了一下輸入大小,可以下降了,但是也不穩定,不能保證每次都下降。
聽同事說,他之前訓練車的triplet loss,就訓練不下來。其實說實話,計算機還是沒有那麽高級,或者說算法還是不適合去處理這種具有模糊邏輯的事情,你讓他看同一類,還看不同類,還看距離多大,同時做,大概也和人一樣,有時候會糊塗吧。
triplet loss