1. 程式人生 > 其它 >3D目標檢測讀後感(一)

3D目標檢測讀後感(一)

今天看了一篇文章Automatic Camera Calibration for Traffific Understanding

Automatic Camera Calibration for Traffic Understanding [BMVC 2014]_嗶哩嗶哩_bilibili

只有短短一頁內容,但是從視訊來看,方法很實用。

大致是解決了交通監控的3d檢測框問題。第一步,是求解了影象中每個點的絕對座標系方向,作者稱為確定車輛流的3個消失正交點。消失點指的是視覺相交點,透檢視中的概念。

第二步,是構建3D目標檢測框,從blob區域與每個點的切線方向開始構建。文章中作者沒有說明如何求取切線,我認為應該是利用了sobel運算元來求切線。

作者只寫了短短一頁紙,要講清所有內容是不現實的,一些重要的細節根本沒說,只能留給讀者無限的遐想,想要復現該演算法幾乎不可能。

又看了他的文章BoxCars: Improving Fine-Grained Recognitionof Vehicles using 3D Bounding Boxesin Traffific Surveillance

這次有原始碼。順應時代發展,作者提出了一些基於深度學習求解三個消失點的方法。他認為,3D檢測的關鍵就是求解三個消失點。一些細節部分還是寫的很簡略。

第三章中的D節,他利用CNN求解消失點方向,然後結合車輛輪廓來求解3D檢測框,就像他上一篇文章做的一樣。