1. 程式人生 > >關於人群分析與行人識別的講座

關於人群分析與行人識別的講座

因此 講座 思想 效果 關於 分析 現在 印度 而且

今天上午實驗室請來了約翰霍普金斯大學的一個教授來做講座,講座主要內容是人群分析,當然也講了些其他東西。

不得不說聽這個疑似印度大叔的英語還是挺練聽力的,語速飛快,還好講的是我熟悉的領域,雖然有的地方聽的半懂不懂,但基本意思還是知道的

我印象比較深刻的有:

行人檢測,現在很多監控攝像頭都是在屋頂屋檐上,因此拍到的圖像也好視頻也好,很多都是拍到人的頭頂或者斜上方的角度,這種情況人臉是基本看不見的,基於人臉的檢測就很困難,另外一方面是現在很多行人檢測都是基於穿著服飾等外貌的,而一旦人進入室內換了衣服再出來,算法必然失效。考慮到這兩點苦難,有什麽辦法能彌補?我們講,只看頭,基本很難分辨人的,因為發型雖然不像衣服換的那麽勤,但是還是可能會有變化的,那麽從頭部還能有什麽信息呢,你絕對想不到他想出了啥,他認為人的那個發旋很可能具有分辨性。。。。。其實細細一想,貌似還挺有道理的。我個人很期待他們後續的工作??。

人群檢測,人群檢測主要還是在於計算人群當中人的數量,就是給一張照片,裏面是在某個場景下的一個人群,一般視角都比較遠,任務是給出照片裏有多少人,當前比較火的是用所謂的heat image,就是把這張照片轉化成一個反映人群密度的熱度圖,人相對密度大的地方,圖的顏色就深。他的工作也很有啟發性,他說,他們發現近些年的一些算法都有一個缺點,那就是在在計算人數時,密度大的,也就是人特別多的圖,那些算法不精確餓的原因在於總是少數,反過來,人比較稀疏的圖,算法傾向於多數。那麽一個直接的想法就是,我能不能先把圖分成人多和人少的,然後再分別回歸呢?這是一個改進,後來又發現,一張圖裏,人的密度分布時很不均勻的,有些地方全是背景,人就很稀疏,因此,把這個思想進一步應用到局部圖像區域上,對圖像區域也分成人多和人少的,再計算heat map。

另一個角度的改進來源於損失函數,上面提到,這些方法都是先由原始圖像生成一個熱度圖像,既然是一個圖像--圖像的任務,那麽生成對抗網絡是不是就可以用了呢,而且可以預先分析一下用了對抗損失,效果會不會變好,實際上,考慮到對抗損失更傾向於產生邊界清晰的圖像,因此結果必然更好。

這就是今天講座我印象深刻的點,可以說是非常有啟發性了。

關於人群分析與行人識別的講座