AR技術新突破,基於圖的平面物體跟蹤演算法Gracker
所謂AR(Augmented Reality,增強現實)廣義上來說就是在現實環境上疊加虛擬場景,區別於VR,理解真實環境是AR的基本點。基於平面圖的視覺跟蹤是AR的核心技術之一,據瞭解,儘管目前AR發展迅速,但是計算機視覺演算法在處理平面跟蹤時依然還有很多不足,在平面圖片傾斜、陰影、遮擋、運動狀態下,AR的識別跟蹤還不穩定。
國內AR公司亮風臺研發出基於圖的平面物體跟蹤演算法,該可在強幹擾的場景下實現快速且準確的平面跟蹤。其成果論文已被人工智慧領域國際頂級期刊《PAMI》(IEEE模式分析和機器智慧彙刊)錄用,即將於2018年正式刊出。
該論文主要實現了:
提出將圖模型和圖匹配機制運用於平面物體跟蹤。
設計了一種能預測物體姿態和關鍵點匹配的新策略,並把這種策略整合到最優解尋找的問題中。
設計了一個帶有標註的真實場景資料庫,這個資料庫可以用來評估快速移動下的視覺跟蹤。
作者介紹
凌海濱,亮風臺首席科學家,Temple大學終身教授,曾就職於微軟亞洲研究院、西門子美國研究院。在T-PAMI、IJCV、T-IP、CVPR、ICCV、ECCV、AAAI、MICCAI等AI相關領域國際權威雜誌和頂級會議上發表論文140餘篇,曾任權威會議Area Chair、IEEE PAMI 編委,也是美國NSF Career Award獲得者。
王濤,北京交通大學碩博,主持和參與包括國家自然科學基金專案在內的科研專案20餘項。以第一作者在AAAI、CVIU等國際學術會議和期刊發表論文10餘篇。目前主要研究方向為基於圖模型的影象語義理解和計算。
下文內容由亮風臺編譯自論文原文,雷鋒網經授權選編。
基於圖的跟蹤演算法:Gracker
基於圖的跟蹤演算法Gracker能夠充分利用物體的結構資訊來提高跟蹤效能。為了表示物體的結構,我們將平面物體建模為一個圖而不是簡單的關鍵點集合。如此,將跟蹤問題轉化為圖匹配問題,利用幾何圖匹配演算法建立關鍵點的對應關係。
Gracker演算法的框架
具體地說,我們用圖對平面物體建模,圖的頂點由可靠的自動選擇機制生成而不是傳統的基於HoG的檢測子。這種機制使得圖結構更加穩定,因此本方法對極端環境變數具有魯棒性,例如極端照度條件和運動模糊。
除此之外,我們把特徵對應和姿態估計整合在一個統一的幾何圖匹配框架中。幾何圖中的二元限制條件能夠對全域性幾何關係編碼,這樣Gracker演算法對各種幾何和光學變換更具有魯棒性和精確性。
如何構造圖
將目標表示為無向圖,而不是一堆區域性部件或者星形模型。給定目標圖GM和候選圖GC,我們的目標是找到他們之間的最優對應關係,然後根據對應結果決定最優的目標狀態。可以按如下方式構造目標物體的模型圖:
1. 生成頂點:我們提取每一幀的關鍵點來表示區域性部分,然後建模為圖的頂點。經典演算法是通過搜尋不同縮放尺寸的DoG影象的區域性最小/最大值來獲得關鍵點,比如SIFT。然而關鍵點的數量會隨著檢測子和幀背景的變化而變化。另外,SIFT容易受到不同環境變化影響,例如:照度變化和運動模糊,這不利於跟蹤精度。我們採用更魯棒的方法提取關鍵點:首先對每個畫素R計算SIFT響應,隨後我們將R等分為N個網格,從每個網格中取最大的SIFT響應作為這個網格的關鍵點,將所選取的關鍵點建模為圖的節點,然後計算它們的描述子作為這個節點的屬性。
2. 生成邊:現存幾種普遍的邊生存方法,比如鄰域圖,K最近鄰圖和全連通圖。全連通圖包含了大量的結構資訊,但是它佔用太多儲存空間和計算時間,因此並不適用於實時應用。鄰域圖依賴於引數的選取,而且受到物體縮放問題的影響。我們使用狄洛尼三角剖分構建圖的邊,因為它具有平移、縮放和旋轉不變性。
對每一個輸入幀,我們用同樣方式構造一個候選圖Gt,然後將匹配問題表達為圖匹配問題。
圖匹配
給定規模為N的模型圖和候選圖,匹配問題可以視為尋找GM和Gt頂點的對應關係。一般的圖匹配問題中,兩個頂點集間的變換通常不被考慮,因為缺乏先驗知識。而對於物體跟蹤,我們可以利用先前幀的變換資訊引導匹配。我們提出了一種幾何圖匹配(GGM)框架將變換線索融入圖匹配。傳統的基於匹配的跟蹤方法將特徵匹配和變換估計區分計算,GMM方法的不同在於將特徵匹配和變換估計結合成一個統一的框架。
Gracker演算法效果
為了系統地評估演算法,我們採用了兩個常用的基準資料庫,UCSB[1]和TMT[2],和一個我們收集的快速運動資料庫。下面我們比較了Gracker和其他三個基準演算法Struck[3], IC[4], ESM[5]在兩個基準資料庫和我們收集的資料庫上的結果。
縮放:下圖是弱紋理的落日圖片。可以看到IC和Struck演算法出現目標丟失情況,而ESM和Gracker演算法給出更精確的結果。
傾斜:下圖書本傾斜的例子揭示了IC,ESM和Gracker演算法對傾斜具有魯棒性,而當物體處於極端傾斜的情況下,Struck演算法未能捕捉到物件物體。
平移和旋轉:所有的演算法都能處理小角度旋轉,但是大角度情況下,只有ESM和Gracker比較魯棒。在360幀之後由於運動模糊,ESM演算法變得不精確,而Gracker演算法在所有幀中更穩定。
遮擋和光線:下圖給出了幾種演算法在正常和黑暗的光照條件下的部分遮擋的實驗結果。基於模板的演算法如IC和ESM受到部分遮擋的影響。相反,基於匹配的演算法Struck和Gracker對部分遮擋更魯棒。在黑暗光照條件下,Struck演算法精度相對較低,因為其使用的基於HoG的檢測子在黑暗光照條件下檢測到的關鍵點不可靠。而我們提出的Gracker演算法在光線變化的情況下更魯棒。
運動模糊:IC和Struck演算法對運動模糊很敏感,所以從很早開始直到視訊結束都丟失了目標。ESM演算法基本上在每一幀裡面都捕捉到了物件物體,但是捕捉到的位置並不準確。相反,我們提出的Gracker在所有的幀裡都給出了更加準確的結果。
複合運動變換:下圖顯示了集平移,旋轉,傾斜和輕微的非線性變換的複合變換。從比較中我們可以看到,我們的Gracker演算法給出了最好的跟蹤結果。
部分參考文獻:
[1] S. Gauglitz, T. Hollerer, and M. Turk. Evaluation of interest point detectors and feature descriptors for visual tracking. IJCV, 94(3):335– 360, 2011.
[2] A. Roy, X. Zhang, N. Wolleb, C. P. Quintero, and M. J¨agersand. Tracking benchmark and evaluation for manipulation tasks. In ICRA, pages 2448– 2453, 2015.
[3] S. Hare, A. Saffari, and P. H. S. Torr. Efficient online structured output learning for keypoing-based object tracking. In CVPR, pages 1894–1901, 2012.
[4] S. Baker and lain A. Matthews. Lucas-kanade 20 years on: A unifying framework. IJCV, 56(3):221–255, 2004.
[5] E. Malis. Improving vision-based control using efficient second-order minimization techniques. In ICRA, pages 1843–1848, 2004.
相關推薦
AR技術新突破,基於圖的平面物體跟蹤演算法Gracker
所謂AR(Augmented Reality,增強現實)廣義上來說就是在現實環境上疊加虛擬場景,區別於VR,理解真實環境是AR的基本點。基於平面圖的視覺跟蹤是AR的核心技術之一,據瞭解,儘管目前AR發展迅速,但是計算機視覺演算法在處理平面跟蹤時依然還有很多不足,在平面圖片
亮風臺2D AR演算法新突破:基於約束置信度的魯棒跟蹤演算法(CCM) | ICRA 2018
在目前的AR應用中,2D AR跟蹤,如海報、卡牌等平面物體的跟蹤已經成為核心技術之一,在營銷、教育、遊戲、展示展覽等方面都很常見。然而,儘管近年來2D AR跟蹤演算法已經取得了很大的進步,但在一些外部條件、環境因素影響下的效果仍然有很大提升空間,如何處理光照變化、運動模糊等因
室內定位行業新發展,基於UWB定位技術的定位系統!
隨著物聯網科技的日益成熟,定位技術不再只是室外定位的專屬,各行各業對室內定位的需求都在日益增加。在日常生活中,我們常常用GPS定位技術來對人員、物體進行定位。而在很多企業,通常使用的都是UWB定位系統。 為什麼使用UWB定位技術? 首先,大多數的企業是對人員進行
可視對講技術新突破
通過 2015年 聯網 col 網絡連接 推出 自身 消息推送 移動化 2015年至今,“互聯網+”的概念盛行,樓宇對講行業也不例外。樓宇對講企業面臨著來自地產商自身轉型、互聯網創新力量以及互聯網技術更新換代帶來的替代威脅和挑戰。目前很多安防、自動化控制技術都可以和樓宇對講
光纖技術取得突破,網際網路速度或可提高100倍
據外媒報道,近日發表在《自然通訊》上的一篇文章稱,通過檢測扭曲成螺旋狀的光線,網際網路速度可以提高 100 倍。這項研究可用於輕鬆升級現有的網路,大幅提高傳輸效率。 光纖線纜使用光脈衝來傳輸資訊,但目前資訊只能通過光的顏色,以及波是水平的還是垂直的來儲存。 工程師
基於圖的聚類演算法綜述(基於圖的聚類演算法開篇)
基於圖的聚類演算法綜述 第三十二次寫部落格,本人數學基礎不是太好,如果有幸能得到讀者指正,感激不盡,希望能借此機會向大家學習。這一篇文章作為基於圖的聚類(Figure-based Clustering)演算法的開篇,簡要介紹了該類演算法的相關內容,併為之後的演算法詳解做鋪墊。
隨機數生成器,基於軟體的偽隨機數演算法
在工程中有時候需要用到隨機數函式來模擬一些情況,例如加密系統的金鑰來源可以用隨機數函式獲取。一般來說隨機數函式需要有以下性質:1:隨機性,不存在統計學偏差,是完全散亂的數列。2:不可預測性:不能從過去的的數列推算出下一個出現的數3:不可重現性:除非數列儲存下來,否則不能重新相
基於圖的異常檢測演算法——概述
正在調研基於圖的異常檢測演算法,先出個概述,後面再慢慢填坑 基於圖的異常檢測給定一個圖資料庫,找到其中罕見不同於其他資料物件的點/邊/子結構 靜態圖的異常檢測 普通靜態圖 基於結構
基於CUDA的光線跟蹤演算法 .
光線跟蹤是目前常用的主流繪製技術之一,由於它能方便地模擬生成複雜的光照效果,生成高質量的影象,在很多領域得到了廣泛的應用,如真實感繪製,虛擬現實,視覺化,計算機動畫等。但光線跟蹤演算法的計算開銷較大,妨礙了其應用效率。光線跟蹤渲染的主要運算操作耗費在光線與場景求交的過程中,
基於Deep Learning的跟蹤演算法總結(一)
博主最近主要關注使用深度學習的視訊跟蹤一系列演算法,本文為學習筆記,僅供學習交流,如有侵權,請指出。 No Free Lunch 不同於檢測、識別等視覺領域深度學習一統天下的趨勢,深度學習在目標跟蹤領域的應用並非一帆風順。其主要問題在於訓練資料的缺失。深
基於Deep Learning的跟蹤演算法總結(二)
本文主要談談TCNN(樹狀CNN)實現物體跟蹤演算法的大致流程和原理。 論文:《Modeling and Propagating CNNs in a Tree Structure for Visual Tracking》,應該是投了CVPR2017。 論文地
基於Deep Learning的跟蹤演算法總結(四)
題外話:博主這段時間忙於辦理簽證,比較忙,一直沒時間看論文。:-( 一、引言 深度學習具有強大的能力,但由於目標跟蹤任務本身的特殊性,深度學習一直沒能很好地發揮出自己的潛能。其中,導致深度學習演算法速度慢的一個重要原因是online-update,即更新過程
【轉】賈佳亞港中文團隊冠軍技術分享:最有效的COCO物體分割演算法
轉自:http://www.sohu.com/a/201822261_473283 【新智元導讀】物體分割(instance segmentation)是如今視覺領域最熱最核心的一個問題。在這屆國際影象識別權威競賽MS COCO當中,香港中文大學團隊UCenter取得了物
基於CUDA的光線跟蹤演算法
光線跟蹤是目前常用的主流繪製技術之一,由於它能方便地模擬生成複雜的光照效果,生成高質量的影象,在很多領域得到了廣泛的應用,如真實感繪製,虛擬現實,視覺化,計算機動畫等。但光線跟蹤演算法的計算開銷較大,妨礙了其應用效率。光線跟蹤渲染的主要運算操作耗費在光線與場景求交的過程中
恆潤科技助力江鈴威龍HV5智慧駕駛技術突破新高度,重卡行業迎來新紀元!
11月15日,江鈴重汽在廣州大觀路試駕基地舉行了江鈴威龍HV5的上市釋出會——“千里江鈴一日還”。本次釋出會上展現的江鈴威龍HV5重卡,是江鈴汽車在商用車領域的重大突破,是江鈴進軍重卡行業的有一次變革和超越,也是對自身產品安全、舒適、可靠、智慧的特質的信心! 江鈴威龍HV5具
AI輔助肝部病變分割技術再獲重要突破,騰訊優圖重新整理全球醫療影像大賽LiTS雙紀錄,可喜可賀!
最近,全球AI檢測肝病技術取得了新的突破。 近日,全球LiTS (Liver Tumor Segmentation Challenge,肝臟腫瘤病灶區CT影像分割挑戰)世界記錄再次被重新整理,騰訊旗下頂級AI實驗室-騰訊優圖實驗室聯合廈門大學組成的TencentX團隊,從近百支科研隊伍中脫穎而出
中資收購美新半導體,為何能通過CFIUS審查(其實是國內公司,技術水平國內領先,和國際仍有差距)
分享 並不是 盈利 私有 與此同時 科技 政府 產品 多次 日前,華燦光電發布公告稱,旗下子公司和諧光電收購美國美新半導體終獲得CFIUS審查通過。這是中資收購豪威科技、圖芯科技等公司之後,再次從美國成功收購半導體企業。而且本次中資收購美新半導體還是在特朗普上臺後,在強烈的
Web應用程序開發,基於Ajax技術的JavaScript樹形控件
實現 web應用 建立 tar 框架 目前 動態生成 方案 技術問題 感謝http://www.cnblogs.com/dgrew/p/3181769.html#undefined 在Web應用程序開發領域,基於Ajax技術的JavaScript樹形控件已經被廣泛使用,
[轉]直播新紅海,狼人殺火爆背後的語音視頻技術
個人體會 標桿 說話 做到 mat 升級 復制 win 對齊 本文轉自雷鋒網。 狼人殺,剛剛崛起,就陷入紅海競爭。 一切發展的太快,都還來不及思考,APP排行榜上就擠滿了同質化的狼人殺產品。 經過2016年直播元年的驅動,語音視頻雲服務已經相對成熟。因此,狼人殺語音視頻
matlab畫無向圖,基於坐標的無向圖聯系作者
OS SQ ret tex floor [] TP style 處理 %函數名netplot %使用方法輸入請help netplot %無返回值 %函數只能處理無向圖 %作者:tiandsp %最後修改:2012.12.26 function netplo