深度相機---(5)深度相機應用
深度相機的應用在智慧人機互動、人臉技術、三維重建、機器人、AR等領域全面開花,目前商用深度相機最成熟的應用就是移動終端上基於人臉技術的多種有趣應用。
人臉技術
二維人臉技術發展了幾十年雖然已經比較成熟,但是人臉關鍵點檢測在各種大角度、多表情、複雜光照、面部遮擋等情況下,想要實現實時魯棒的高精度檢測仍然比較困難。
而高精度深度相機的出現極大的推動了人臉技術的發展,從二維直接躍升到三維。不得不說,iPhoneX的前置深度相機可謂是把三維人臉技術提升到了一個新的高度。它不受制於自然光照,即使前景和背景顏色相近也能實現完美的分割,在複雜頭部姿態下的表現大大優於二維人臉技術。基於結構光的深度相機通過3萬個紅外散斑重建的三維人臉模型非常精細。
有了精細的三維人臉模型,可以發展出一系列超級實用、好玩的應用。下面的應用場景有些是剛剛商用的,有些還在萌芽狀態。
1、更加精細自然的背景虛化
相比於雙攝的背景虛化,深度相機能夠重建高精度的三維人臉模型,虛化效果層次感更強,細節更加豐富,人像更加立體自然。
2、人像光效
人像光效的功能可以模仿專業人像攝影時的打光效果,營造出讓人讚歎的影棚級效果。
3、動畫表情
動畫表情可以將人臉表情實時轉移到玩偶上,是一個非常有趣的應用,正是得益於深度相機獲取的精細的 三維人臉模型,才能實現如此精細的表情捕捉。
4、三維美顏
可以不誇張的說,三維美顏是對二維美顏的降維打擊。二維美顏效果一般比較誇張,丟失了人臉本身的很多特徵,導致常常“認不出來自己”的尷尬。
而三維美顏更強調真實和立體,不僅能夠全面繼承二維美顏的效果,還可以根據三維的臉型進行定製化“微整容”,如隆鼻、豐脣、削掉高顴骨,去掉雙下巴,調整五官比例等;此外還可以增加光影效果,如增加鼻子、臉頰兩側的陰影,使得人臉看起來更有立體感和真實感。
5、三維人臉活體識別
我在《一張照片就能破解vivo x20人臉解鎖?普通人也能看懂的人臉解鎖專業解讀在這裡!》中寫過,三維人臉識別是真正安全的人臉識別,可以有效的避免照片/屏顯圖片、換臉演算法、戴面具/3D人臉模型等破解方法。非常適合於活體檢測。
6、人眼視線校正
很多時候我們拍美照時並沒有直視鏡頭,回看時懊悔不已。其實這個可以通過演算法進行校正。根據人臉三維模型,結合人的面部朝向,我們可以將視線的方向調整到正對攝像頭的方向,產生的視覺效果更有衝擊力。
當然,這只是一個典型的應用。理論上來說,我們可以任意操縱眼球的轉動,基於此可以開發一些好玩(奇怪)的應用。
智慧人機互動
1、人體骨架提取和跟蹤
Microsoft推出的Kinect系列深度相機就是專門為體感遊戲而生的。經過多年的市場教育,相信大家都比較熟悉,不多說。
體感互動背後的關鍵技術就是人體骨架提取和跟蹤。傳統基於RGB影象的骨架提取跟蹤技術在有多人交疊的情況下效能下降很快,而深度相機生成的深度圖可以很方便的區分不同遠近的人體和背景,這非常有利於多人交疊下不同人體骨架的提取。
2、手勢識別跟蹤
和人體骨架提取和跟蹤類似,手勢識別跟蹤也屬於自然肢體語言。相較於RGB相機,深度相機可以更快速更準確的實現手指關鍵點的提取和跟蹤。
基於手勢識別跟蹤可以開發很多實用、有趣的應用。第一個廣泛的應用就是遊戲娛樂:比如在射擊類遊戲中,你只要把手握成手槍狀,食指扣動就可以“放槍”,這種從孩童時期就很熟悉的身體語言被運用到遊戲中,讓使用者感覺自然而親切。第二個就是在環境苛刻或比較危險的特殊行業,有極大的應用需求:比如通過手勢可以非接觸式的操控無塵車間機器或者危險區域工作的裝置,可以解決很多實際問題。
三維重建 & 機器人
1、三維空間測繪
深度相機本身就可以直接測距,下圖是Phab2 pro手機後置TOF深度相機在三維空間測量示意圖。
2、物體三維重建
以前對人體或者物體進行三維重建需要複雜的鐳射掃描裝置,距離消費級應用還很遙遠。隨著技術的發展,高精度、小型化的深度相機可以方便快速的完成掃描和三維重建工作。這可以極大的促進虛擬試衣,三維列印等技術的發展。
3、大尺度三維空間地圖重建
和小尺度的物體重建不同,較大尺度的三維空間地圖重建難度更高,一直都是學術研究的前沿,其中關鍵技術稱為即時定位與地圖構建(SLAM,參考文章《SLAM初識》)。SLAM是智慧機器人和AR的核心技術之一。基於RGB-D深度相機的SLAM也一直是研究熱點,隨著深度相機效能的提升及演算法的迭代,高精度實時魯棒的SLAM技術正越來越成熟。
4、機器人自主導航
深度相機的水平視場角能夠直接探測障礙物的距離,垂直視場角可以探測地面凸起或者上方障礙物,這極大提升了機器人利用視覺避障的能力。
在自身定位及地圖重建導航方面,三維的視覺SLAM應用明顯優於二維視覺SLAM。但三維視覺SLAM距離商用還有一段路要走,主要的原因有兩個:一是深度相機的遠距離測量精度還不夠理想,它比鐳射雷達測到的平面資料在精度和穩定性都要差一些;二是RGB-D SLAM的演算法和應用還需進一步發展完善,其效能效果和計算資源的消耗尚無法滿足成熟商用需求。
AR
AR大規模商用離我們越來越近了。想要實現實時的、身臨其境的AR體驗離不開高幀率、高魯棒的深度圖。AR互動核心技術之一是實時精準的SLAM技術,基於深度相機的SLAM方案是一個比較靠譜的解決方案。
總結
目前深度相機在移動端的應用需求非常強烈,但是大部分的消費級深度相機仍存在:體積較大,成本較高,精度及魯棒性不足的問題。因此適用於移動端的深度相機模組、計算機視覺演算法資源比較稀缺。不過,受蘋果的影響,目前整個安卓手機產業鏈正在快馬加鞭,快速跟進適用於手機端的深度相機解決方案。
預計未來的幾年,深度相機會大量出現在智慧手機、智慧電視、AR/VR裝置、智慧穿戴裝置等消費電子產品中。到時就不僅僅是全面開花,而是深度相機全面爆炸的時代了。