北大教授陳寶權:AI+三維視覺,讓機器人具備決策和執行力
人類不僅可以通過眼睛“看清”周圍環境中的東西,還能“識別並理解”這些東西,對這些東西形成“認知和決策”。現在,研究人員正努力讓AI也做到這一點。北京大學博雅特聘教授、前沿計算研究中心執行主任陳寶權的這篇精彩演講,對當前國內三維視覺智能領域研究概況、技術應用方向和未來前景做了精彩分析。
眾所周知,人工智能是模擬人類智能的技術,實現對人類智能的完全再現,是人工智能的終極目標。而人類智能是從人類的感官和認知開始的。所以,人類的感官往往成為研究人工智能的入手點,比如視覺。
對於人類而言,不僅可以通過眼睛“看清”周圍環境中的東西,還能“識別並理解”這些東西,對這些東西形成“認知和決策”。現在,越來越多的AI領域的研究人員正努力讓AI同樣做到這一點。從人類的三維視覺出發,三維視覺智能已成為人工智能研究和應用的熱門領域。
在今年3月27日新智元舉辦的“智能雲·新世界”AI技術峰會上,北京大學博雅特聘教授、前沿計算研究中心執行主任陳寶權發表了題為《三維視覺智能及應用》的演講,從研究人員的視角,對當前國內三維視覺智能領域研究概況、技術應用方向和未來前景做了精彩的分析。
以下為新智元整理的演講內容:
北京大學博雅特聘教授、前沿計算研究中心執行主任陳寶權
今天很高興有機會能夠在這裏發表演講!今天下午的講者主要來自於企業,我就從學術研究的角度,對現在非常流行的人工智能技術的重要分支——視覺智能來做下介紹。
說到視覺智能,大家都不陌生,人工智能的很多技術是基於人的各種感觀的,其中視覺感觀就是非常重要的一環。在視覺智能方面的很多技術已經在工業界得到非常好的應用。隨著應用的深入,越來越多的視覺智能技術進入“三維視覺智能”階段。也就是說,我們的眼睛不僅要看清某個東西,認識某個東西,還要走到這個場景裏面去,在三維世界裏真實地感受場景,如同身臨其境。
這就需要具有三維空間感知與認知能力的智能,即三維視覺智能。任何一個新的研究方向的出現都不是憑空而來,而是和許多其他學科交叉而來的。三維視覺智能的研究就是集合計算機圖形學、計算機視覺等領域的技術與傳統的人工智能、學習、大數據等很好地交叉融合。
三維視覺技術的發展得益於視覺傳感器的快速發展,已經在推動很多應用,比較有代表性的包括無人車、機器人,以及娛樂、影視等其它領域的應用。
三維視覺研究什麽?總結起來有幾大主要方向:鄭州不孕不育醫院排名:http://yiyuan.120ask.com/zzbyby/
首先是三維感知,也就是感知三維空間,獲取和處理三維深度等;然後是位置感知,比如感知相機的位置等;第三是三維建模,不僅對場景有基本的深度感知,還要獲得關於場景完整幾何模型的描述。最重要的就是三維理解,對場景和其中的物體從三維空間來進行理解。
三維視覺的發展得益於視覺傳感器的發展,而傳感器大致可以分為兩類,一類是被動傳感器,現在我們用的各種相機就是被動傳感器。另一類就是主動傳感器,比如激光掃描,以及各類以主動發射信號為主導進行測量的傳感器。大家知道,隨著手機的快速發展,未來的手機會同時配備兩類傳感器,也就是深度傳感器和傳統的顏色傳感器。
下面簡要介紹一下我們在這方面的一些探索性工作。2009年,當時大疆無人機還做定制化產品,我們請大疆做了一臺定制化無人機,目的用它來做傾斜角航拍,利用無人機從空中得到航拍影像,經過三維重建計算以後得到三維影像數據(註意,還不是完整的三維模型),有了三維描述就可以從任意視角自由地漫遊場景。可以看到,盡管用的只是二維傳感器,依然可以通過視覺計算得到三維數據的描述。
北大教授陳寶權:AI+三維視覺,讓機器人具備決策和執行力