1. 程式人生 > >人臉識別、AI與大資料:技術挑戰與突破

人臉識別、AI與大資料:技術挑戰與突破

——訪IEEEFellow,國際知名計算機視覺、模式識別、機器學習、生物特徵識別領域理論、技術和應用研究專家,英國Surrey大學博士,中科院資深研究員,中科院優秀百人計劃,生物識別與安全技術研究中心主任,中科奧森創始人李子青。

比爾·蓋茨曾下過這樣的斷言:生物識別技術將成為未來幾年IT產業的重要革新。蓋茨言論的背後支撐是,越來越多的個人、消費者、公司乃至政府機關都承認,現有的基於智慧卡、身份號和密碼的身份識別系統是遠遠不夠的,生物特徵識別技術將在未來提供解決方案方面佔據重要的地位。

儘管我國人臉識別技術起步較晚,但發展非常迅速,在人臉識別精度方面,更是屢屢打破世界紀錄,取得世界矚目的成績。隨著人臉識別技術的快速提升,人臉識別應用領域也在加速落地。近兩年,人臉識別在銀行、證券、金融社保、交通、教育、電子商務、高考、機場、地鐵等場景應用頻頻刷屏,熱度居高不下。

近期,《大資料週刊》專訪了IEEEFellow,國際知名計算機視覺、模式識別、機器學習、生物特徵識別領域理論、技術和應用研究專家,英國Surrey大學博士,中科院資深研究員,中科院優秀百人計劃,生物識別與安全技術研究中心主任,中科奧森創始人李子青。他就人臉識別技術的精準度、安全風險以及主要挑戰做了分享。

從2000年加入微軟研究院起,李子青博士即開始以應用為導向,把計算機視覺、機器學習應用到人臉識別及監控視訊分析。在國內,李子青制定了十多個TC28/SC37國家標準和TC100/SC2的公安部行業標準,包括生物特徵識別術語、人臉識別應用分類、動態人臉監控,近紅外人臉識別、出入口控制、人證核驗、人臉活體防偽、人臉資料格式與介面等。迄今參與的國家級應用包括2005年的深圳羅湖自助通關的人臉識別系統,2008年北京奧運人票實名核驗,2010年上海世博的出入口管理,2012年國家物聯網應用示範(無錫市公安局落地)的人臉識別平臺,2013年羅湖水客識別系統等。

人臉識別標準,行業發展必備標尺

《大資料週刊》:工信部發布的《促進新一代人工智慧產業發展三年行動計劃》,其中一個目標是到2020年,複雜動態場景下人臉識別有效檢出率超過97%,正確識別率超過90%,支援不同地域人臉特徵識別。那麼當前人臉識別有效檢出率和正確識別率是多少?實現這一目標要做好哪些準備?

李子青:這個行動計劃說明國家對生物特徵識別、視訊理解、跨媒體融合等技術創新,發展人證合一、視訊監控、影象搜尋、視訊摘要等典型應用,拓展在安防、金融等重點領域的應用的重視和支援。但其中的“有效檢出率超過97%,正確識別率超過90%”,提法不專業,因為檢出率和識別率,每個都指標必須是兩個數字成對出現,也就是還需要加上相對應的“虛警率”,所以解讀時不必糾結其中的兩個數字的實際技術含義。另外,技術指標一定和測試資料的構成和難易程度有關。該《行動計劃》提到了“複雜場景”這個概念,這也比較模糊,我想它所指的主要是安防監控場景的行進中的動態人臉識別,這個的確是目前最難的應用場景之一,有賴於技術的提升和突破。

《大資料週刊》:有人擔心人臉識別的準確率越高,在網際網路環境下風險就越大,因為一旦採用生物特徵認證,就會有特徵資料庫來記錄,如果密碼洩露還可以換,而生物特徵不可再生,您怎麼看待目前的資訊保安?大家在刷臉的時候該注意什麼?

李子青:這個說法不準確,正相反,人臉識別的準確率做到百分之百準確才是最好。這個擔心應該指的是,人臉識別的準確率越高,則更有可能被假體攻擊–這是一個質疑,但並非完全如此,因為人臉身份識別和假體攻擊識別是一個應用中的兩個技術問題。提出這個質疑,反映了公眾對人臉識別應用的一些擔憂。的確,對授權類的人臉識別應用來說,比如個人賬戶登入、個人業務辦理、關鍵出入口控制等利用人臉進行身份核驗的業務等,需保障使用者的身份不被假冒,所以這類應用系統應具有識破假體攻擊、並加以阻止的能力,對非值守的身份核驗應用,尤為如此。

假體攻擊主要有三種類型:人臉圖片/照片列印、人臉影象視訊顯示器播放、各種材料的面具,其中模擬皮面具成本最高,也最具攻擊性、最難防。假體攻擊識別與人臉識別,是兩個技術上相關聯但不同的環節,一般是使用兩套不同的核心演算法。防假體攻擊的技術核心是,識別人臉影象來自肉身還是假體。採用純演算法軟體實現成本最低,但安全性保障不足,比如2017年315晚會上爆出的人臉識別安全性漏洞,即為對純演算法軟體的防偽方式的成功攻擊。光電硬體+演算法軟體的解決方案,可靠性會高很多,比如中科奧森首創的雙目多光譜人臉活體檢測防偽解決方案。

使用者在使用人臉識別作為授權認證時應謹慎,照顧好自己的隱私資訊不要洩露,刷臉的使用方式,在刷臉成功率方面,按照使用的提示做;在活體防偽方面,使用者沒有可以控制的能力,安全性由該應用提供方人臉識別系統的防範假體攻擊能力所決定。我制定了一個刷臉的活體防偽行業標準,目前正在做一個相應的國標,其中制定了防假體攻擊的技術要求。

突破發展瓶頸,大資料是關鍵因素

《大資料週刊》:目前人臉識別技術的主要挑戰是什麼?發展到了哪個階段,在哪些領域應用較成熟?

李子青:這個可以從AI和大資料的角度來看。AI經歷了隨符號主義的盛行到其第二個寒冬的衰落。神經網路,在聯結主義框架下,作為當年與符號主義對立的技術學派,也經歷了一個半死不活的過程,直到2006年,被深度學習再度啟用,並奇蹟般發展壯大,不僅帶動了計算機視覺、語音識別等AI子領域的技術與應用發展,更是引發了AI的第三波熱潮。

深度學習帶來的成就,離不開標註大資料的支撐;有監督深度神經網路的效能很大程度上依賴於資料標註規模和質量。目前深度學習通過架構、演算法改進,以及標註資料規模的擴大,仍然有一定的提升空間,但這個速度將會比較緩慢。由於資料標註資源現在已經用到了接近極限(見李開復談AI與大資料)。我個人認為,目前深度學習引擎的效能已比較靠近天花板。

人臉識別在兩個方面仍然需要有技術完善和技術突破。第一個是前面提到的刷臉應用中的人臉活體檢測與防偽。第二個是非配合條件下的人臉識別,如反恐、治安視訊監控中的動態人臉識別,核心引擎的準確率尚未能滿足實際應用需求,其表現為誤報率太高,經常發生“狼來了”的誤報警。

上述問題本質上仍然是前面所說的深度學習瓶頸–受限於正確標註的大資料。解決這個瓶頸或突破天花板,是人臉識別、計算機視覺和AI的關鍵所在,也是國際巨頭研發的主攻方向之一;如Google的Capsule、Facebook的進化學習,DeepMind的AlphaZero。

創新解決當下,賦能未來

《大資料週刊》:2018年AI有怎樣的發展趨勢?中科奧森作為全球領先的人臉識別技術及解決方案供應商,2018年在AI領域將怎樣佈局?

李子青:前面說到人臉識別和AI其他技術,在目前有監督深度學習框架下,已經出現瓶頸、效能已接近天花板。

中科奧森目前在開展的重要工作之一,是解決目前有監督深度學習受限於標註資料規模的制約,突破途徑是利用生產環節大資料,在半監督或無監督學習框架下,自主提升,突破深度學習引擎效能天花板,使得在監控類非配合條件下的動態人臉識別效能獲得成百上千倍的提升,也就是把誤識率降低數百到數千倍,這與各廠家PK比較幾個百分點,有本質的不同,是突破性大資料技術,其成果能夠真正滿足實際應用的嚴苛需求。

中科奧森在做的另一個創新工作是新一代視覺感測器。10年前中科奧森曾發明了近紅外人臉識別,利用光電感測器的創新,彌補當時智慧演算法能力的嚴重不足,做出了世界上第一個實用的人臉識別門禁考勤產品,並由國內的廠商推廣到國外。其後又提出了異質人臉識別方法,即可見光人臉影象與近紅外人臉影象之間的交叉比較,擴大近紅外人臉識別產品的應用範圍。再後來又創新了雙目多光譜(RGB+NIR)人臉活體檢測,並將其應用在授權類人臉識別的假體防偽。我們推出的技術一直被人模仿,但從未被超越。

中科奧森的最新視覺感測器技術ApolloEye,是智慧結構化視覺感測器(專利技術產品),採用單目攝像頭即能採集RGB+NIR+3D多模態影象,並且能夠適應從夜晚弱光暗光到夏日強陽光和強逆光等極端不利光照條件變化、輸出質量一致的影象和人臉/人體/車輛檢測輸出。在嚴苛條件下實現多模態、高效能的影象採集和視覺目標抓拍,需要綜合光學、電學、影象處理、AI演算法及工程化等方面進行統籌設計與優化;綜合性解決方案,解決交叉學科關鍵問題。

ApolloEye為應用提供豐富可靠的視覺資訊,具有廣闊的應用前景。對監控類應用,它能顯著提升複雜場景下的人臉識別準確率;對授權類應用,它能有效阻止假體攻擊。其他應用場景包括無人超市、機器人、自動駕駛,等等。

兩年前我為中科奧森提了一個口號:AI照進現實(AIBrightensReality)-意思是讓AI技術落地,靈感來自於我很喜歡的一部電影《夢想照進現實》(徐靜蕾、韓童生、王朔)。現在我又提出了一個進一步的口號:創新解決當下,賦能未來(InnovationsEmpowerSolutionsandtheFuture)-針對AI的當下落地與面向AI未來的發展,是我更具體的戰略行動計劃。

1988年我懷揣夢想去英國留學,第一站是愛丁堡大學AI系。經歷了AI的第二次熱潮和寒冬,以及現在的第三次熱潮。研究AI理論與核心技術,持續不斷的創新,解決當下實際應用問題,開創未來前沿技術與產品,是我熱愛和痴迷的工作。

大資料週刊

郵箱:[email protected]

電話:010-57524293

眾論大資料 引領大時代

長按二維碼關注