1. 程式人生 > >4歲估值45億美金,商湯為何能入選AI國家隊

4歲估值45億美金,商湯為何能入選AI國家隊

採訪嘉賓|商湯科技工程院院長沈徽

作者|Vincent

編輯|Debra

AI 前線導讀:2018 年 9 月 20 日,科技部正式宣佈:依託商湯科技建設智慧視覺國家新一代人工智慧開放創新平臺。商湯科技成為繼百度公司、阿里雲公司、騰訊公司,科大訊飛公司之後的第五大國家人工智慧開放創新平臺。在商湯科技之前入選國家人工智慧開放創新平臺的企業,都是已經在國內深耕了至少十年的老牌科技企業,商湯科技這樣一家僅有四年曆史的初創公司如何能夠入選?計算機視覺技術領域為何如此受到青睞?AI 前線對商湯科技工程院院長沈徽先生進行了專訪,他為我們帶來了商湯科技官方的解讀。

更多幹貨內容請關注微信公眾號“AI 前線”(ID:ai-front)

四歲初創公司為何能夠入選國家隊

故事要從一年前說起。

2017 年 7 月,國務院印發了《新一代人工智慧發展規劃》,提出要構建開放協同的人工智慧科技創新體系。建設佈局人工智慧創新平臺,強化對人工智慧研發應用的基礎支撐。平臺重點建設支援知識推理、概率統計、深度學習等人工智慧正規化的統一計算框架平臺,形成促進人工智慧軟體、硬體和智慧雲之間相互協同的生態鏈。

去年 11 月,科技部宣佈要緊緊圍繞新一代人工智慧發展規劃,形成了任務落實的系統安排,全面推進規劃和重大科技專案啟動實施。依託百度公司建設自動駕駛國家新一代人工智慧開放創新平臺,依託阿里雲公司建設城市大腦國家新一代人工智慧開放創新平臺,依託騰訊公司建設醫療影像國家新一代人工智慧開放創新平臺,依託科大訊飛公司建設智慧語音國家新一代人工智慧開放創新平臺。

時間到今年 9 月 20 日,科技部正式宣佈,依託商湯科技建設智慧視覺國家新一代人工智慧開放創新平臺。商湯科技將依靠自身技術,打造一個智慧視覺開放創新平臺,加速計算機視覺技術在各個行業的應用落地。

沈徽認為,把第五個新一代的人工智慧創新平臺放在商湯科技,是對商湯科技智慧視覺科研能力的認可。“我們倍感榮幸和自豪,也深感肩負的沉甸甸的使命和責任。”

2014 年 11 月,商湯科技正式成立,專注於計算機視覺和深度學習的原創技術研發。創始人為香港中文大學資訊工程系教授湯曉鷗。

四年的時間,商湯科技目前估值已經達到了 45 億美金。沈徽告訴記者:商湯科技能夠入選國家隊,與其原創技術實力和市場競爭力是分不開的。

沈徽說:“第一,我們有 領先的原創技術研發實力,作為承擔國家使命的開發創新平臺,對於核心技術的領先性以及自主性是有極大要求的,只有在核心技術上面有自主的與國際保持同步的研發水平和開發能力才能承載起來依託商湯科技建設國家創新平臺這樣的使命。”

他舉例說,商湯科技自主研發的原創深度學習平臺 SenseParrots,對超深的網路規模、超大的資料學習以及複雜關聯應用等支援更具優勢。商湯科技還自主搭建了深度學習超算中心,大幅降低了各類人工智慧技術的研發成本,並且縮短了開發深度學習演算法模型的時間。與此同時,商湯科技利用其深度學習平臺推動產業升級,構建人工智慧生態。近年來,商湯科技各類計算機視覺技術快速在各行業投入應用。

商湯科技還 集合了來自學術界和產業界的頂級人才 推動最先進的 AI 研究。商湯科技創始人湯曉鷗所創辦的香港中文大學多媒體實驗室,是亞洲唯一入選的世界十大人工智慧先鋒實驗室。研發團隊在與計算機視覺相關的國際頂尖學術雜誌和會議上累計發表 400 多篇論文(僅次於微軟)。2014 年,商湯科技團隊發表 DeepID 系列人臉識別演算法擊敗 Facebook,全球首次超過人眼識別率。

第二,沈徽認為:作為國家創新平臺一定要有普遍性,也就是說它能賦能很多行業

平臺要對接各行各業,要有各種方面賦能性的操作才能稱之為平臺,如果只有一家,自己做自己的肯定就不是平臺。從這一點來說商湯科技本身的業務模式非常契合人工智慧平臺的概念。

沈徽介紹道,商湯科技的業務涵蓋智慧城市、智慧手機、互動娛樂及廣告、汽車、金融、零售、教育、地產等多個行業。商湯科技探索出獨具特色的“1(基礎研究)+1(產品及解決方案)+X(行業)”模式,即以“商湯驅動,賦能百業”,並在多個垂直領域的市場佔有率位居首位。

比如在智慧城市行業,有商湯科技最為人熟知的人臉識別、智慧視訊分析技術應用。其核心演算法已覆蓋大量智慧城市、平安城市專案,提高了城市的管理效率和能力。在同樣大量應用人臉識別技術的手機行業、短視訊、直播平臺,還有需要“刷臉”認證的金融行業,商湯科技都展現出了強大的技術實力。

甚至在智慧零售領域,商湯科技將人工智慧技術應用於實體商業,幫助傳統零售企業,實現 VIP 會員精細化管理,通過重構“人、貨、場”的關係,提升使用者購物體驗、改善零售企業運營,實現精準營銷,在今後的落地實踐中,商湯科技會為消費者帶來“刷臉消費、拿了就走”的無阻礙購物流程。

此外,商湯科技在深度學習硬體優化技術領域,依靠領先的神經網路模型壓縮能力,將高效能、高精度的深度學習網路小型化,推動終端智慧化的發展,現已與國際晶片巨頭高通達成戰略合作。

在沈徽“秀”過商湯科技的強大 AI“肌肉”之後,有這樣一句話浮現在筆者腦海:科技才是硬道理

不過,在商湯科技成功晉級的背後,我們看到了一股更加強大的力量,它推動著整個計算機視覺行業的發展,在中國的人工智慧領域掀起了一陣又一陣的熱浪,不論是技術迭代還是融資新紀錄,計算機視覺都成為了現在最熱門的 AI 技術之一。

有關這場浪潮的突然來襲,我們也請沈徽從他的專業角度進行了全面的分析。

“突然”掀起的計算機視覺熱浪

“突然”並不突然

但是,沈徽首先回答的是一個看上去無關的生物學常識:

“人的大腦分配了大量的資源用於視覺,對視覺的“投入”比聽覺、味覺、嗅覺多得多:40%-50% 的神經元都與視覺功能有關,在大腦頂層 IT 區尤為密集。相較於其他感官,人類使用眼的場景也更多,平均活躍時間也更多,視覺佔據人類感官系統的 80%。”

沈徽說:一步一步地賦予計算機“視力”,是開啟真正機器智慧時代的鑰匙。

沈徽認為,得益於海量的圖片資料、運用場景資料的積累,以及 GPU 的發展、計算能力大幅度的躍升,提供了演算法進步的基礎,在這個基礎之上帶來了計算機視覺技術在眾多的應用場景的落地。

也就意味著,這場浪潮並不是“突然”掀起的,而是得益於多項技術在近幾年取得的進展,才讓計算機視覺領域完成了之前無法完成的實踐,從而引發了這場計算機視覺的發展潮。

比如沈徽本人一直以來關注的 SLAM 技術,中文稱作“同時定位與地圖建立”。SLAM 試圖解決這樣的問題:一個機器人在未知的環境中運動,如何通過對環境的觀測確定自身的運動軌跡,同時構建出環境的地圖。SLAM 技術正是為了實現這個目標涉及到的諸多技術的總和。

SLAM 可以應用在很多領域,VR/AR 方面,根據 SLAM 得到地圖和當前視角對疊加虛擬物體做相應渲染,這樣做可以使得疊加的虛擬物體看起來比較真實,沒有違和感;無人機領域,SLAM 可以構建區域性地圖,輔助無人機進行自主避障、規劃路徑;無人駕駛領域, SLAM 技術可以提供視覺里程計功能,然後跟其他的定位方式融合;機器人定位導航領域,SLAM 可以用於生成環境的地圖。基於這個地圖,機器人執行路徑規劃、自主探索、導航等任務。

如果沒有大量場景資料和強大的算力支撐,這樣的技術很難完成如此複雜的運算,更不要說落地在這些應用場景裡了。

行業發展與障礙

而從整個計算機視覺行業發展的角度看,沈徽表示:縱觀中西計算機視覺發展,我們可以看到,中國與西方國家的演進路線不同

國際上前沿的技術主要集中在深度學習的基礎研究層面,而中國的計算機視覺技術更傾向於產業落地。經過了過去這些年的沉澱,中國已經在人才、資料、場景和政策層面做了比較多的儲備,為中國計算機視覺技術的發展提供了豐沃的土壤。

尤其是在應用方面。從全球範圍來看,計算機視覺領域一定要通過落地應用才能推動學術的發展,而中國在這方面具有巨大的優勢。

每年計算機視覺頂級會議上,來自中國的論文總數、最佳論文數量佔比越來越高,以商湯科技為代表的中國 AI 企業,引領中國計算機視覺學術團穩坐第一梯隊。同時,技術的落地應用跑得快,往往也對這項技術提出了更多超前的、突破性的問題,倒逼技術向著創新的方向、領域突破發展,這些論文大部分都是來自於實際應用對技術的推動。

沈徽告訴記者:在今天,中國計算機視覺技術的落地應用在全球範圍內都是走得是很靠前的,而且資料規模體量是很大的,所以倒逼中國計算機視覺原創技術生產跑得非常快。這足以說明 中國的計算機視覺技術已經走在了世界前列。

但沈徽表示:“不可否認在科研學術能力、人才儲備角度來說,我們不如美國和一些歐洲國家,尤其是有影響力的、突破性的研究。 我們在人才梯隊培養、科研學術能力建設上任重而道遠。“

他認為,計算機視覺技術未來要進一步賦能百業,還需要完成更多的升級:

從技術上的角度看, 機器學習的能力還需要進一步提升:機器現在還是在指定目標下完成特定任務,現在是引數學習,未來是結構學習,再以後是目標學習,未來可能不需要依靠研究人員的能力,機器可以自主學習,面對任何一個垂直的任務,都可以找到一個自有解決方案。

從行業發展來看, 可以形成整個生態環境:計算機視覺並非一個獨立的行業,它更像是一種為所有傳統行業提供變革契機的基礎設施。通過不斷迭代升級的演算法和技術創新,AI 能夠提供未來經濟發展動能,帶來顛覆性的變革。因此在未來,具有核心平臺化能力的 AI 企業才能夠不被淘汰。

從應用落地的趨勢來看, 它更像是一種為所有傳統行業提供變革契機的基礎設施。從產業化的角度看,還有大量的應用場景待開發,目前的技術需要形成更標準化的產品,在更多垂直行業實現大規模的落地。

在 11 月 1 日召開的民營企業座談會上,商湯科技的創始人湯曉鷗教授也提到了目前我國人工智慧產業的發展還存在一些制約的瓶頸:

一是缺乏科學佈局,統籌規劃。 一方面,人工智慧產業佈局有同質化,重複建設傾向;另一方面,拔苗助長式地催化人工智慧企業,缺乏人工智慧技術與產業發展的深度融合。

二是中國原創技術發展需要國際合作。 一方面,目前的國際環境對基礎研究的合作,特別是與發達國家學術機構的深度合作,造成一定困擾;另一方面,目前中國走出國門的產業多集中在國有企業的重大基礎設施,民營高科技企業還沒有形成規模化出口落地。

不僅僅是計算機視覺,中國的很多人工智慧技術已經取得了比較喜人的發展,但是就像前文中提到的,由於這些技術上、行業發展上的阻礙,中國人工智慧商業化發展出現了一些問題,技術的發展再好、再強,無法落地到實際的應用場景中,對於技術的發展也是不利的。

於是,不少行業內的人也都發出了這樣的疑問:人工智慧的商業化道路,該如何走?

AI 商業化道路何處走?

近來,有關人工智慧的“寒冬論”與“泡沫論”再次襲來,對於 AI 商業化發展也形成了一定的阻礙,更是讓業內人士多少產生了一些動搖。但是沈徽卻說:泡沫可以快速高效的聚集資源、智慧和資金,帶動整個產業發展,留下一批真正好的人才和公司。當然,不好的是在資源上造成很大的浪費。

以計算機視覺技術來說,在應用落地方面仍然面臨著許多技術上的難題,沈徽說:“任何時候,任何地方,都應該是最專業的人來做最專業的事。落地將會是檢驗‘真 AI’的唯一標準。”

他告訴記者:“我們不害怕泡沫,而是應該從泡沫中去分辨潮水的方向,建立明確的方向。人工智慧是一個長期的戰略,要做好打持久戰的準備。

作為一家提供技術解決方案的 2B 公司,商湯科技已與國內外 700 多家世界知名的公司和機構建立合作,上文提到過的商湯科技獨具特色的“1(基礎研究)+1(產品及解決方案)+X(行業)”模式已經在多個行業取得了不錯的成果。

中國的人工智慧商業化道路仍然有些模糊,但已經有不少企業在努力嘗試探索可能的方向。未來中國的人工智慧是否能夠探索出一條獨具特色的商業化道路,在為社會帶來強大的落地科技同時還能夠產生巨大的價值,讓我們拭目以待。

受訪嘉賓簡介

沈徽,商湯科技副總裁、商湯科技工程院院長。他帶領商湯科技工程院搭建穩固的技術基礎和平臺,協助開發人工智慧產品。曾先後在武漢大學、中國科學院和華盛頓大學獲得計算機本科及碩士學位。

加入商湯科技前,曾作為微軟全球合夥人並擔任微軟(亞洲)網際網路工程院常務副院長,負責微軟必應(Bing)搜尋引擎的大平臺架構及索引服務,同時負責 AI 深度學習平臺架構、工具、知識圖譜以及商業智慧機器人的工程產品研發。