1. 程式人生 > >商湯科技43篇論文橫掃2017ICCV 實習生摘得五項世界冠軍

商湯科技43篇論文橫掃2017ICCV 實習生摘得五項世界冠軍

華人學者7月在夏威夷CVPR 掀起的中國風尚未完全褪去,近日又在水城威尼斯ICCV 引爆中國學術研究風暴。資料顯示,中國學者發表的關於深度學習的期刊論文數量已超過美國。今年ICCV 接收論文中,有40%的第一作者都是華人。

中國最大新銳AI企業商湯科技與香港中大-商湯科技聯合實驗室,繼以23篇論文橫掃CVPR後,又以20篇論文力壓群雄稱霸ICCV。

CVPR和ICCV是2017年度舉辦兩大全球頂級視覺學術會議,商湯科技43篇的論文發表量,領先於谷歌、Facebook等國際巨頭,居亞洲第一。

640?wx_fmt=png

商湯實習生摘冠

隨著深度學習和計算機神經網路的快速發展,人工智慧企業想要形成技術壁壘保持領先,最關鍵的制勝因素就是人才。在商湯科技這個博士密度最高的中國企業、人工智慧領域的科學家豪門,實習生不僅可以直接接受頂級科學家的輔導,還能運用所學知識和創新去挑戰一些具有世界影響力的事情。

商湯科技的實習生劉樞在ICCV期間舉辦的MS COCO(Microsoft Common Objects in Context,常見物體影象識別)Workshop上,摘取了三項比賽的一個冠軍(Segmentation)及兩個亞軍(Detection和Keypoint)。

在Keypoint Challenge上商湯科技實習生取得的單模型的最高識別率,僅靠單一模型就接近多模型的融合結果,由於計算複雜度的限制,在工業應用中單模型更具實用價值。

此前,商湯科技的實習生劉樞、潘新鋼、李曉瀟、張熠還在7月舉辦的CVPR期間摘取了四項賽事的桂冠,包括:

  • 視訊分割領域最具權威的DAVIS視訊分割競賽

  • 北美著名高校和自動駕駛團隊組織的圖森杯車道線識別競賽

  • 著名國際自動駕駛組織Mappillary Research 和普林斯頓大學組織的LSUN17大規模街景場景理解競賽-語義分割及物體分割競賽

這些技術未來可以廣泛應用在自動駕駛等領域,具有非常強的實用性。

過往兩年,在CVPR、ICCV和ECCV全球三大計算機視覺頂級會議上,商湯科技與香港中大-商湯科技聯合實驗室發表的論文數量高達76篇,超過世界伯克利大學、斯坦福大學、麻省理工等國際名校及Google、Facebook等國際巨頭。

與生俱來的人工智慧基因

在中國,提到人工智慧不得不提到一個人——湯曉鷗,現任香港中文大學資訊工程系系主任,兼任中國科學院深圳先進技術研究院副院長。

0?wx_fmt=png

2016年,其領軍的中國人工智慧團隊與麻省理工、斯坦福等著名大學一道,入選世界十大人工智慧先鋒實驗室,成為亞洲區唯一入選的實驗室。

湯曉鷗被業界稱為全球人臉識別技術的“開拓者”和“探路者”,而他還有一個身份——商湯科技創始人。

作為一家中國的人工智慧領軍企業,商湯科技成立至今其實才僅有三年的時間。商湯科技基本是通過湯曉鷗教授以及實驗室師兄弟的關係,在創立開始完成了最為重要的原始人才積累。

其實驗室的許多博士生加入商湯,成為最早的創始團隊成員。在香港中文大學讀博三年、又作為博士後駐站三年的徐立也在2015年初加入商湯,擔任CEO。

當初選擇離開實驗室,徐立說有兩個原因,“一方面,技術突破工業化紅線的契機已經到來。當機器能夠超越人工的能力,技術的工業化條件成熟之時,是切入一個市場的最好時機。如果早兩年入場,就需要較多時間來教育市場。

2014年,當計算機人臉識別準確率首次超越人眼識別的準確率時,我們意識到時機到了。另一方面,從學術轉換成工業應用,本身是一種責任。商湯目前正在做一件真正惠及國計民生的事業——佈局智慧城市安防專案。

商湯此前已與某市級公安局合作,在40天時間內識別出69個嫌疑人,最後實際逮捕14人。要知道,此前僅靠人力進行影象識別,一年時間才能夠抓捕兩人。”

雖然當下人工智慧勢頭正勁,國內BAT等巨頭紛紛佈局,徐立坦言商湯想做的是人工智慧源頭的事情。“我們是做底層架構的,堅持原創技術和在底層技術架構上的原始積累。”

徐立說,商湯的優勢就是原創技術加核心人才,一方面商湯擁有最早投入深度學習研究的華人團隊、亞洲最大的深度學習研究團隊。在計算能力方面,商湯科技建設了大規模GPU計算叢集,由近4000塊GPU的計算晶片組成。

原創技術給商湯帶來的競爭力在於能夠生產獨特的產品,換句話說是高效率並且稀缺的產品。以金融領域為例,其已經可以做到億分之一的誤識率,比現在十萬分之一、百萬分之一的誤識率高兩到三個數量級,這就是技術上的差異化。

商湯的人才造血機制

商湯是匯聚科學家數量最多的中國創業公司,注重人工智慧領域的基礎研究,對行業趨勢始終保持敏感性,是商湯科技運營發展最鮮明的特點。那麼它是如何吸引眾多博士人才紛紛加入的?

徐立說,商湯有自己的人才造血機制,先通過學術上的聯絡把師兄弟吸納進來,形成導師紐帶,配備基礎設施和架構,包括給予硬體資源、資料標註、硬體平臺等方面的投入,通過導師的示範作用,把其他人才吸引進來。

除此之外,商湯還與香港中文大學、浙江大學建立了深度合作,共建聯合實驗室和研發中心,與清華大學、北京大學等多所高校成立研究團隊。

一名AI人才的成熟大概需要5~7年的積累。商湯目前已經有了一支120人組成的博士隊伍,未來還會盡可能多地招攬市場上已經成熟的AI人才,公司將大約一半的資金投入到人才招聘方面。

640?wx_fmt=jpeg

商湯科技聯合創始人、CEO徐立博士

作為CEO,徐立表示,商湯發展到現在一共經歷過三個階段:

第一是早期創業期(2014年10月到2015年上半年),那時研究、工程、商務都沒有明確的劃分,一人承擔多職,幾十個人對任何事情都快速響應,利用大家積累的學術能力和對行業的認識來做行業的突破。

第二個階段是2015年上半年到2016年上半年,做了兩件事情:人才聚集和產品打磨。人才聚集期這一年進行了快速的擴張。

第三個階段是2016年上半年至今, 開始引入職業化的經理人來做職業化的管理,包括商務、HR、法務、財務、市場PR,每一個核心崗位,都是從大公司來的高管。用更多的現代化的管理手段去調整公司的架構,把產研和銷售渠道打通,建立起有規模的銷售團隊。

商湯的主要業務板塊是智慧金融、智慧商業、智慧安防和網際網路+,涉及的領域有很多。目前來看,安防的市場正在逐漸變大,除此之外,金融、商業、網際網路都各自佔據了一部分比較重要的位置。

其原創AI技術的應用場,包括SensePose、SenseFace、SenseVideo、SensePhoto、SenseAR等解決方案。這些人工智慧應用產品,未來將在全球多個行業和場景下得到廣泛運用,如智慧城市、智慧家居、網際網路娛樂、手機、無人駕駛、醫療等領域,未來我們將會看到大量傳統的低效率工作被高效的人工智慧機器所取代。

“目前,商湯正處在一個快速起飛的狀態。之前的增長是接近線性增長,但是現在處於拐點,接下來會有快速的聚集效應和產業效應,就要進入快速發展通道了。”徐立說。

讓中國的技術領先全球

人臉識別目前的盈利模式以to B為主。目前來說人臉識別企業的主要盈利模式包括企業級技術服務和軟硬體銷售。商湯以B2B2C的商業模式,與各行業領軍企業合作,共同推進人臉識別在各行業的應用和變現。

徐立說:“ B2B2C是通過量級的企業來輻射的,而且還有一個好處是標準化,你這個做的是一個什麼概念,也就是標準化。第三點就是B2B2C,如果客戶大規模發展,反而會推動我們B端的發展。

所以我們做的佈局是“1+1+X”, 第一個“1”是基礎研究,第二個是“1” 是產業結合,第三個“X”是行業夥伴。目前最重要的是推動技術在更多場景下的落地,真正的提高行業效率、改變人類的生活。”

在徐立看來,人工智慧的定義,是通過人的工程使第三方主體擁有類人的思維和類人的意識,所以它的目的是仿人類。“但是和我們之後做的事情不完全一樣,或者有比較大的差別。

現在我們大部分計算機工程或者工程學所做的事情,其實叫機器智慧,它的目的並不是仿人,是在一些人類所指定的儲存任務情況下超越人,只有在超越人的標準上才有更廣泛的應用。

人工智慧產業鏈根據技術層級從上到下分為基礎、技術和應用層,目前人工智慧的產業鏈剛剛開始,研究領域取得的進展逐漸開始工業化,所以新進入者還有一些機會,更多的聚焦在應用層,但在深度演算法上,已經湧現出了獨角獸,機會已然不大。”

如今,商湯在這個行業中所做的事情,是很多企業所做的目標,資訊的連線到最後萬物互聯。萬物互聯走向一個萬物智慧的階段,商湯要在萬物互聯這個大勢之下,為更多合作伙伴和更多企業提供智慧的核心。“正如商朝是中國有文字記載的第一個朝代,商湯又是它的創始人。我們希望通過不懈努力,讓中國的技術領先全球。”徐立說。

推薦閱讀

長期招聘志願者

加入「AI從業者社群」請備註個人資訊

新增小雞微信  liulailiuwang

640?wx_fmt=png