1. 程式人生 > >優圖、音視訊實驗室之後,騰訊SNG量子實驗室也浮出水面

優圖、音視訊實驗室之後,騰訊SNG量子實驗室也浮出水面

「我們非常重視技術能力建設,在技術上的持續探索,利用技術手段來解決使用者的痛點。」騰訊集團高階執行副總裁、社交網路事業群(SNG)總裁湯道生說。

SNG 這個事業部覆蓋了騰訊不少產品線,包括 QQ、QQ 空間等經典產品,也孵化了騰訊雲、全民 K 歌、天天 P 圖等 to C 和 to B 產品。在這些產品背後,優圖實驗室、音視訊實驗室就是湯道生口中重要的技術支撐。

在騰訊社交網路事業群(SNG)主辦 TSAIC 學術&工業交流會上,SNG 公佈了籌建第三支技術力量的訊息——量子實驗室,同時也迎來其首位傑出科學家張勝譽。

「SNG 目前在大力投入技術的佈局,希望在未來,我們三大實驗室能夠整合技術力量,在豐富應用場景的同時,用科技的力量來提升人類的生活品質。」湯道生說。

除了針對量子計算的主題演講安排之外,這場技術味濃厚的活動還集中討論了 CV、音視訊、智慧安全、推薦和 NLP 五個方向,吸引到海內外各大高校與研究所的學者、研究員和工程師。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

圖:全體參會人員合影

籌建量子實驗室,騰訊 SNG 大力投入技術佈局

雖然量子計算與絕大多數人工智慧領域學者的研究方向並不直接相關,且量子計算機的實現還是一個長期的願景,但幾乎行業裡每個人都會保持對量子計算的關注,這是因為量子計算一旦實現,人工智慧領域內,尤其是深度學習領域內,將產生從底至頂的顛覆性變革。

51198image%20(9).png

圖說:張勝譽目前在香港中文大學任教,清華計算機系人工智慧實驗室攻讀碩士期間,師從應明生教授;博士畢業於普林斯頓大學計算機系,師從姚期智教授。

在現場,張勝譽做了一次深入淺出的量子計算科普,同時扮演了「活動的答疑器和闢謠機」角色,把大眾對量子計算的疑惑、誤解,一次性講了個透徹。

他解答了一個大多數人的疑惑:量子位越多意味著計算機越強大嗎?如果答案是肯定的,為什麼英特爾、IBM 等晶片巨頭仍然在研究數十位的量子計算機,而一些相對年輕的創業公司已經造出數千多位的成品了?

他提出這是通用機和專用機的差別。除了量子位之外,影響量子計算機能力的還有實現的電路深度、可以進行的操作型別、電路的連線程度、產生出的狀態的儲存時間等諸多因素。現有的「數千位的量子計算機」多為只能處理某一類特定優化問題的專用機,而通用量子計算機的位數規模仍然在幾十位水平,對差錯的控制有待進一步提高。

87680image%20(10).png

圖:目前通用機與專用機的量子位數實現水平

除此之外,張勝譽也談到了大眾對量子計算的一些不是十分精確的認識,例如:

量子計算機一旦實現會全面取代經典計算機嗎?至少目前看來,一二十年都不會,因為它的製備條件和維持條件都太苛刻而且昂貴。

量子的疊加態能夠讓計算機進行大規模並行搜尋嗎?答案是疊加態本身帶來了自然並行的能力,但這並不是說量子計算機可以在整個搜尋空間內進行並行搜尋,然後把正確解分支拿出來。在利用量子並行的能力之前,首先要克服酉變換、不確定性和破壞性的影響。

糾纏態可以實現瞬間的資訊傳輸嗎?答案是不能。雖然兩個糾纏中的粒子,無論距離多遠,對其中的一個進行測量就會影響另外一個的狀態,但是測量結果的隨機性是不可控的,因此也無法利用其進行瞬間資訊傳輸。

量子計算機可以快速解決 NP 問題嗎?雖然尚未有絕對確定性的答案,但是絕大部分學者認為是做不到的。

41483image%20(11).png

他介紹了業界的現狀,各大公司對此的佈局、投入,以及最重要的,他眼中的量子計算的趨勢。

他認為量子計算機一定會實現,因為「截止到目前,看不到任何本質上的跨不過的坎,所有問題都在工程工藝上」,而人類歷史上重要科學結果的發展,沒有制約於工藝的先例。現在各國政府、各公司都在持續投入(例如我國最近要投入建設一個十億元的實驗室),「相信這些力量一定會推動量子計算機最終實現」。

而對於何時會實現的問題,張勝譽認為要避免兩個極端,一方面短期不要過於樂觀,我們無法做出「六個月/兩三年就能造出一個多麼大能量的計算機」的預測,一方面長期不要過於悲觀,「十年/五十年也做不出來什麼」的論調也不可取。科技的發展突破難以預料,而且關鍵環節一旦突破,發展會非常迅速。

不過,在眼下,量子實驗室的重要目標仍然在於招人。「騰訊準備啟動量子實驗室,我們希望招聘到跟量子相關的演算法、複雜性、通訊、模擬、量子物理、量子化學等各方面的人才。」張勝譽在現場打出招聘廣告。

除此之外,他也表示非常歡迎對 AI 以及量子計算對 AI 的影響感興趣的學者加入實驗室。「我們也很看重量子力學和人工智慧的結合。有一些從量子物理中過來的想法是完全可以實現在經典量子計算機上的,如果有人喜歡做 AI、喜歡做機器學習中的基礎問題,但是又想多一些理解和多一些本質性的突破,也希望加入我們,大家一起來研究探討這個問題。」

社交網路事業群的技術與產業聯動

對於像 SNG 這樣的產品事業部而言,針對這些前沿技術進行整合與應用是最為重要的。在此之前,優圖、音視訊兩個實驗室已經有過長時間探索。

影象處理和音視訊編解碼都是 SNG 的「核心需求」,他們誕生自內部豐富的產品線中的使用者外部需求以及提供服務時控制成本與效率的內部需求,優圖實驗室和音視訊實驗室也由此誕生。

優圖實驗室成立已有五年,是一個專注於視覺相關演算法研發的部門。「優圖是一個在 SNG 或者在整個騰訊裡面核心的視覺研發部門,也是騰訊最大的視覺研發的核心部門」,IEEE Fellow,香港中文大學終身教授,優圖實驗室傑出科學家賈佳亞在演講中介紹到。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

賈佳亞把優圖的 AI 技術分成了「前端 AI」和「後端 AI」,「前端 AI 是通過實現 AI 的能力和技術,我們就能立刻去實現和看到效果並回饋的。做好一個產品後可以直接呈現到所有使用者和客戶面前。而後端 AI 是我做的很多操作大家不知道,但是當我把結果呈現到你面前,你會意識到這個結果一定是被某一些演算法給處理了。」

前一類變成了許多產品和功能,後一類則以技術輸出的形式進入到了內部的應用中,輸出之後,產品端介面沒有改變,但是在演算法端可以用更少的人手可以達到更好的效果。

而音視訊實驗室,致力於視訊編解碼和標準化工作,為公司內外數百個產品提供了音視訊技術支援。演講的一開始,艾美工程獎得主、騰訊音視訊實驗室傑出科學家劉杉就借用一個簡單的數學計算說明了一個道理:「編解碼不是重要的,而是必要的。」

640?wx_fmt=png&wxfrom=5&wx_lazy=1

圖:如果沒有編解碼,一部 120 分鐘的高清電影就要高達 2.7T 的硬碟空間

SNG 的這種「利用技術手段解決使用者的痛點」的傳統,不僅體現在事業群內部,也體現在與眾多第三方的合作上,例如在與順豐的合作中,用 OCR 技術進行快運單手寫體的識別,識別度達到 99% 以上。而優圖實驗室也在佈局騰訊的智慧醫療,希望能通過簡單的視覺手段來診斷重大疾病、是否需要進一步的檢查,幫助很多偏遠和貧窮的地方的病人和醫生。

相比之下,量子計算則是一個與騰訊現有產業、業務都沒有直接聯絡的基礎科學研究領域。騰訊的這個決定想必更多來自社會責任,企業從快速發展期進入穩健成長期之後,會開始在基礎研究、文化科技等行業進行投入,也為公司的生存和發展創造一個更有利的環境。

張勝譽演講全文

今天在這裡簡單介紹一下量子計算的一些近期發展。

在最近一、兩個月的新聞裡,第一個是英特爾和 Qutech 結合,做了一個 17 個量子位的晶片,第二個是 IBM 公佈 20 位的量子計算機,也宣佈了下一步:一個 50 位的計劃。另外一家在加拿大的公司 D-Wave 最近升級了他們的 2000 量子位的量子計算機。這很奇怪:為什麼像 IBM 和英特爾這樣很傳統的大公司只有 10 數位、20 位的量子計算機,但是一個相對年輕的公司卻可以做到 2000 多位。還有一些比 D-Wave 更年輕的公司,比如初創公司 QCI 最近剛剛融了 A 輪,$18M,1QBit 剛剛融了 B 輪,$45M。此外,甲骨文宣佈自己要做量子神經網路。而在中國,一個 $10B 的國家實驗室即將開展。

這僅僅是發生在過去 1-2 個月的新聞,整個量子計算在過去 1-2 年集中出現了很多新聞。看到各種各樣的新聞,也許你會有一些疑問,比如,什麼是量子計算?什麼時候我們才能買到一臺量子計算機?如果真有這樣的計算機,是不是要把我們手裡的經典計算機扔掉?騰訊在開展量子計算學術研究和量子計算機的研製上有什麼計劃?

如果大概一百年前,去從歷史的角度看整個量子力學的發展。其中有一個很有名的思想試驗,叫做薛定諤的貓。

98236IMG_20171228_094931.jpg

假設空間裡有一隻貓,有一個小錘子,錘子可以砸碎下面的毒藥。砸碎毒藥瓶,毒藥釋放出來,貓就死了;沒有砸碎毒藥瓶,貓會活著。但是量子物理說,錘子可以處於落下來和不落下來的「疊加狀態」,也就是說,這個錘子可以同時落下和沒有落下,這導致的結果是這隻貓同時處於生和死的狀態。這對經典物理來說是非常難以理解的事情。

這個現象就是疊加態(Superposition),是說一個系統可以同時處於兩種不同的狀態的疊加中。

現在我們再換一個角度看這隻貓。因為我不知道它是生還是死,我想去看一眼。我們平時所謂的看到、聽到,都是物理上的觀測過程。微觀量子世界的「觀測」與巨集觀世界的觀測非常不一樣,有兩個很奇怪的性質。

第一,如果你對同一個確定的量子狀態進行多次觀測,可能會得到不確定的答案,也就是說,即使製備了完全一樣的量子態,這一次觀測,可能貓是死的,下一次觀測,可能貓又是活的。對於同樣一個東西,如果我觀測兩次,會得到完全不一樣的結果。

還有一個很奇怪的性質,如果你觀測到它是死的,你改變了原來這個貓即生又死的狀態,它就真的變死了,反之亦然。在巨集觀世界,很少出現觀測會改變物體本來狀態的情況。

如果巨集觀世界也是這樣,那將是件很麻煩的事情。比如你想量一下自己的身高,發現每一次量完都不一樣,本來你以為你是一米八,量完發現結果是一米七,而且量完以後真的變成一米七了,這時候你就會很頭疼。

大家還會經常聽到一個概念叫糾纏(entanglement),是說存在兩個在很強的意義下不可分的粒子,即使把兩個粒子分別放到非常遠的地方,對其中一個粒子進行操作,在瞬間會改變另外一個粒子的狀態。

量子計算研究從學術界的角度看有哪些重要的領域呢?

首先一個是量子演算法,在這個領域中,我們關注如何去設計有效的量子演算法,使得這些演算法所要花的時間要遠遠短於經典演算法花的時間。一個相關的問題是計算複雜性問題:我們想知道量子計算機研製出來之後到底有多麼強,在哪些問題中有很大的作用,在哪些問題中沒有那麼大的作用。

此外,糾錯改錯是實現量子計算機的必要條件。

還有量子計算機一開始就帶來很大影響的一個領域,密碼學。量子計算機的出現可能會攻破現有的密碼體系,要求我們要設計一些新的密碼體系,可能是量子的,也可能是經典的,使得即使是量子計算機也無法攻破。

另外,如果將量子計算機做得越來越好、越來越大,就不可避免的產生程式設計問題。我們都不希望使用類似「量子組合語言」這樣複雜的過程去操作,我們希望設計高階的語言,研究如何把高階的語言變成一個低階電路表現,研究軟硬體以何種結構結合。這都是在學術界比較關注的問題。

下面再簡短地展開一下上述第一個領域,量子計算。

21852IMG_20171228_095531.jpg

以時間為座標軸,1982 年 Feymann 第一次提出量子計算機的概念。既然用經典的計算去模擬量子系統會發生指數級的誤差,為什麼不乾脆做一個量子計算機,這樣可以反過來可以更快地計算很多經典的問題。1985 年,Deutsch 提出了量子圖靈機的概念,1993 年 Berstein-Vazirani 研究了量子圖靈機上在計算複雜性上的一些基礎問題,Yao 把量子圖靈機這個很難理解的概念轉換成人們比較熟悉的電路的概念,證明二者是等價的。1994 年 Shor 提出了大數分解。1996 年 Grover 發現可以用量子計算機進行快速的搜尋,這大大提高了量子演算法的可應用性。2003 年,Ambainis 和 Szegedy 做了量子版本的隨機遊走,打開了一扇新的大門。2009 年,幾位科學家研究怎麼解線性系統,但是這個演算法並不是把所有的解全部輸出出來,而是把一個解壓縮到一個很小的量子暫存器裡面去。這之後湧現了越來越多量子和機器學習結合的方向。

下面想講一些基本的概念。

我們經常聽到一些說法,這裡面有一些是正確的,有一些可能不是那麼精確。

首先是疊加態。既然是疊加態,就不是簡單的 0 和 1,如果你有一些量子位,每一個都有許多個狀態,並且能同時處於這些狀態,這本身就是一個巨大的並行能力。而且這是直接來自物理世界的,不需要設計、協調,自然存在的並行。所以疊加態可以自然地提供給量子計算機並行的能力。這當然很好,但是很多科普文章犯了一個錯誤,認為可以讓量子計算機並行地搜尋整個搜尋空間,找到好的分支,表達出來即可。但其實並非如此,整個量子系統演化,必須遵循一些基本規律,其中一個就是整個演化過程必須是一個酉變換(unitary transform)。量子演算法需要想辦法去利用其並行的能力,並且克服由於酉變換和破壞性測量帶來的麻煩。

還有一些不是很準確的概念,比如說糾纏態可以實現瞬間的資訊傳輸。這個問題的答案現在很清楚:我們不能利用糾纏進行瞬間的資訊傳輸,這是違反相對論的,因為任何資訊傳輸都需要媒介。在實驗中,對兩個糾纏的粒子中的一個進行測量確實會影響另外一個的狀態,但是這個測量結果的隨機性沒法控制,因此沒有辦法用它傳遞資訊。

另外一個常見的不準確的說法是量子計算機可以快速解決 NP 難的問題。我們並沒有絕對確定性的答案,但是絕大部分學者認為這個事情是做不到的。當然我們還沒有嚴格地證明,事實上,如果能證明這個,那麼它馬上就能推出 P = NP,而這是電腦科學中最大的一個開放性問題。所以我們可以想像,想證明量子計算機不能多項式時間解決 NP 問題,將會是一個非常難的問題。

下面再講一下量子金鑰分配的問題。基本上,祕鑰分配的任務是生成隨機數分配給雙方,使得如果中間有人竊聽,通訊雙方會發現這件事情,通訊雙方就會放棄使用這一對金鑰。當然現實應用中需要結合身份認證,不過總的來說,量子通訊及其在金鑰分配上的應用比量子計算走得超前,市場上已經可以買到量子通訊的裝置。

一個有趣的方向是量子模擬,如果有了量子計算機,我們可以用這個量子計算機來模擬量子系統,這會大大改變整個人類探索微觀世界的根本方式。如果量子計算機能夠發展到幾百個量子位的話,在將來在化學,材料,製藥等問題上有相信會出現跟以前不一樣的辦法,產生比較大的幫助。

還有一些其他的研究領域,比如說資訊理論,研究編碼解碼,通道容量等問題,還有測量學,希望可以對時間和空間上進行非常精準的測量。最後還有量子相關的機器學習和智慧領域。

回到演講開頭的問題:為什麼初創公司可以做 2000 位的量子計算機,而很多傳統的大公司只能做 10 幾、20 位呢?因為做量子計算機有兩個不同的目標,一個是要做專用機,這個機器只能處理一些特殊的事情,處理某一類優化的問題。另一個目標是做通用機, 目標是實現通用電路,但這非常難,因為粒子會和環境產生許多互動,環境會產生很多噪聲。一方面我們希望控制粒子和粒子之間進行很好的互動,另一方面我們不希望粒子和外界環境產生任何的互動。這是矛盾的、工程工藝上很難實現的。

量子位元之間互動,另一方面還不許他們和外界環境有互動。這本身是優點矛盾的事情,工程工藝實現上很有挑戰,在實現的條件上很苛刻。

現在的量子計算機發展到什麼程度?大量優秀的實驗物理學家從二十年前就開始迎難而上,一直有比較穩定的進展,最近的三五年能明顯看到一些加速的跡象。

有不同的實現方案湧現,現在尚不清楚哪一個實現方案會笑到最後。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

這是今年年中的大概業界發展現狀。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

這是從量子數角度的實現情況。右上角是通用機,右下角是專用機,左邊是模擬機的。這裡要強調,我們不應該只是簡單比較有多少位,因為除了要有這麼多的量子位排在那裡,還要看能實現的電路深度、可以進行什麼級別的操作、電路的連線程度怎麼樣、產生的狀態可以儲存多長時間等等。基本現狀是,仍然有噪聲,仍然是小規模,能夠實現三位小數(99.999%)的精確度。這個水平下,當深度增加還是會帶來很多麻煩。

55938IMG_20171228_100725.jpg

整個工業的現狀,大家是比較關注的,也看到很多未來的商業應用場景,有的應用在 3-5 年之後就有有一些小規模的原型出現。

76699IMG_20171228_100807.jpg

從投入來說,各國政府在量子計算機投入很大,比如去年歐盟推出一個十億歐元的研究計劃,北美大概也是這樣的量級,也有越來越多公司投入到人類改變認識自然方式的革命中。

98015IMG_20171228_100918.jpg

最後,我們經常聽到不同的對量子計算機的語言,我們認為量子計算機可以改變人類認識自然的方式,如果將來能夠大量使用量子計算機,確實會有非常革命性的顛覆式的變化。

但是它不會取代經典計算機,至少目前一二十年裡,它的製備條件、維護條件都太苛刻。

同時截止到目前,看不到任何本質上的跨不過的坎,所有問題都出現在工程工藝上。如果你回顧人類歷史的發展,重要的科學發展沒有受制於工藝沒能實現的。現在各國、很多公司都在持續投入,我相信一定會推動量子計算機最終實現。所以總的來說,前途是很光明的,但是道路是很曲折的。

要避免兩個極端:在短期,可能不會確定「6 個月、兩三年就能造出一個大型的量子計算機,解決一個多麼不得了的問題」。這個事情沒有那麼簡單,比公眾想象的更加困難。但是在長期,也不應該太悲觀,有人覺得「十年甚至五十年也做不出來什麼」。科技的發展突破有時候難以預料,而且關鍵環節一旦突破,發展會非常迅速。

剛才道生也介紹了,騰訊馬上要啟動量子實驗室,我們在籌備的過程中。我們希望招募到跟量子相關的演算法、複雜性、通訊、模擬、量子物理、量子化學等等各方面的人才。

另外我們也很看重量子力學和人工智慧的結合。可能有一些從物理中過來的想法,這些想法是完全可以實現在經典量子計算機上。如果有人喜歡做 AI、喜歡做機器學習,但是又想多一些理解和多一些本質性的突破,也歡迎加入我們,大家一起來研究探討這個問題。