1. 程式人生 > >百度世界大會吳恩達演講視訊和內容

百度世界大會吳恩達演講視訊和內容

百度世界大會吳恩達演講視訊:

百度世界大會吳恩達演講內容:

       鳳凰科技訊 9月8日訊息,2015百度世界大會今日舉辦,百度首席科學家吳恩達在會上展示了百度深度學習在噪音環境下的語音識別進展,還發布了iOS版臉優APP,通過使用者自己上傳臉部照片,實時合成在攝像頭拍攝的其他臉部上,讓視訊達到變臉的效果。

       吳恩達表示,在如今的海量資料時代,百度擁有的大量資料可以擴大神經網路訓練,讓效果更好。百度開發了HPC(High Performance Computing,高效能運算)來做深度學習試驗,在訓練巨大的神經網路之後,使用它提供線上服務。

       此外,百度還開發了手機深度學習引擎,將神經網路的模型減少,大量提升執行速度,臉優APP就是一個例子。

       吳恩達介紹稱,百度還與伊利合作了一個直達號輕應用,可以識別出牛奶盒,並展現一個3D效果圖,利用產品包裝上的圖案提供增強現實體驗,不需要特別的圖片或二維碼。這款輕應用將於兩三個月後上線。

      關於人工智慧的前景,吳恩達稱,人工智慧的下一步不僅是百度大腦更聰明,也能夠使使用者也更聰明,技術可以成為人的智慧伴侶,提高效率。他表示,對人工智慧成為人類合作伙伴的未來充滿信心,也希望與大家共同走向智慧伴侶時代。

以下為吳恩達演講實錄

        謝謝,大家好,人工智慧已經在世界有很大的影響力,百度是引領人工智慧發展的公司之一,今天我想跟大家分享一些我們正在做的先進技術,我也希望未來我們能把這些技術開放給我們的合作伙伴。

        從李彥巨集講的一席話裡我們看到語音識別重要性,百度和北京團隊一起正在研究新一代的語音識別技術,讓我為大家演示一下。這是一段使用者手機的錄音,請大家仔細聽聽,你能聽出他在講什麼嗎。來。現在請大家閉上眼睛再聽一次他到底在講什麼。有時候由於噪音、口音等等,很難聽清楚電話那邊的人在說什麼,我們把這段語音放給我們的語音識別系統得到這個結果,是說中國好聲音幾點開始,請大家再聽一次。

       讓我們看一下第二個例子,我們聽一聽。再聽一次。這就是語音識別的結果,大床房多少錢,再聽最後一次,聽到了嗎?這個技術還沒有上線,目前在很多情況下人的語音識別能力還是比機器識別更準確,但是我們發現如果只有一段很短的語音,尤其是在比較吵的環境下機器識別可以超過人的識別,一年前我沒有想到這麼快機器就可以做到這點。

       我相信語音有很大的潛力改變人與裝置的互動方式,現在語音識別可能已達到95%的準確度,但要看你的口音等等來定,很多人沒意識到95%的準確度到99%的準確度帶來的不是量變是質變,是從你偶爾使用語音變到常常使用做到更自然。做到99%準確,將徹底改變人與裝置互動,這個技術的進展讓我對人與裝置全新互動充滿信心。

       在百度人工智慧技術的進展主要靠深度學習,深度學習的意思是建設巨大的神經網路,語音識別也是用深度學習做的。

       我們再看另外一個例子,王勁剛才講了也是用深度學習做的,我們把圖片交給神經網路他就會告訴人面前是什麼。

       在這一年中我們在深度學習基礎架構上有很大的進步,這對人工智慧的研究有很大的影響,我們的技術架構分為三個部分,第一就是用於訓練的超級計算機,第二就是用於線上服務的雲加速器,把訓練後的加速器放到雲端線上服務。第三就是手機上的深度學習引擎,讓我詳細解釋一下這三個部分。

       如今已是海量資料的時代,百度有著大量的資料可以使神經網路訓練的更大效果更好。我們開發了HPC來做深度學習試驗,這裡百度使用很多的GPU做HPC,在使用HPC做深度學習訓練上,百度處於世界領先地位。這裡做HPC的一個難點是提升GPU的使用效率,2014年HPC深度學習的使用效率是20%左右,我們目前GPU使用效率可以提升到85%,讓我們能夠更快的訓練巨大的神經網路。

       使用HPC訓練巨大的神經網路之後,下一步是使用它提供線上服務,例如當用戶講話時,系統會實時返回結果。普通的CPU伺服器有時候很難做到執行巨大的神經網路,我很高興像大家宣佈百度已經開發了兩個加速技術,第一我們開發了FPGA加速器,在很多重要的應用下他可以把速度提升五倍左右。第二我們也開發了GPU加速器,這裡GPU不僅用於訓練,我們也打算將其用於線上服務。百度的這種技術也是在世界上領先之一,這樣做的難點是如果有十個使用者在使用一個伺服器,我們需要找到一個聰明的方法讓一個CPU有效的為十個使用者提供服務,使用這個技術,我們可以在線上服務上明顯的提升神經網路規模。

       對於一些應用,把資料傳到雲端太慢,影響使用者體驗,所以我們需要在手機上執行深度學習引擎。用HPC訓練了巨大的神經網路後,把這個神經網路執行在這麼小的手機上很難的,所以我們開發了手機深度學習引擎。

       我們來看一個例子,我們想識別人臉,並理解表情,我們開發了一個深度學習系統,可以識別人臉上的72個關鍵點,對比其他系統我們識別了比較多的關鍵點,讓我們有更多細節來理解表情。

       在手機上執行神經網路,難點是模型規模、速度和錯誤率,這張圖是一個神經網路在PC上執行的結果,這個神經網路對於手機來說太大了,用我們的手機深度學習引擎我們使用了一個聰明的辦法,將神經網路的模型減少,還大量提升執行速度。

       使用手機深度學習引擎,我們做了一個新的APP叫做臉優,我們剛剛在IOS釋出這個APP,用手機拍一張你的照片,用神經網路識別出你的面部,然後和另外一張圖片放在一起效果就是這樣。讓我們為大家演示一下,這就是我的手機,我剛剛今天早上跟我其他的演講人拍的他們的照片。這就是我的臉變成了就是王勁,也可以變成李彥巨集,很好看,這就是Travis 再試一試,很帥。做女性的也可以,其實這就是我妻子的圖片,還有這就是我們的CFO,好,就這樣,謝謝。如果你有iphone,我希望大家下載玩一下。

       臉優是一個娛樂的APP,是需要非常快的響應速度,那麼手機深度學習引擎還有什麼其他用處呢?假如你和你的孩子一起去超市買東西,你們看見了這盒牛奶,我拿了一盒牛奶,如果你的孩子對這盒牛奶好奇你會怎麼辦?我們與伊利合作做了一個直達號輕應用,它可以識別出牛奶盒,並讓你看到一個3D效果的地圖,也可以從不同的角度來看他,從上面可以看,可以啊,遠一點,臺上燈光很亮,看見了,那你可以從不同的角度看這個地圖,如果小朋友點選這個地圖也可以看到另外一端牛奶的資訊。這個輕應用兩三個月後會上線,這個可以利用產品的包裝上的圖案提供增強現實體驗,不需要特別的圖片或二維碼,增強現實技術可以讓你更多的瞭解我們的世界,我們目前還是和很少的商家合作,希望未來有更多的商家可以使用這個技術,幫助使用者瞭解產品並探索世界。

       百度已經有很多人工智慧的產品,我們的深度學習基礎架構可以讓人工智慧越來越好,派發出更多更新產品。最後人工智慧的未來是什麼?在我結束演講前,我想向大家講講人工智慧的前景。

       很長時間以來我們一直在講百度大腦越來越聰明,這很重要,他能讓我們對使用者提供越來越好的服務,但這還不夠,人工智慧的下一步不止是百度大腦更聰明,也能夠使使用者也更聰明,像李彥巨集提到的度祕,技術可以成為你的合作伙伴,讓你變得更有效,雖然是你本人決定去哪裡旅行,決定吃什麼,決定買什麼衣服,但是技術可以成為你的智慧伴侶,幫你更好的瞭解資訊,做出選擇,做出定,這裡技術需要了解你的想法,也需要與你互動,語音識別是一個重要的方法,也是技術與人互動的例子,李彥巨集講的祕書化也是這個意思,因此我對人工智慧成為人類合作伙伴的未來充滿信心,我也希望與大家共同走向智慧伴侶時代。謝謝!