英偉達的“千人摩擦計劃”：幾千個智慧體互相玩耍，學習跑酷更輕鬆

阿新 • • 發佈：2018-11-07

摩擦慄發自凹非寺
量子位出品 | 公眾號 QbitAI

聽說，互相摩擦，有助於快速學習。

如果，模擬器裡只有一個強化學習智慧體，它可能活得很自在。

640?wx_fmt=gif

天大地大，虛擬機器器人做個空翻、迴旋踢之類，都不是稀有的技能，只是需要艱苦訓練罷了。

那麼，要是讓幾千個人形智慧體，一起在模擬器裡跑呢？

它們就會相互摩擦，親暱地扭打在一起，形成一幅不可開交的美妙圖景。

640?wx_fmt=gif

這不是重點，關鍵是智慧體在摩擦的過程中，學起技能來，會比孤獨的時候快很多。

英偉達就想用這種方法來加速學習，於是開發了自己的物理模擬器。

在那裡，人類跑步的姿勢，智慧體不用20分鐘便可解鎖。且只要一個CPU核心，不要成百上千。

相互摩擦，是最美的

英偉達開發的是一個GPU加速模擬器，支援千百隻人形智慧體，在同一個世界愉快地互動。

並且，只要一個Tesla V100 GPU，加上一個CPU核，就夠了。

640?wx_fmt=gif

為了智慧體更好地學習人類技能，團隊為四種技能設定了Benchmark，由易而難：

一是，只用兩條腿、但是像螞蟻那樣跑步 (不是說好的人類技能啊) ：

640?wx_fmt=gif

二是，依然用兩條腿、但像人類那樣跑步：

640?wx_fmt=gif

三是障礙跑，遇到球球會站不穩，重點是重新找到平衡，不要摔倒：

640?wx_fmt=gif

四也是障礙跑，不過地形複雜，還是要在站不穩的時候努力保持平衡：

640?wx_fmt=gif

在複雜地形下訓練過的智慧體，會擁有隨機應變的能力。

即便是在從未見過的環境裡，從超過一人高的平臺跳下也能迅速站穩，繼續奔跑。

640?wx_fmt=gif

放進現實裡，大概就是這個樣子：

640?wx_fmt=gif

一個頂一千個？

現在，來和前輩們對比一下時間和硬體成本：

640?wx_fmt=png

一個CPU核心，抵得上一千個？

是有了GPU加持之後，模擬器每秒可以生成6萬幀，幀時間 (Frame Time) 能降到0.02毫秒以下。也就是說，幀延遲小到幾乎可以忽略。

那麼，就算智慧體的數量從5個增加到5,000個，也不會有什麼壓力。

由此，即便只用一個CPU核心，學習效率也可以得到保障。

640?wx_fmt=png

這項研究，是在英偉達的物理引擎FleX裡面完成的。

很快，團隊就要在CoRL 2018

大會上，介紹研究成果了。

在那之前，大家可以欣賞一下論文：

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning
https://arxiv.org/pdf/1810.05762.pdf

— 完 —

加入社群

量子位AI社群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話介面回覆關鍵字“交流群”，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話介面回覆關鍵字“專業群”，獲取入群方式。（專業群稽核較嚴，敬請諒解）

活動策劃招聘

量子位正在招聘活動策劃，將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入，並希望你能有一些活動策劃或運營的相關經驗。相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

英偉達的“千人摩擦計劃”：幾千個智慧體互相玩耍，學習跑酷更輕鬆

摩擦慄發自凹非寺量子位出品 | 公眾號 QbitAI 聽說，互相摩擦，有助於快速學習。如果，模擬器裡只有一個強化學習智慧體，它可能活得很自在。天大地大，虛擬機器器人做個空翻、迴旋踢之類，都不是稀有的技能，只是需要艱苦訓練罷了。那麼，

語音合成論文與韓國小哥“撞車”後續：英偉達“趕緊”把程式碼開源了

乾明編輯整理量子位出品 | 公眾號 QbitAI 前兩天，量子位報道了韓國小哥語音合成論文與英偉達撞車一事。在得知自己的論文與英偉達的論文“撞車”之後，韓國小哥趕緊在arXiv上提交了論文。並在GitHub上放出了自己研究的原始碼。然後，在Reddit上分享了自己的這

深度學習實踐操作—從小白到大白（四）：Ubuntu下Nvidia（英偉達）驅動安裝

深度學習實踐操作—從小白到大白目錄四. ubuntu下Nvidia（英偉達）驅動安裝 1. 前期準備檢視是否有NVIDIA顯示卡 nvidia-smi 將n

深信服和英偉達共同釋出：國內首款基於KVM技術的vGPU虛擬桌面解決方案

日前，在泰國曼谷召開的2018深信服合作伙伴大會上，深信服宣佈與全球領先的顯示卡晶片廠商英偉達（

AI開發者福音！阿裏雲推出國內首個基於英偉達NGC的GPU優化容器

人工智能算法容器摘要： 3月28日，在2018雲棲大會·深圳峰會上，阿裏雲宣布與英偉達GPU 雲合作（NGC），開發者可以在雲市場下載NVIDIA GPU 雲鏡像和運行NGC 容器，來使用阿裏雲上的NVIDIA GPU計算平臺。阿裏雲推出國內首個基於英偉達NGC的GPU優化容器 3月2

英偉達為Jetson Xavier提供Isaac智能機器人平臺

jet isa log 分發驅動機器執行官 aac 一個 Nvidia宣布推出由其新型Jetson Xavier計算機驅動的智能機器人Isaac平臺。 Isaac包括新硬件，軟件和虛擬世界機器人模擬器。該平臺由NVIDIA創始人兼首席執行官Jensen Huang在2

【NVIDIA英偉達】熱招汽車系統開發工程師-社招

flow business base familiar 可視化 eal forefront te pro over 關於 NVIDIANVIDIA (納斯達克代碼：NVDA) 是一家計算機技術公司，公司一直在 GPU 加速計算的行業中勇當開路先鋒。NVIDIA 以滿足全球最

基於百度英偉達EasyDL公開課的學習筆記

本文是基於智東西公開課《零演算法基礎的百度EasyDL定製化影象識別揭祕》整理的學習筆記本文非廣告，標註單純是出於尊重智東西和EasyDL的智慧財產權如若涉及侵權，請聯絡本人作者：李皮皮謝絕任何不標註原出處的轉載以及百度百家號抄襲本次公開課為期一小時，

cudnn 是英偉達的一個加速庫

cudnn 是英偉達的一個加速庫首先要安裝好cuda 在英偉達網站 https://developer.nvidia.com/rdp/cudnn-download 下載與cuda對應的庫，需要註冊一個賬號下載之後解壓縮，將.h .lib 和.dll 檔案分別拷貝到cuda的inc

華為釋出重磅AI戰略，AI晶片算力超谷歌英偉達

10月10日，2018華為全連線大會上，華為輪值董事長徐直軍直接釋出華為AI戰略、華為AI全棧全場景解決方案、2款華為AI晶片。其中，華為的AI戰略包括投資基礎研究、打造打造全棧方案、投資開放生態和人才培養等，併為此釋出了華為全棧全場景AI解決方案，以為大家充裕的、經濟的算力資源，以

語音合成論文和英偉達撞車，韓國小哥緊急放出全部草稿程式碼和樣本 | 資源帖...

曉查發自凹非寺量子位報道 | 公眾號 QbitAI 由於和英偉達研究撞車，韓國一位研究語音合成的作者已經哭暈了。 10月31日，英偉達在arXiv網站上傳了一篇論文——WaveFlow：一個用於音訊合成基於流的生成網路。英偉達論文地址：https://arxi

股價暴跌近19%！英偉達一天就虧掉一個“AMD”

@央廣軍事11月10日訊息,2018中國航展上首次公開展出的“瞭望者Ⅱ”察打一體導彈無人艇，是剛剛成功進行首發導彈飛行試驗命中靶心的實艇，試驗成功後隨即吊裝到展位與公眾見面。據媒體此前報道，該艇是中國第一艘導彈無人艇，也是繼以色列拉斐爾海上騎士後全球第二個成功發射導彈的無人艇，填補了國內導彈無人艇這一技術空白

被刷屏的英偉達GPU技術大會，黃仁勳為什麼要誇百度雲？

“好快、好便宜”，在11月21日舉辦的英偉達GPU技術大會(GTC China 2018)上，英偉達創始人黃仁勳，用中文一個勁重複誇讚搭載了T4 GPU的百度雲。（黃仁勳現場秀Nvidia T4 on Baidu Cloud）通過部署最新版

阿里雲異構計算團隊亮相英偉達2018 GTC大會

1、首屆雲原生計算國際會議上，彈性計算研究員伯瑜介紹了基於虛擬化、容器化編排技術的雲端計算作業系統PouchContainer 首屆雲原生計算國際會議（KubeCon + CloudNativeCon，China，2018）在上海舉辦，彈性計算研究員伯瑜介紹了基於虛擬化、容器化編排技術的雲端計算作業系統Po