異構計算:軟硬件結合全棧助力AI大爆發
9月20日上午,杭州雲棲小鎮E1-2會場,備受業界關註的2018年杭州雲棲大會異構計算專場召開。
近年來,人工智能持續爆發,對算力提出了更高的要求。異構計算作為大計算時代的解決方案,意在打破傳統通用計算的限制,融合不同指令集和體系架構的計算單元,完美支持大計算場景。
讓每一個芯片都發揮最大效能
首先,阿裏雲彈性計算負責人,阿裏雲研究員余鋒,帶來了精彩的開場。余鋒以攝影來打開話題:每一個鏡頭都會有特別的定位,在某個場景下合適但是另外場景會力不從心,異構計算的精髓也是如此,即讓每一個芯片都發揮最大效能,揚長避短。
余鋒說:異構計算帶來的計算效率提升是指數級的,但是需要有配套工具,基礎設施等等。阿裏雲正在逐漸讓這個門檻變低,並且和業內一起構建技術生態,讓異構計算普惠行業,幫助合作夥伴和客戶不斷創新。
GN6實例 F3實例全面商業化
議題階段,首先登場的是阿裏雲高級產品專家潘嶽。潘嶽首先介紹了正在全面商業化推進的GN6實例和F3實例。GN6實例搭載NVIDIA Volta架構的Tesla V100計算卡,相對於上一代產品可以提供12倍的運算能力提升。而基於阿裏雲FaaS(FPGA as a service)舜天平臺的F3實例搭載Xilinx 16nm Virtex UltraScale+器件VU9P,對比上一代產品,邏輯容量增加4倍,DSP能力提升8倍。
兩大平臺:昊天 和 舜天,全面助力企業創新
隨後,潘嶽首次揭秘了阿裏雲異構計算兩大平臺:昊天EGS平臺和舜天FaaS平臺;分別對應異構計算領域兩大熱門芯片方案:GPU和FPGA。潘嶽指出,阿裏雲異構計算平臺技術在阿裏巴巴內部已經完成和多項業務的順利融合,歷經大範圍高壓測試,已然非常成熟。除此之外,異構計算全系產品與阿裏雲生態深度無縫融合,可以和傳統的通用計算共用雲上的全套服務。
在改善用戶使用體驗上,阿裏雲異構產品持續提供多種工具,來讓異構產品更易用,這其中包括了方便開發部署的容器鏡像工具,實時監測GPU狀態的運維工具,以及神經網絡框架優化的增值服務等。此後,潘嶽分享了阿裏雲FPGA雲服務器落地的業務場景。最後,在異構生態建設上,潘嶽強調,阿裏雲積極引入國內外眾多的解決方案供應商,共同構建完善異構生態體系,為企業客戶提供高性能的加速解決方案。
昊天平臺揭秘
論壇的第二個議題由阿裏雲資深技術專家龍欣帶來,對昊天EGS平臺進行了詳細的剖析。龍欣指出阿裏雲異構計算的GPU雲服務,在算力水平擴展趨勢背景下,已經從GPU加速器的單點突破,向全面的平臺體系演進。
今天的演講第一次披露了阿裏雲昊天EGS平臺的服務體系:昊天平臺在集群計算上,為不同規模的客戶提供了從GPU集群運維監控,到底層CUDA驅動,再到中間框架加速層快速一鍵部署,和GPU集群分布式業務層定制化調優的全面專業服務。演講還分享了昊天平臺在底層基礎設施層的技術架構:GPU虛擬機的熱升級技術、與AMD聯合開發的公共雲首個基於SRIOV的GPU熱遷移技術、神龍GPU技術與超級計算GPU集群技術。
成熟客戶案例立體呈現
來自微博的資深技術專家黃波,從客戶的角度,詳細介紹了基於阿裏雲異構計算平臺的深度學習案例。同時,黃波先生還從自身體驗出發,總結了雲端深度學習的優勢:彈性,集群化管理,高性能,和專業服務等等。
舜天平臺揭秘
第四個登場的是阿裏雲資深技術專家張振祥,帶來了對阿裏雲FaaS舜天平臺的詳細剖析。議題指出阿裏雲FaaS舜天平臺是雲上輸出FPGA高性價比算力的使能器,大幅降低了FPGA的應用門檻。圍繞著“易用性、穩定性、可擴展性和安全性”的設計理念,舜天平臺做了大量的軟硬件創新。
張振祥強調,以舜天平臺為依托,阿裏雲願與業界的合作夥伴和客戶並肩攜手,打造FPGA異構計算的健康而強大的生態圈。隨著雲計算和人工智能的進一步普及,FPGA的器件和技術將獲得進一步的提升和改善,更好地適用大算力的應用場景,服務更多的垂直市場。演講過程中,現場反應熱烈,業界同仁對共建生態圈體感強烈。
舜天平臺助力阿裏高性能時序數據庫
最後,阿裏巴巴技術專家錢赟介紹了基於阿裏雲舜天平臺的高性能時序數據庫。從實際案例出發,再次驗證了舜天平臺的性能極致,資源易用,IP安全,同時又可以大幅降低計算成本等特性。
阿裏雲在異構計算上的逐步深入和成熟,正在幫助越來越多的企業在雲上實現創新和突破。比如剛剛在MS COCO大賽獲得4項世界冠軍的曠視科技就是阿裏雲異構計算的深度用戶。客戶的成功一直是阿裏雲的訴求和共同目標,一起來用異構計算開啟大計算時代吧。
原文鏈接
本文為雲棲社區原創內容,未經允許不得轉載。
異構計算:軟硬件結合全棧助力AI大爆發