1. 程式人生 > >2018走向成熟 2019未來可期 | PaddlePaddle大有可為

2018走向成熟 2019未來可期 | PaddlePaddle大有可為

目標 cdb 高精 嵌入 最終 位深度 努力 的人 架構

技術分享圖片

深度學習框架如同智能時代的“發電機”,讓人工智能技術更快速地普及到各行各業,推動融合創新,成為智能時代最重要的基礎設施。PaddlePaddle作為目前國內唯一功能完備的深度學習框架,經過2018年的快速成長,初具模型領先、性能優越、易學易用的技術特色,以及工業場景下的領先優勢。下面我們來盤點一下PaddlePaddle 2018年的成長之路。

一、核心發布

1、Paddle Fluid 1.0發布 —— 核心框架走向成熟

7月4日 Paddle Fluid V0.14.0發布——提供從數據預處理到模型部署在內的深度學習全流程的底層能力支持。官方首次開源CV/NLP/語音/強化學習等10個業界領先的模型。

10月12日 Paddle Fluid V1.0穩定版本發布——提供更穩定、向後兼容的API。易用性大幅提升。提供 Mac OS 下的多種安裝方式,新增對Python3.5的支持。並開源8個CV、NLP 方向主流模型。

11月1日 Paddle Fluid V1.1發布——支持千億規模稀疏參數大規模多機異步訓練。移動端預測新增Mali GPU、Adreno GPU、FPGA等硬件支持。開源5個推薦領域模型,大幅優化CV、NLP模型的訓練速度和顯存占用。

12月8日 Paddle Fluid V1.2發布——CPU多機異步訓練升級包括worker異步並發和IO、通信優化在內多項功能,整體吞吐大幅提升。支持python3.6及以上全版本。模型庫新增圖像分類任任務的預訓練模型、語言模型任務新增基於cudnn的LSTM實現、分布式word2vec模型。

2、PaddlePaddle Suite - 技術全面領先的深度學習全功能套件

PaddlePaddle3.0升級為全面的深度學習開發套件,在核心框架基礎上,開放VisualDL、PARL、AutoDL、EasyDL、AI Studio等一整套的深度學習工具組件和服務平臺,滿足不同層次的深度學習開發者的開發需求。具備強大支持工業級應用的能力,已經被中國企業廣泛使用,並擁有活躍的開發者社區生態。

技術分享圖片

二、三大技術特色

1、深耕工業場景,打造官方支持模型最多的深度學習框架

基於百度多年的工業應用經驗,以及百度生態夥伴的人工智能解決方案實踐,PaddlePaddle為企業提供44個經過工業場景驗證的官方模型,涵蓋視覺、NLP、語音和推薦等AI核心技術領域,成為官方支持模型最多的深度學習框架。

基於PaddlePaddle開源多個百度國際競賽獲獎模型:

PyramidBox模型2018年3月在世界最權威的人臉檢測公開評測集 WIDER FACE的三項評測子集Easy、Medium和Hard中均獲得世界第一。

基於Faster R-CNN的多模型,在Google AI OpenImages-Object Detection Track比賽中,從全球450多支參賽隊伍中脫穎而出,獲得世界第一。

PaddlePaddle強化學習框架PARL獲得NeurIPS 2018的強化學習賽事AI for Prosthetics Challenge競賽冠軍。

2、源於業務實踐,輸出業界最強的超大規模並行深度學習能力

基於百度海量規模的業務場景實踐,PaddlePaddle同時支持稠密參數和稀疏參數場景的超大規模深度學習並行訓練,支持千億規模參數、數百個幾點的高效並行訓練,提供最為領先的深度學習並行技術。

3、追求極致性能,推出移動端高速推理引擎

Paddle Mobile提供深度學習落地嵌入式移動端平臺的能力。針對ARM CPU、IOS GPU、Mali GPU、AdrenoGPU、FPGA、樹莓派、RK339等多個硬件平臺優化,性能高、體積小的優勢。服務於包括手機百度、簡單搜索在內的多款APP。在手機端實現單幀多目標檢測耗時60ms以內,主要物體檢測準確率和召回率均在95%以上。

三、 完善的服務平臺和配套組件

1、基於PaddlePaddle的深度強化學習框架PARL發布,奪冠NeurIPS 2018

PARL深度強化學習框架,具有高可擴展性、可復現性和可復用性,強大的大規模並行化和稀疏特征的支持能力。覆蓋DQN、DDQN、Dueling DQN、DDPG、PPO等主流強化學習算法。支持百億級別數據或特征的訓練,基於PARL可同時通過8塊GPU拉動近20000個CPU節點運算。在NeurIPS 2018賽事中將需要近5個小時叠代一輪的PPO算法加速到不到1分鐘,相對單機運算加速比高達幾百倍。

技術分享圖片

2、讓深度學習來設計深度學習,AutoDL2.0設計的網絡超過人類專家

AutoDL 2018年正式發布V1.0、V2.0,包含網絡結構自動化設計、遷移小數據建模、適配邊緣計算三個部分,能夠自動進行深度學習網絡的設計、遷移、以及適配,批量化生產模型。在CIFAR 10數據集,Auto DL 2.0設計的圖像分類網絡正確率達到 98%,效果全面超過人類專家。

3、EasyDL零基礎深度學習定制化訓練和服務平臺

EasyDL為零算法基礎的開發者提供高精度AI模型定制服務。只需少量數據即可得到優質業務模型,快速驗證應用場景。2018年,EasyDL從V3.0叠代升級至V5.0,逐步開放並完善定制圖像識別、聲音分類識別、文本分類識別等能力,累計超過2萬個模型在零售、工業、醫療、安防等多個行業中落地應用。

技術分享圖片

4、AI Studio:一站式深度學習開發實訓平臺

AI Studio作為集合了AI教程、代碼環境、算法算力和數據集的一站式實訓平臺,旨在幫助用戶快速掌握深度學習開發技能。AI Studio底層預裝PaddlePaddle框架及VisualDL等深度學習組件,大大提高開發者學習與開發的便捷性,混合調度CPU和GPU的資源,提升訓練速度。 已有4萬多位開發者聚集於此,一起創建模型、分享經驗、參與比賽。2019年,AI Studio將進一步發力高校教育,搭建一站式深度學習教學管理平臺,為高校開展深度學習教學提供極大便利。

技術分享圖片

四、黃埔學院 –革新者來

百度聯合國家深度學習技術及應用國家工程實驗室共同打造“黃埔學院”,我們秉承”服務於行業,服務於人才”的標準,項目組通過幾個月的招募與篩選,日日夜夜的評估與努力,最終選出業內35位深度學習專家,共同見證黃埔學院第一期開學典禮——首席AI架構師的課堂。『經世致用,融會貫通,黃埔學院,革新者來』,這十六個字正代表了黃埔學院的治學理念以及願景。我們希望技術不停留在實驗室,不停留在研究院,而是能真正的走出去,為這個世界、這個時代創造實實在在的價值。

技術分享圖片

五、2019,未來可期

2019年,PaddlePaddle將繼續以優化開發者體驗、節約開發者時間為己任,鞏固技術領先優勢,深入企業場景,在應用落地的各個環節提供更便捷、更安全、更高效的深度學習技術服務。

繼續降低深度學習技術的應用門檻,將超大規模並行深度學習、強化學習等業界領先的技術打造為人人可用的通用深度學習。

大力發展企業生態,通過應用場景深度對接,為企業提供快速咨詢通道、企業內部培訓、專項技術優化、聯合開發支持的全方位服務。

持續擴大教育生態,通過百度產學合作協同育人項目、TechDay公開課、深度學習實戰課、黃埔學院等行業頂級的技術交流活動,為開發者提供從深度學習入門到企業應用的一站式服務。

深度學習框架如同智能時代的“發電機”,讓人工智能技術更快速地普及到各行各業,推動融合創新,成為智能時代最重要的基礎設施。PaddlePaddle作為目前國內唯一功能完備的深度學習框架,經過2018年的快速成長,初具模型領先、性能優越、易學易用的技術特色,以及工業場景下的領先優勢。下面我們來盤點一下PaddlePaddle 2018年的成長之路。

2018走向成熟 2019未來可期 | PaddlePaddle大有可為