1. 程式人生 > >掌握哪些機器學習工具更受企業青睞?

掌握哪些機器學習工具更受企業青睞?

640?wx_fmt=jpeg

參加 2018 AI開發者大會,請點選 ↑↑↑


想成為一名優秀的開發工程師不是一件簡單的事情,除了掌握工程師的通用技能以外,還需要掌握機器學習的各種演算法,更需要掌握從開發到除錯到優化等一系列能力,這些能力中的每一項掌握起來都需要足夠的努力和經驗。近兩年來,深度學習框架技術領域正在飛快的發展,我們在談到機器學習工具時,首先想到的就是深度學習框架。也是大家在技能進階過程中必學的一項。今天我們就從深度學習框架的發展趨勢入手,分析現在企業對人才在深度學習框架與其他機器學習工具技能上有哪些要求。


▌深度學習框架技術哪家強?你 Pick 了誰?


根據 GitHub 活躍數、開發人員使用人數、在招聘描述中出現的頻率等綜合資料分析,Google的 TensorFlow 仍穩居第一,被廣大網友一致認為非常適合入門學習的 Keras 、人氣漲勢迅速的 PyTorch 、還有 Caffe 、Theano、MXNet 、CNTK 、Caffe 2.0、FastAi 等框架都緊隨其後,受到越來越來多開發者和企業的關注。


近日,ICLR 2019(國際學習表徵會議,被認為是深度學習的頂級會議)開始投稿。在 Reddit 上有一個話題討論:” ICLR 2018 & ICLR 2019 使用 TensorFlow、Keras 和 PyTorch 深度學習框架的論文數量對比”,從資料中我們可以看出,這三個深度學習框架仍然是關注度最高的三個框架,而今年 PyTorch 的漲勢則非常大。10 月 3 日,Facebook 更是重磅釋出深度學習框架 PyTorch 1.0 開發者預覽版,包括一系列工具和整合;fast.ai 釋出的 fastai.1.0 也是基於 PyTorch 構建的開源深度學習庫。




640?wx_fmt=png


Keras 之父 François Chollet 在之前的一條 Twitter 中也曾表達過他的一些觀點:“我覺得 TensorFlow 和 Keras 有 80% 的可能性在 20 年後仍然存在,並在 10 年後(2028年)仍擁有龐大的使用者群。 卷積神經網路在 20 年後(2038年)仍然流行的概率大約是 20%,AI 領域的發展實在太快了。 ”(via:François Chollet)


640?wx_fmt=png


▌國內開始奮力發展,積極打造全方位生態體系


當前,因為機器學習、深度學習一些基礎性演算法已經較為成熟,各科技公司紛紛建立演算法模型工具,以便開發者和公司參考和使用並幫助大家實現技術進階與轉型。雖然上面提到的這些框架都是國外的 AI 科技巨頭或高校的研究成果,但是國內的科技企業和研究機構也已經開始在這個技術領域上奮起發力,比如此前最為大家所熟知的由百度釋出的深度學習開源平臺 PaddlePaddle,今年小米釋出了自研移動端深度學習框架 MACE。上週,華為在全聯結大會上釋出了 AI 戰略。除了宣佈兩款 AI 晶片外,更是重磅釋出了面向 AI 開發者的一站式開放式平臺——ModelArts 和開發框架 MindSpore 。


另一個必須要提到的工具就是以 AutoML 為代表的自動機器學習工具。Google 推出的開發者的利器——AutoML 相信大家已經非常熟悉了。在 Cloud AutoML 釋出之時就表示”我們希望,即便你不懂機器學習,也能幫你訓練出一個定製化的機器學習模型,讓 AI 技術能夠普及每一個企業“。為了開發者和公司不被技術的壁壘所限制,類似 Cloud AutoML 的工具開始不斷出現。微軟之前也釋出了雲端服務的 Custom Vision;GitHub 上公開的開源自動機器學習庫 Auto-Keras;今年,國內探智立方公司也釋出了人工智慧模型自動設計平臺——DarwinML 1.0。


未來,TensorFlow 與其他框架的競爭仍將繼續;科技公司也在積極合作探索模型互換、遷移等技術;同時,開源框架也將向著統一與標準化的方向發展。更高階的 API 也將佔據更重要的地位,例如 Keras,可以與 TensorFlow、MXNet 等多種框架結合執行,甚至可以取得雙贏的效果;對計算力的高需求,如何突破現在面臨的瓶頸;隨著應用場景的不斷豐富,機器學習工具如何結合各行各業進行工業級、大規模實踐;如何利用自動模型工具更高效的訓練模型、選擇模型都是我們要探討的問題,也是所有AI 開發者要學習與努力的方向。


▌企業更關注開發人員的哪些技術技能呢?


640?wx_fmt=png


上面的圖表是國外一位作者爬取了LinkedIn、Indeed、Simply Hired、Monster 和 Angel List 上的招聘描述。營長也在國內某網際網路、技術人才招聘網站上搜索了幾個著名科技公司的招聘需求。可以看到,無論在國內還是國外,TensorFlow 都是現在是各大企業在招聘描述中關注度最高的深度學習框架。


640?wx_fmt=png


還有一些實習生的招聘要求:


640?wx_fmt=png


可見,除了深度學習框架,大規模機器學習平臺與分散式平臺的設計和開發、叢集併發計算開發等相關的實踐能力與經驗同樣非常重要。但是,我們往往很難真正接觸到工業級大規模的業界實際問題,那面試的時候又如何具備這些知識與技能呢?如果從一開始就沒有這方面的積累,到真正找工作時候又如何應對?


現在,CSDN 以 AI 開發者的需求為導向,聯合矽谷 AI 社群 AICamp 出品的 2018 AI 開發者大會(AI NEXTCon)於 2018 年 11 月 8-9 日在北京召開。


8 日下午,我們專門開設“機器學習工具技術專場”,為大家邀請到了在研究和工業級大規模機器學習平臺開發、深度學習平臺開發應用有著豐富經驗的技術專家們。


大家不僅可以學習到 TensorFlow 在工業級大規模平臺的應用開發與案例;深度學習框架新架構下的應用、測試分析與調優技術;百度 PaddlePaddle 平臺核心技術的開發實踐與應用;還有Google Brain 技術專家與你一起共同探討 AutoML 在不同領域中的應用。


下面介紹機器學習工具技術專題的重磅講師團:


640?wx_fmt=png


鄒欣:微軟亞洲研究院研發經理

演講議題:AI 平臺和應用實踐


鄒欣老師,負責過必應搜尋客戶端、必應輸入法、必應詞典、微軟小娜等產品。曾出版《移山之道》、《編輯之美》(合作)、《構建之法》三部書籍。鄒欣老師是 CSDN 部落格專家,在 CSDN 部落格網站上開設人工智慧專欄,文章深受開發者們的喜愛。


640?wx_fmt=png


袁進輝:北京一流科技有限公司董事長、首席科學家

演講議題:如何讓深度學習框架具有橫向拓展能力?


袁進輝老師於 2008 年 7 月獲得清華大學計算機系工學博士學位,並獲得清華大學優秀博士學位論文獎。2013 年加入微軟亞洲研究院從事大規模機器學習平臺的研發工作。2014 年,發明了當時世界上最快的主題模型訓練演算法和系統 LightLDA,只用數十臺伺服器即可完成以前數千臺伺服器才能實現的大規模主題模型,該技術成功應用於微軟線上廣告系統。2015 年至 2016 年底,專注於搭建基於異構叢集的深度學習平臺。2017 年創立北京一流科技有限公司,致力於打造分散式深度學習平臺的事實工業標準。袁老師將會會結合深度學習對計算力需求,分析目前在軟硬體上的瓶頸;提出深度學習框架的新架構;並教大家在靜態排程的流式引擎新架構的深度學習框架下,如何進行測試結果分析、效能調優等一系列實踐技能。


640?wx_fmt=png


林嵩:Google Developers Experts 谷歌開發者專家

演講議題:基於 TensorFlow 框架的輕量級深度學習應用實踐


林嵩老師是大中華地區首位人工智慧和機器學習方向的谷歌開發者專家。在提議題時,林老師特別告訴營長,“我希望介紹的應用案例都是每個人都可以去嘗試的,伺服器單機甚至移動端就可以實現的”,相信這樣的內容無論大家在哪類開發平臺都不可錯過,相信林老師豐富的開發經驗也一定可以讓大家獲益匪淺。


640?wx_fmt=jpeg


Yifeng Lu:Staff software engineer of Google Brain.

演講議題:Google AutoML 在研究與商業領域的領域


Yifeng Lu 是 Cloud AutoML Vision 的技術負責人和架構師。相信大家現在對 AutoML 已經不再陌生,今年 1 月,Google 釋出了最新的 Cloud AutoML 技術,此技術能使企業開發者們通過 Google Cloud 平臺自動建立機器學習模型。谷歌首先發布了 AutoML Vision,用於建立機器視覺模型的工具。由於 AutoML 使用費用昂貴,平常大家很難有機會參與實踐。這次大會我們專門邀請到了 Cloud AutoML Vision 的技術專家,也希望幫助大家在技術之路上再進階一個層次。


640?wx_fmt=jpeg


胡曉光:百度深度學習技術平臺部主任工程師

演講議題:PaddlePaddle 平臺的核心技術與應用實踐


胡曉光老師具有多年的深度學習演算法實踐經驗,2015 年帶領團隊上線全球首個基於深度學習的線上翻譯引擎,現在負責 PaddlePaddle 框架應用開發,致力於打造最好用的深度學習平臺,服務廣大AI開發者。本次大會上,胡老師將通過分析 PaddlePaddle 原理,深入講解深度學習框架的實現方式,移動端部署,以及並行等技術實踐問題;並結合在 CV 與 NLP 領域的應用案例進行全面分析。


除了機器學習工具技術專題之外,我們還為大家準備了“計算機視覺”、“自然語言處理”、“資料分析”、“機器學習”、“知識圖譜”、“語音識別”等技術專題,以及“智慧金融”、“智慧駕駛”、“智慧醫療”等行業峰會。大會完整日程以及嘉賓議題請檢視下方海報。


【完】


2018 AI開發者大會

只講技術,拒絕空談


2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會!是一場以技術落地為導向的乾貨會議!大會設定了10場技術專題論壇,力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物,多位一線經驗大咖帶你將AI從雲端落地。


即刻點選「閱讀原文」或者識別海報二維碼報名參會,立享7折優惠票價(更有定量學生票)!


大會日程以及嘉賓議題請檢視下方海報

(點選檢視大圖)

640?wx_fmt=jpeg

640?wx_fmt=jpeg


點選「閱讀原文」,檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮,擁抱技術前沿。