1. 程式人生 > 實用技巧 >AI架構師,到底“貴”在哪兒?

AI架構師,到底“貴”在哪兒?

AI 架構師這個角色是在最近幾年裡逐漸衍生出來的,可謂是人工智慧界的“新貴”。

“新”,是因為隨著近幾年來AI工程化落地的人才需求井噴,才催生出了“AI架構師”這份職業;“貴”,則是因為這份工作的年薪,由於其人才稀缺性,達到了令人咋舌的程度。在網上隨便一搜,便能發現各大網際網路公司開出的薪資,平均竟高達40k-50k,更有甚者可達年薪百萬。

圖片來源:拉勾網

這是隨隨便便工作一年,就湊夠一套北上廣首付的節奏。若是再加上股票期權等隱形福利,40歲之前實現財務自由,從此逍遙快活不是夢。

但是,這份工作並不是人人都能做,我們得看看它到底“貴”在哪兒?需要哪些核心技能?

什麼樣的人才能讓大廠為之瘋狂?

以阿里巴巴在招的AI高階解決方案架構師為例,我們來歸納總結一下此職位的技能樹:

圖片來源:獵聘網

堅實的機器學習和深度學習理論基礎

能熟練使用Python、Tensorflow等建模工具,對資料探勘、機器學習演算法有深入的瞭解。

豐富的專案實戰經驗

包括機器學習演算法應用、分散式深度學習框架、資料探勘專案等實際應用的經驗。

業務理解能力

能夠快速理解業務,將業務問題轉化為實際問題,並給出針對性解決方案。

總的來說,AI架構師不僅要對AI知識體系有一個穿透性的理解,更要通過大量的專案實踐,將理論應用到現實中來,而想要達到年薪百萬的水平,還需不斷訓練自己將業務問題抽象成AI問題的能力,並提出相應的解決方案。

掙錢難嗎?難。

但並不是不可能。

貪心學院

分散式高效能深度學習實戰培養計劃

現在加入,給自己一個躋身金字塔尖的機會

為什麼推薦這門課程?

幫你打基礎

各大AI框架設計原理講解,學完你將迅速掌握Tensorflow、Pytorch、Mxnet等常用訓練框架的分散式通訊及計算原理。CUDA、MPI、OPENMP等常用平行計算庫的使用。TensorRT、TNN等常用部署框架的設計及使用。模型量化、壓縮、裁剪、混合精度訓練等常用優化方法。

帶你做專案

語音、視覺、推薦,三大效能提升專案實戰,涵蓋深度學習的目標檢測演算法,AI個性化語音合成專案實戰,以及基於演算法的分散式推薦系統實操。

大廠導師親自帶隊,手把手傳授一線業務經驗

課程主講人任老師,是現任某大廠深度學習高效能負責人,百度深度學習技術平臺部Paddle資深架構師,獵豹移動NR推薦系統及語音識別資深演算法工程師,以及中科院資訊工程研究所的助理研究員。

曾參與研發產品包括小愛同學、小雅、小豹智慧音箱智慧語音系統,News Republic新聞推薦系統,中科院大規模GPU+FPGA分散式異構計算系統,Paddle 集合通訊框架及PLSC開發。資歷豐富,技術過硬,對於AI架構師的能力要求及培養非常有經驗。

課程大綱

階段一:基礎準備及概述

Week01 基礎理論及課程介紹

  1. 課程安排與三大專案介紹(影象+語音+推薦)

  2. 高效能運算技術深度學習應用概覽。

  3. 矩陣計算基礎理論。

  4. Cupy矩陣加速技術。

  5. Numba 編譯加速技術。

  6. 練習:使用Cupy實現千萬級矩陣加法運算。

Week02 並行及分散式框架概述

  1. 經典平行計算方案介紹。

  2. OPENMP技術詳細介紹。

  3. MPI技術詳細介紹。

  4. NV集合通訊NCCL 技術介紹。

  5. 練習:使用MPI/NCCL/OPENMP實現並行規約演算法。

階段二: 目標檢測專案

Week 03 -Week 05

內容簡介:

目標檢測計算機視覺中的經典問題。目前已經廣泛應用在行人跟蹤、車牌識別、無人駕駛等領域。基於深度學習的目標檢測演算法由於具有較高的識別準確率逐漸成為主流。目標檢測演算法對實時性要求較高,本專案著力於解決這一問題。

學習目標:

通過目標檢測這類以卷積模組為主的模型的解構,掌握並能夠上手自己動手實現卷積等常規的神經網路運算元,並使用TensorRT框架完成基於GPU的目標檢測專案的部署。

Week 03 經典卷積網路回顧

  1. 經典卷積網路模型回顧,從Lenet到Resnet。

  2. 卷積引數設計及應用詳解(分組卷積,空洞卷積等)。

  3. 卷積層的正向和反向傳播演算法。

  4. 卷積層的計算優化技術。

  5. 練習:樸素2D Conv的Pytorch 外掛實現(含反向傳播)。

Week 04 目標檢測演算法

  1. RCNN系列模型分析。

  2. YOLO系列模型分析。

  3. SSD系列模型分析。

  4. Tensorrt框架入門。

  5. 練習:Tensorrt SSD專案的部署。

Week 05 NvidiaTensort核心演算法和Plugin開發

  1. TensoRT 量化技術。

  2. TensoRT混合推理的原理。

  3. TensoRT的Plugin開發流程。

  4. 練習:使用不同級別量化對比YOLO 推理效能。

階段三:個性化語音合成專案實戰

Week 06-10

內容簡介:

智慧化的讀書功能,允許選擇語音音色來進行聽書。導航的智慧語音-如百度地圖、高德地圖、傳統Garmin導航等,都支援選擇不同語言進行實時導航。智慧音箱-喜馬拉雅FM的小雅、科大訊飛的智慧語音輸入,支援辨識活體語音,進行反饋處理再以語音方式反饋回覆。這些問題背後都是基於Seq2Seq的深度學習合成模型,該模型結構複雜計算量大,本專案旨在通過通過優化解決這一問題。

學習目標:

掌握個性化語音合成中經典的聲紋提取、基於Attention的合成模型、以及典型的基於卷積網路的聲碼器設計。在此基礎上掌握基於ONNX的通用模型轉換技術及基於TensorRT來進行模型部署推理加速。

Week 06:合成專案全貌概覽

  1. 合成專案整體介紹。

  2. 聲紋提取網路結構。

  3. Tacotron/Tacoton2 結構介紹。

  4. Wavenet、WaveRNN、WaveGlow 結構介紹。

  5. 實踐課:Pytorch 實現Google Speaker Embedding。

Week 07 計算圖表示及優化

  1. ONNX計算圖表示方法介紹。

  2. ONNX 圖優化的常用技術。

  3. Pytorch模型轉ONNX技術介紹。

  4. 實踐課:實現Google Speaker Embedding 模組的onnx輸出並進行圖優化。

Week 08 Attention-Based Seq2Seq模型Tacotron2

  1. Tacotron2模型整體結構。

  2. Attention技術回顧。

  3. teacher forcing技術。

  4. GRU演算法的TensorRT實現。

  5. 練習:將tacotron2模型輸出為優化後的onnx模型並Tensorrt部署。

Week 09 聲碼器: Wave序列生成演算法實戰。

  1. 聲碼器技術回顧。

  2. wavenet模型解讀。

  3. WaveRNN模型解讀。

  4. WaveGLow模型解讀。

  5. 實踐課:整體部署優化後的5s語音合成系統。

階段四:分散式推薦系統

Week 10 – week12

內容介紹:

頭條新聞推薦、抖音短視訊推薦、京東商品推薦個性化推薦已經成為現代人們生活的一部分。推薦系統特徵往往具備稀疏性的問題,如果解決大規模稀疏模型的訓練時本專案擬解決的問題。

學習目標:

通過推薦系統這一大規模稀疏特徵特性的模型結構,瞭解引數伺服器的設計以及分散式環境下的反向傳播演算法的實現,以及常見梯度計算優化演算法Local SGD,同時具備常用推薦模型的應用部署能力。

Week10 推薦系統概覽

  1. 經典推薦演算法概述。

  2. 基於LR的樸素新聞推薦系統設計。

  3. 常用Layer的前向傳播和反向傳播演算法。以fc和pooling為例。

  4. 實踐課:實現最基本的LR推薦。

Week11 分散式引數伺服器

  1. 引數伺服器概述。

  2. 分散式環境下的SGD演算法。

  3. Range 查詢的高效實現。

  4. 實踐課:用pslite實現分散式大規模矩陣加法。

Week 12:分散式推薦系統實戰

  1. FM演算法詳細詳細介紹。

  2. DeepFM演算法詳細介紹。

  3. 稀疏矩陣的全域性引數更新演算法。

  4. 實戰專案:用pslite實現分散式FM推薦演算法。

階段五 深度學習高階主題

Week13-Week15

內容介紹:

深度學習框架日新月異。國際上有Tensorflow、Pytorch、Keras等框架,國內有PaddlePaddle、曠世天元,清華計圖等框架,那麼這些框架遵循怎樣的設計理念和發展發現,本階段內容通過梳理典型框架的設計來讓學員對這些問題有更為清晰和直觀的認識。

學習目標:掌握深度學習架構的設計思想及技術演進,通過對核心的框架通訊技術的解讀以及經典的圖優化運算元融合等技術的講解,讓讀者未來對框架的使用更加熟練。

Week13 深度學習架構演進

  1. 主流深度學習框架的核心設計思路對比。

    第一代系統

    第二代系統

    第三代系統

  2. 實戰專案:paddle中的program技術分析報告。

Week14 訓練加速高階技術1

  1. Local SGD原理。

  2. 並行執行器設計。

  3. 實戰專案:動手實現local sgd。

Week15 訓練加速高階技術 2

  1. 深度學習框架分散式通訊技術。

  2. 深度學習框架計算圖fuse技術。

  3. 實踐課:TNN fuse技術原始碼分析報告。

階段六 結業答辯

Week16 閉幕式

課程總結

專案答辯

畢業典禮

這門課程適合誰?

畢業後希望躋身AI領域的大學生

  • 計算機或者資訊領域相關的本科/碩士/博士生。

  • 畢業後希望從事深度學習相關的工作。

  • 想要在深度學習應用外掌握深度學習框架的設計。

  • 想要學習框架二次開發,驗證新演算法的能力。

想要實現技能提升,跳槽大廠的在職人士

  • 具備良好的工程研發背景,希望從事AI相關的專案或者工作。

  • 從事AI單一領域,但希望具備深度學習從框架到部署優化全鏈路能力。

  • 希望能夠提升模型部署中遇到的效能瓶頸時的問題解決能力。

  • 希望提升針對框架進行二次開發的能力,及時上線新模型新演算法。

你需要具備什麼基礎,才能達到最佳學習效果?

  • 理工科專業相關本科生、碩士生、博士生或者IT領域的在職人士。

  • 具備良好的程式設計能力,具備良好的C++和Python程式設計能力。

  • 從事深度學習領域相關工作,對深度學習訓練、部署及優化有初步的認識。

  • 具備良好的論文閱讀能力。

學完課程,你將成為這樣的專業人才

解決專業技能不紮實,硬實力薄弱的問題

核心內容知識點涵蓋CUDA、Cupy、Numba、TensorRT、TNN、計算圖優化、運算元融合、 GMM Attention、Forward Attention、tts、Tacotron2、 FastSpeech……你所需要的技能工具,我們都準備好了。

解決實戰經驗不足,導致簡歷無專案可寫的問題

從深度學習的應用場景(語音、視覺、推薦專案),到AI專案落地全鏈路流程,包括深度學習系統設計 、平行計算優化、部署優化、應用,豐富的實踐挑戰,讓你的簡歷不再有任何空白。

【劃重點】

本期課程已開班

不想錯過進度的同學

速速掃描下方二維碼報名咯!