1. 程式人生 > 其它 >AI專家一席談:複用演算法、模型、案例,AI Gallery帶你快速上手應用開發

AI專家一席談:複用演算法、模型、案例,AI Gallery帶你快速上手應用開發

摘要:華為雲社群邀請到了AI Gallery的負責人嚴博,聽他談一談AI Gallery的設計初衷、經典案例以及未來規劃。

本文分享自華為雲社群《AI專家一席談:複用演算法、模型、案例,AI Gallery帶你快速上手應用開發》,作者:華為雲社群精選 。

你見過哪些有趣又實用的AI開發案例呢?

比如讓靜態照片上的人物開口唱歌,動漫角色也可以哦;再比如通過識別各類野生動物並分析種群結構,進而實施保護;又或者智慧檢測口罩佩戴的規範性,助力疫情防護……

這些場景化的AI案例,都可以在華為雲AI Gallery上找到對應的模型,通過不斷訓練,你也可以實現。AI Gallery上擁有演算法、模型、資料、Notebook等豐富而優質的AI資產,開發者可以直接複用這些資產,

解決AI應用開發的難題。

縱觀AI應用的整個開發流程,從資料採集、標註,到演算法模型的構建,每個環節都會產生許多可以複用的AI資產,而AI Gallery的目的就是充分發揮這些資產的效用,提高AI開發效率。

那麼,它是如何匯聚這些AI資產,又是如何讓資產效用最大化地幫助到開發者高效的進行AI開發呢?

華為雲社群邀請到了AI Gallery的負責人嚴博士,聽他談一談AI Gallery的設計初衷、經典案例以及未來規劃。

人工智慧有三駕馬車:資料、演算法、算力。從這三點看,當前的AI應用開發進入到了什麼階段?

人工智慧是人類在不斷探索和發展一個領域,因為事先沒有定義好有哪些階段,所以很難回答我們當前處在哪個階段。但是有一個很明顯的感知,人工智慧發展比10年之前有顯著的進步,大量應用也越來越多。

這個契機是2012年以深度學習為代表的一類演算法得到突破。在此之前,大家更關注的是演算法,大家都是在用資料降維和一些分類器的方案去做機器學習相關的AI開發,訓練的資料體量也很小。

在2012年的契機點上,有了算力的加持,再通過演算法和大量的資料迭代,我們看到AI開發模型的精度有了量級的提升。 隨著這個量級提升之後,它能夠在更多的行業和領域去應用AI技術來提高生產力。

但是,當前這個階段人工智慧還不能像人類那樣,可以通過少量資料的學習獲得邏輯推演能力。人工智慧本質上還是通過大量的資料進行擬合和迭代,讓它能夠“記住”資料再去做一些推理,但它並不具備邏輯推演能力。不過,相比過去10年,AI最終的準確率已經有了提升,它的應用領域也進一步拓展。

往後展望,我們還會在算力上有進一步的突破,再加上整個演算法和資料的加持,最終能訓練出精度更高,甚至是像人類那樣能夠獲得邏輯推演能力的AI。

一個完整的AI應用開發流程包括哪些環節,其中的挑戰是什麼?

一般是三個流程。

第一個環節是資料準備,需要採集資料,對資料進行清洗,轉換的工作。每一個環節都有自己的挑戰。以資料為例,採集階段會有政策法律上的限制,資料孤島很難被打破。另外還要對資料進行有效的標註,這需要大量的人力才能完成,經濟成本較高。

第二個階段是建模,基於準備好的資料,選擇合適的演算法,開發相關的模型。要考慮訓練出來的模型的應用場景。比如AI應用是放在移動端上的,還是放在雲端伺服器上,這兩者對推理的時延、準確率的要求都是不同的。因此AI開發的建模過程,要綜合理解AI應用的場景,再去選擇合適的演算法工藝架構。它和只追求精度或者推理速度的學術領域不一樣,我們需綜合考慮,所以挑戰比較高。

第三個階段是基於模型來進行具體的AI應用的開發,它圍繞具體的應用場景,配合開發一些IT系統、軟體、UI互動等。比如演算法工程師負責建模開發,到了應用開發階段可能是由應用工程師承擔,它的角色是變換的。作為應用開發工程師,收到的是已經開發完的模型,但這個模型推理的時延和精度可能都達不到理想狀態。這個時候就要通過壓縮,蒸餾的技術進一步優化它。如果精度達不到,還得考慮最終這個應用是否能夠通過一些巧妙設計來規避這些問題。

AI Gallery是不是為了解決上述環節中的一些問題?它的設計初衷是什麼?

現在很多開發流程都是平臺化的,AI開發的每個階段都會產生一些數字資產:演算法、模型、資料集,可能還有一些處理的函式、方法之類的。我們希望有一個地方能夠把這些東西都沉澱和積累下來,以方便後續的開發者複用之前的一些成果,這也是我們設計AI Gallery的初衷。

當越來越多的開發者分享各種場景下的AI資產,AI Gallery可以包含全場景各種精度的實驗,這時其他開發者也能根據最終的開發場景直接拿來即用這些資產。

打個比方,AI開發的三個階段可能是由不同角色介入的,如果應用工程師想介入到AI開發中,但又缺少相應的資料和演算法工程師該怎麼辦?AI Gallery裡就有訓練好的模型,應用工程師拿來即用就可以了。從這個角度來看,它可以提高整體的開發效率。

開發者選擇演算法或者模型首要考量是什麼?在這一點上,AI Gallery是如何應對的?

如果是選資料的話,一般是基於它的行業和領域場景,看有沒有合適的資料,這個是跟領域和行業強相關的。當前我們提供了資料的分享的機制,有很多開發者已經共享了開源標準場景的資料集,來供大家在ModelArts上快速地驗證自己的想法。

演算法方面,開發者首要考量的是演算法最後產生的模型是不是自己想要的,以及演算法在訓練時的輸入資料格式,訓練所需的開銷、執行演算法的環境等等。

模型方面,先要明確應用開發是部署在雲上、邊緣側,還是端側,這對於最後的應用場景很重要。其次是推理的時延,諸如醫療場景的資料會很大,它的推理就是非同步的,但有些場景要求的是實時推理,可能對推理響應的時間要求很高。最後是精度,要評估應用場景對精度的敏感度。

綜上,在AI開發的每一個階段,都有很多需要考慮的指標、量綱。我們要做的就是把這些量綱和指標準化出來,能夠讓釋出AI資產的開發者填寫這些指標,方便使用的人去瀏覽、篩選和檢索,快速找到他想要的東西。

AI Gallery有哪些經典案例可以給開發者介紹一下?

對於視覺領域的一些經典演算法如YOLO、ResNet50,官方已經做了大量的適配,但這些演算法其實沒有沉澱到這個領域和行業裡面的。因此我們基於內部的一些專案,也去做了一些AI的實踐案例。比如說水錶讀數,安全帽檢測等等。這些案例可能是使用同一個具體的演算法,但是應用在不同的領域和行業場景。

後續會讓我們的夥伴、高校的老師、開發者一起來分享他們的案例,這樣,其他的開發者也能通過閱讀這些案例快速的復現,加速整個端到端的開發。

在此也為大家推薦一些AI Gallery上的經典案例:

安全帽檢測水錶讀數識別工地場景的鋼筋盤點使用PPO演算法玩超級馬里奧兄弟與中國象棋AI對戰

像工業安全帽檢測、水錶讀數,都是基於華為在行業內的一些專案沉澱出來的案例。這些案例生產的模型可以達到工業級的要求,它可以直接部署使用。唯一的區別是資料,當前我們只提供一個樣例的資料,如果大家能夠採集到更多更好的資料,訓練出來的模型精度也會非常不錯。

在AI Gallery釋出AI資產後,開發者能享受到什麼權益?

對於ISV夥伴來說,AI Gallery是和華為云云市場打通的,因此他們可以上架雲市場,商業售賣資產模型,直接獲得商業利益。

對於開發者來說,當前更多的是個人成就和榮譽的提升。後續我們也在積極的引入個人開發者計劃,讓普通的個人開發者去參與到整個專案之中,真正地進入到實戰環節,既能獲得實踐的鍛鍊,也能夠得到經濟上的回報。

AI Gallery是如何助力普惠AI的?

一是資產和案例的積累。當前已經有很多開發者在AI Gallery上貢獻主流的開源資料集,其他人直接驗證演算法時可以拿來即用。在演算法和模型方面,官方也已經把很多常用演算法做了預整合。高校也在將一些經典論文的演算法釋出到AI Gallery分享。

二是分享機制。開發者可以把演算法和模型分享到AI Gallery,然後我們正在嘗試採取一些激勵的機制,讓他們更有動力分享。

三是針對端到端的案例場景,我們上線了案例庫。當前案例雖然還不是很多,但後續華為官方以及ISV、夥伴、個人開發者會陸續將開發和交付的專案案例總結髮布進來,讓廣大開發者通過學習這些案例來加速應用開發過程。

AI Gallery的未來規劃是怎樣的?

第一個方向是加速行業和企業的AI應用落地。首先就是通過資產沉澱提高AI開發效率。其次是我們正在做專案的需求廣場,以及開發者的認證機制,通過減少開發環節的鏈路,讓更多的開發者和夥伴通過AI Gallery開發和交付AI專案,最終幫助行業和企業解決問題,加速應用的落地。

另一個方向主要是面向學習教育的場景。現在我們基於大量的算力和資料去做迭代式的訓練和開發,但很多高校的硬體可能跟不上,需要在雲上進行教學實踐。所以面向教育行業,面向個人開發者學習的場景,我們也打算做一些事情,包括教學課程,論文解讀等等。

最終我們希望把這兩條線打通,既能提供教學培訓、學習的一站式解決方案,也能夠讓開發者把學習到的知識通過真實的交付場景實踐出來。

點選關注,第一時間瞭解華為雲新鮮技術~