阿里去年新增12億行程式碼;即將開源自研科學計算引擎、圖學習框架;行人重識別演算法斬獲世界第一 | 周博通
每週一早晨,阿里妹為你呈現最新的“技術資訊早餐”,和臘八粥一樣擁有豐富乾貨、營養美味。五分鐘時間,讓你成為“周博通”。
周 博 通
阿里巴巴脫貧基金年報釋出 感受脫貧攻堅中的工程師力量
2017年12月,馬老師宣佈成立阿里巴巴脫貧基金,將脫貧作為阿里的戰略性業務,5年投入100億元,用於電商、教育、生態、健康、女性等五個方向。
2019年1月,阿里巴巴脫貧基金年報釋出,其中工程師成為脫貧中堅力量。資料顯示,過去一年時間裡,有數百名阿里工程師帶技術下鄉;3871名貧困大學生參加了阿里雲的工程師認證培訓;2741名外部工程師在“碼上公益”平臺註冊成為志願者,參與了24個技術脫貧專案。比如:報告!這群阿里工程師在偷偷養豬
一起來看看這份新鮮出爐的《阿里巴巴脫貧工作報告(2018年)》:
關鍵資料:
2018年,國家級貧困縣在阿里巴巴平臺網路銷售額超過630億元。
截至2018年底,“頂樑柱健康扶貧公益保險專案”幫助425萬人次建檔立卡貧困戶獲得健康保險。
2018年,阿里巴巴超過1000名員工投入脫貧業務,實地走訪貧困縣超過100個。
2018年,共有200萬商家、4.2億使用者通過阿里巴巴公益和螞蟻金服公益雙平臺進行公益捐贈,累計幫扶貧困人口超過774萬人次。
報告全文下載地址:
http://i.aliresearch.com/img/20190110/20190110154134.pdf
12億行程式碼,阿里巴巴這一年的技術報告和夢想報告
近日,《阿里巴巴程式碼資料報告》正式釋出。報告顯示,阿里工程師在2018年共寫下了12億行程式碼,總程式碼長度可繞地球4.49圈。
除此之外,這份報告還有不少你關心的數字:
阿里媽媽計劃再開源:圖學習框架 Euler
繼開源阿里首個深度學習框架 X-Deep Learning之後,阿里媽媽計劃在近期再度開源一個圖深度學習框架Euler,這也是國內首個在核心業務大規模應用後開源的圖深度學習框架。
過去幾年,深度學習技術在工業界被廣泛應用併產生了巨大的技術紅利,圖神經網路的深入應用有希望形成下一波技術紅利。Euler作為一個大規模分佈圖深度學習框架,在阿里媽媽核心業務場景中進行了錘鍊。實踐證明,Euler不但取得了出色的業務效果,而且在訓練規模、效能和易用性上都表現出色,同時內建了大量的業內常用演算法和阿里媽媽自研的創新演算法。
阿里妹將會持續關注,第一時間為你送上最新訊息,敬請期待~
阿里首款自研科學計算引擎即將開源!
在去年的雲棲大會上,阿里巴巴通用計算平臺團隊宣佈將開源阿里首款自研科學計算引擎。目前阿里妹得到可靠訊息,這個千呼萬喚的開源日期將會是本週之內。
近年來,雖然張量的概念隨著機器學習/深度學習的熱潮逐漸為人所熟知,對張量進行通用計算的規模需求也與日俱增,但現實是業界一流的科學計算庫仍舊停留在單機時代,無法突破規模瓶頸。同時,現在流行的分散式計算引擎卻並非為科學計算而生,上層介面不匹配導致科學計算任務很難用傳統的 SQL/MapReduce 編寫,執行引擎本身沒有針對科學計算優化也使得計算效率難以令人滿意。
阿里即將開源的計算引擎正是針對這樣的背景設計的:通過提供基於張量的統一計算框架 ,一方面普惠科學計算進入分散式時代,另一方面可以讓大資料進行高效的科學計算。
阿里行人重識別(ReID)演算法效果取得世界第一
近日,阿里巴巴機器智慧技術實驗室在行人重識別(Person Re-identification)演算法上獲得突破性成果。該技術團隊通過最新演算法,在不使用任何時序資訊的情況下,在行人重識別主流資料庫(Market1501,DukeMTMC-reid和CUHK03)上各項指標均取得第一的好成績,重新整理了業內的最好成績。
其效能的提高主要來源於技術層面的創新:該團隊通過區域性資訊的挖掘,致力於解決行人在識別過程中表觀姿態變化劇烈,不容易對齊的問題。一方面,通過人體語義分割得到具有強語義資訊的部件,並利用注意力機制在其中尋找最具有區分性的區域。另一方面,使用了基於金字塔的水平分塊策略,得到行人固定區域的可辨識資訊。在訓練中,同時採用兩種策略相結合的方式,達到行人圖片的對齊,從而實現更精準的匹配識別。通過技術上的改進,該方法在三個公開資料庫上的效果均優於之前最好方法,特別是mAP指標,分別提升了2%,1.87%,3.39%。
原文釋出時間為:2019-01-14
本文作者: 技術創造新商業
本文來自雲棲社群合作伙伴“ 阿里技術”,瞭解相關資訊可以關注“ 阿里技術”。