阿裏巴巴發布智能運維故障管理AI+生態計劃
6月7日,2018雲棲大會·上海峰會在上海世博中心舉行。本次大會以“驅動數字中國”為主題,聚焦人工智能、金融、零售、IoT等行業,聚焦產業生態新發展,展現產業鏈上下遊新應用,推動雲端新融合,降低行業企業信息化成本,助力上海經濟新發展。大會全面展現數字化魅力,如何利用“數字”帶動企業轉型、促進業態發展、創造產業新動能,激發數字經濟新引擎。
對於當前IT運維圈子裏最火爆的AIOps概念,本次大會也設立了主題分會場,共同探討人工智能在IT運維領域的應用與實踐。
開放“AI+”生態計劃,回饋社會
阿裏巴巴全球運行指揮中心(GOC)掌門人沈乘黃首先分享了“智能運維在阿裏巴巴線上故障管理領域的應用經驗”。沈乘黃站在集團業務連續性保障的角度,講述了GOC團隊如何通過機器學習應對每秒數千萬數據的處理,把握阿裏每一項業務的運行狀況,實現對近百個技術團隊、數萬名研發人員的應急信息實時互聯,讓一切線上問題無所遁形,讓所有阿裏技術團隊令行禁止。
同時,沈乘黃正式宣布,為響應馬老師“家國情懷,世界擔當”的號召,開放“AI+”生態計劃,將讓集團內部服務過程中積累下的技術與經驗更好地回饋社會,任何企業或合作夥伴均可以簡單方便的接入阿裏巴巴智能故障管理平臺,通過對接入數據的訓練學習實時提供異常檢測、關聯分析、根因定位的能力,使原有的IT管理模型瞬間實現低成本的智能化升級,為IT同行們更便捷的提升工作效率、降低人力成本盡一份綿薄之力。
智能算法,為業務穩定連續運行保駕護航
阿裏巴巴高級技術專家王肇剛由淺入深分享了“全球運行指揮中心(GOC)團隊提供的智能算法模塊的技術實現與應用心得”,講述了如何在復雜的業務場景下迅速發現異常事件,並從千萬個指標中尋找關聯事件,最終確定異常事件的根源,並通過應急、通知、恢復、復盤、演練等一系列動作完成故障管理的閉環,最終確保業務穩定連續的運行。
單指標多維下鉆分析
當業務指標總量異常出現時,準確地智能定位到出現異常的分量或分量組合。
多指標相關性分析
? 當指標異常時,動態發現有相似下跌形態的相關指標,為原因定位提供重要線索。
? 通過離線分析,發現業務報警之間的關聯規則,當單業務異常時能夠對其它業務進行提前預警。
可疑應用/事件分析
? 自動基於運維數據倉庫進行相關應用/事件檢索,鎖定懷疑範圍。
? 自動根據指標異常和事件相關性進行推薦排序,篩掉無關事件。
開放合作,為用戶帶來更多價值
大會所在的世博中心曾經是上海世博會的會議中心,秉承著平等開放、合作共贏的理念向全世界展示了中國的新面貌,本次雲棲大會也正傳承了開放合作的理念,首批“AI+”生態合作夥伴涵蓋了網絡分析、應用交付、雲計算服務、日誌分析、業務運維等不同領域。
其中成都科來軟件有限公司技術副總裁龍成、深信服科技股份有限公司研發部總經理邱亮、上海駐雲信息科技有限公司執行總監李俊濤、北京優特捷信息技術有限公司(日誌易)技術總監饒琛琳、雲智慧(北京)科技有限公司高級技術顧問楊路分別在其各自領域就智能運維的落地實踐,以及與阿裏巴巴智能故障管理平臺結合後為客戶帶來的價值提升做了分享,讓企業在智能化升級的過程中有更多的方案選擇。
分會場上技術專家的精彩演講,得到了廣泛好評,智能運維等詞成為會場熱議話題。不少參加會議的專家和觀眾表示,演講很有收獲,從技術和應用的層面對AI在運維領域的應用與實踐有了更多更深的了解,也希望未來能夠了解更多智能運維領域的技術和發展。
原文鏈接
阿裏巴巴發布智能運維故障管理AI+生態計劃