2016年DevOps發展報告:部署頻率提高200倍,宕機成本降低100倍
該報告譯者:FIT2CLOUD 徐桂林
一、內容摘要
DevOps發展情況第五年度報告重點闡述了以下事實:
優秀的IT和團隊表現是跨開發和運維的團隊協作的結果,對IT和團隊的投資可以帶來豐厚的回報。
本年度DevOps報告展示瞭如何通過改進整個產品生命週期(從產品規劃到質量和安全保障,再到客戶反饋)來加速產品的交付,同時優化產品的質量、安全和業務成果。DevOps實踐也可以改進組織文化,增強員工的參與感。
在過去的五年裡,我們調查了來自世界各地的25000多個專業技術人員。通過調查,我們更好地理解DevOps帶來的技術實踐、文化規範和精益管理是如何影響IT和團隊表現的。
去年我們調查了DevOps的幾個維度,包括精益管理實踐、應用架構、IT經理在DevOps轉變中的角色、多樣性、部署難題、工作倦怠等。最後我們證實,技術實踐只是IT效能提升所有因素中的一小部分。
為了創造持續的IT高效能表現,組織在對技術本身進行投資的同時,需要增加對人員和研發過程的投資。
今年我們針對當前DevOps社群面臨的最緊迫的問題進行了調查,這些問題包括:
DevOps的投資回報率(ROI)
DevOps實踐的作用及價值
如何將安全與DevOps進行整合
員工投入和組織成功之間的關係
關鍵發現
1、高效組織的生產能力明顯超越他們的低效同行。
高效組織比低效者的部署頻率高200倍,交付週期快2555倍。此外,高效組織的故障恢復時間比低效者快24倍,修改失敗率低3倍,明顯優於低效者。
高效組織公佈,他們從部署更改到生產的交付時間(例如,從程式碼提交到成功部署至生產環境)平均交付時間為60分鐘,低效組織的平均交付時間為3.5個月,因此交付週期快2555倍。
2、以員工淨推薦值(eNPS)作為衡量標準,高效組織的員工具有更高的員工忠誠度。
高效組織的員工更有可能向其朋友推薦本組織作為理想工作場所,其概率比低效組織高2.2倍。
同時,高效組織的員工更有可能向其朋友推薦所在小組作為理想工作環境,其概率比低效組織高1.8倍。
其他研究顯示,員工忠誠度越高,業務產出越高。
3、提高質量是每個人的工作。
高效組織花在計劃外工作和返工的時間比低效組織少22%,同時,高效組織能夠比低效組織在新工作(新功能、程式碼)上多花29%的時間。
他們之所以能夠如此,是因為高效組織通過持續交付把質量融入到開發流程的每個階段,而不是在開發結束時再對產品進行翻新。
4、高效組織花在修復安全問題方面的時間比低效組織少50%。
通過更好地將資訊保安目標整合到日常工作中,團隊可以實現更高層次的IT效能,並建立更安全的系統。
5、改進產品研發流程可以提高您的IT和團隊表現。
產品開發週期在開發人員開始編碼之前很久就開始了。產品團隊需要的能力包括:
分解產品和功能的能力。
將從理念到產品的工作流程視覺化的能力。
收集使用者反饋,持續迭代和改進的能力。
根據團隊能力的水平,可以預測其IT表現和部署難題。
6、進行技術改造可以為任何組織產生相當大的成本節約。
技術領導者都想知道投資技術改造後,可以獲得什麼樣的回報。
您可以使用本報告的關鍵指標和行業基準,並通過我們提供的準則來量化潛在的成本節約。
- 潛在的成本節約可以使用您自己組織的指標來量化。
- 節約的成本可以進行再投資,以提高IT和團隊表現,本報告也對此提供了相應的建議。
二、調查參與者
今年我們調查了來自世界各地的超過4600名專業技術人員。
與去年相比,從事DevOps相關工作的人數有所增加。但是令人失望的是,女性受訪者的人數只有微小增加。
我們在其他行業調查中也發現了相同的現象。我們仍然有很多工作要做來提高DevOps領域的多樣性和包容性。
三、IT表現和員工忠誠度
我們發現高效組織中積極員工的比例明顯高於低效組織。這是有道理的,因為只有忠誠度最高的員工才會把公司推薦給朋友,而只有高效組織才可以培養出忠誠的員工。
歷年IT表現:
我們研究了過去三年有價值的資料,發現高效組織正在脫穎而出。
DevOps帶來的持續改進是實實在在,且令人興奮的。
DevOps正驅動公司向最好的方向發展,並把其他公司拋在身後。三年前的最高水平已經不能適應當前的商業環境。
通過對DevOps投資回報率(ROI)的分析,我們發現宕機對公司有非常大的影響。客戶、企業高管會深切體會到宕機的影響,在某些情況下,媒體對此也會很敏感。
因此,宕機不僅會帶來財政上的損失,也會造成聲譽損失。
四、將質量根植於產品之中
DevOps的理念與組織融合越深,組織就越深刻的體會到:質量和安全是每個人的工作。我們想確定是否持續交付會改變產品質量的管控方式。
更多內容請參見“閱讀原文”連結。
五、生產管理精益化
精益化方法注重從產品的生命週期開始,通過頻繁的使用者研究來測試產品的設計和商業模式。我們發現當產品團隊採用精益化方法來設計和交付產品時,組織的IT表現和文化都會有明顯提升,其整體表現也會更好。
經過統計分析,我們發現產品管理精益化可以提高IT表現,減少部署問題。有趣的是,前兩個因素(將產品分解的能力、對產品開發和交付過程的理解)是共同起作用的。
以上所述表明了一個觀點:流程視覺化和工作分解對產品生產至關重要。下圖展示了以上因素產生的影響。
六、改變組織文化及員工認同感
員工是組織最寶貴的資源,然而他們經常會被隨意拋棄。當領導者對員工進行投資,使他們盡最大努力工作的時候,員工會對組織產生更強烈的認同感,員工也會更加努力來幫助企業成功。
員工對所在組織認同,也可以帶來注重成果、績效導向的企業文化,並且提升組織表現(例如生產效率、市場佔有率、利潤)。
七、DevOps的投資回報
技術領導者都想知道投資技術改造後,是否可以獲得良好的投資回報。通過使用一些關鍵指標和行業基準,我們對DevOps實踐給組織帶來的潛在成本節約進行了計算。
根據計算結果,我們將組織分為高效組織、中等組織、低效組織。此外,我們還研究了怎樣使用節約下來的時間和金錢進行再投資,才能給組織帶來更大、更持久的價值。
傳統上,IT被看做成本中心,說服管理者對IT進行投資很難。直到最近,都沒有有力的證據來說明,對IT的投資可以帶來豐厚的回報。
在過去的報告中,我們發現IT表現和組織整體表現有明顯關聯。從而證明了,IT可以帶來真正的業務價值,提升組織的業務競爭力。
今年,我們發現高效團隊在計劃外工作和返工上,花費的時間最少(21%)。因此,他們能夠將49%的時間花在增加價值的新工作上。
低效組織和中等組織的情況卻恰好相反。低效組織比中等組織花在返工上的時間少(分別為27%和32%),花在新工作上的時間多(分比為38%和34%)。
一種可能的解釋是,低效組織會忽略產品中的嚴重缺陷,並不斷推進新功能開發。但是缺陷的不斷疊加,會使他們在以後付出慘重的代價。
中等組織在返工上會比低效組織花費更多的時間,從而消除技術隱患,與此同時,中等組織也會有更高的修改失敗率。但是,因為中等組織的部署頻率高於低效組織,所以他們可以快速試錯。
過去,中等組織通過提高速度、優化投入產出來實現利益最大化。隨著時間的推移,他們更有可能通過持續優化生產過程來實現利益最大化。
這些有趣的發現強調了以下事實:每個組織都必須把錢花在刀刃上。
我們再次強調,雖然低效組織的返工成本較低,但我們相信那是以掩耳盜鈴為代價的。隨著缺陷的不斷疊加,他們以後會為此付出慘重的代價。
每年因宕機產生的成本(宕機成本)
根據IDC的Steven Elliot的近期報告,對一家世界財富1000強企業來說,每小時宕機所產生的損失從12.5億美元到22億美元不等。
關鍵程式故障所造成的損失平均為每小時50萬美元到100萬美元不等。
當然,宕機所造成的損失隨著業務的不同而不同。比如說,高容量的金融交易機構因宕機造成的損失,肯定比為寫字樓管理清潔工的公司造成的損失大。
另外,IT架構的不同,會導致宕機造成的影響和恢復的難度越會不同。從而導致宕機所造成的損失也不同。
在今天的商業環境中,稍微複雜的業務都高度依賴軟體和計算機網路,宕機會對嚴重威脅業務的健康。
鑑於此,每個組織都應該根據自身的業務模型和架構,衡量宕機可能給自身造成的損失。
本報告中,我們會提供給您計算宕機成本的方法。同時,我們也使用業內資料,對高效組織、中等組織和低效組織的宕機成本進行了計算。
宕機成本 = 部署頻率 *修改失敗率 * 故障恢復平均時間 * 停產每小時造成的損失。
部署頻率。我們對此次調查的資料進行了平均。高效組織可以根據需求進行部署,Etsy每天部署80次,Amazon和Netflix每天部署數千次。
我們更加保守的估計了高效組織的部署頻率:每天4次,每年1460次。中等組織的部署頻率從每年12次到每年52次不等,平均下來,中等組織每年部署32次。
低效組織的部署頻率從每年2次到每年12次不等,平均下來,低效組織每年部署7次。您可以根據您公司自身的部署頻率進行計算。
修改失敗率。修改失敗率是指導致停產的修改數量佔總修改數量的比例。
根據本次調查的資料顯示:
- 高效組織的平均修改失敗率為7.5%(從0到15%)
- 中等組織的平均修改失敗率為38%(從31%到45%)
- 低效組織的平均修改失敗率為23.5%(從16%到30%)
您可以根據您公司自身的修改失敗率進行計算。
平均故障恢復時間(MTTR)。根據今年的調查資料,高效組織的故障恢復時間小於一小時,中等組織和低效組織的故障恢復時間都小於一天。
中等組織和低效組織故障恢復時間的中值是相同的,但其平均值不同。低效組織故障恢復時間的平均值明顯高於中等組織。
為了進行示例計算,我們採用了比較保守的數字:
高效組織的MTTR為1小時
中等組織和低效組織的MTTR為24小時
您可以根據您公司自身的MTTR進行計算。
停產損失。因為DevOps在一些組織的軟體開發和核心程式交付中已經開始使用,為了避免誤差,我們採用IDC較早前公佈的資料。
據保守估計,核心程式每小時的停產損失為500000美元。您可以根據您公司自身的每小時停產損失進行計算。
雖然低效組織的宕機成本較低,但是他們卻為部署不頻繁付出了隱藏的代價。一個公司如果不能高頻次的釋出產品,那麼它就失去了不斷獲取使用者反饋的機會。
企業可以根據使用者反饋不斷進行實驗,持續改進產品,從而提高客戶滿意度。這可以讓企業領先競爭者,緊隨市場變化進行創新,最終使企業鶴立雞群。
我們推測高效組織所獲得的收入和利潤,遠遠超出他們的宕機成本。
對於部署頻率較低的公司,雖然總體部署成本較低,但是單次部署成本很高。除了用美元進行衡量,我們可以其他角度進行分析。
部署不頻繁的必然結果是,每次部署都會將又大又複雜的程式碼包部署到生成環境中,導致整合和維護困難。而且,當故障發生時,很難定位。
部署不頻繁還會帶來其他的負面影響。因為部署不頻繁,每次部署都會將又大又複雜的程式碼包部署到生成環境中,此時會導致大量問題產生。
工程師和運維人員必須匆忙的去修復這些問題,這時每個人埋頭工作去找出問題所在和解決辦法。
這個過程無疑是令人沮喪的,其中必然充滿抱怨。
這些痛苦的部署場景是反面教材,不會教給團隊正確的做事情的方法。勇於探索、不斷學習、持續改進的良性迴圈不會再這個環境下出現。組織想要提升業務產出更是難上加難。
DevOps帶來的價值
我們必須指出,對IT進行投資不能僅考慮成本節約。成本節約可以帶來短期積極影響,但是大家對第二年節約的成本卻習以為常。
你必須能夠說明節約下來的員工時間用來進行其他提高產量、增加價值的活動。
重新利用節約下來的員工時間、創造力和激情,會取得豐富的業務產出。最好的組織深諳此道,他們在計算投資回報率(ROI)時,會考慮技術改造的價值。
技術改造所帶來的未來價值不能被低估。無論是將節約下來的時間用於開發新的產品和功能,還是改進生成過程,未來都會取得良好的收益。
八、結論
DevOps不再只是一個時尚用語,它已經成為一系列可以被理解的具體實踐和文化模式。
轉向DevOps的人們不僅僅可以改善日常工作,給家人、朋友、同伴更多的時間,同時DevOps可以提升組織表現,增加收入、提高利潤和其他可衡量的產出。
五年前,我們就開始進行DevOps調查,併發布DevOps發展情況報告。我們已經明白了DevOps工具、實踐和文化價值是怎樣影響IT團隊和組織的。
今年,我們對DevOps進行了更廣泛的資料收集,更深入的分析。我們希望通過今年的報告,能夠使您更好的理解DevOps給您的組織帶來的影響