1. 程式人生 > >SER 團隊之分析

SER 團隊之分析

sre






SER 團隊職責:

  • 可用性改進

  • 延遲做強化

  • 性能優化

  • 效率優化

  • 變更優化

  • 變更管理

  • 監控

  • 緊急事務處理

  • 容量規劃與管理



時間分配: 運維工作限制在50%以內, SRE 團隊應該將剩余時間在研發項目上。


將生產環境中發現Bug 和產生的工單轉給研發管理人員中去分配, 或者將開發團隊成員加入on-call 體系中共同承擔輪值壓力


產品事故都應該對應的事後總結, 無論有沒有觸發報警。



監控系統



SER 團隊監控服務質量和可用性的一個主要手段。


監控系統的設計策略是針對摸個特定的情況或者監控值, 一旦出現情況或者監控值超過閾值就觸發E-mail 報警。








本文出自 “運維自動化” 博客,請務必保留此出處http://shower.blog.51cto.com/4926872/1968102

SER 團隊之分析