運維相關的技術方向
運維的相關技術方向
1.什麼是運維
運維,這裡指網際網路運維,通常屬於技術部門,與研發、測試、系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。一個網際網路產品的生成一般經歷的過程是:產品經理、需求分析、研發部門開發、測試部門測試、運維部門部署釋出以及長期的執行維護。
2.運維的技術方向
產品的整個生命週期裡運維的職責重要而廣泛,但運維工程師們的職責不僅限於這部分工作,還需要總結工作中遇到的問題,抽取出相關的技術方向、研發相關的工具和平臺以支援/優化業務的發展並提高運維的效率,相關技術工作主要包括:
服務監控技術:包括監控平臺的研發、應用,服務監控準確性、實時性、全面性的保障
服務故障管理:包括服務的故障預案設計,預案的自動化執行,故障的總結並反饋到產品/系統的設計層面進行優化以提高產品的穩定性
服務容量管理:測量服務的容量,規劃服務的機房建設,擴容、遷移等工作
服務效能優化:從各個方向,包括網路優化、作業系統優化、應用優化、客戶端優化等,提高服務的效能和響應速度,改善使用者體驗
服務全域性流量排程:接入服務的流量,根據容量和服務狀態在各個機房間分配流量
服務任務排程:服務的各種定時/非定時任務的排程觸發及狀態監控
服務安全保障:包括服務的訪問安全、防攻擊、許可權控制等
資料傳輸技術:包括p2p等各類傳輸技術的研發應用,也遠距離大資料傳輸等問題的解決
服務自動釋出部署:部署平臺/工具的研發,及平臺/工具的使用,做到安全、高效的釋出服務
服務叢集管理:包括服務的伺服器管理、大規模叢集管理等
服務成本優化:儘可能降低服務執行使用的資源,降低服務執行成本
資料庫管理(DBA):通過設計、開發和管理高效能資料庫叢集,使資料庫服務更穩定、更高效、更易於管理。
平臺化的開發:類docker和google borg平臺的開發管理,及服務接入技術
分散式儲存平臺的開發優化:類google gfs等分散式儲存平臺的研發及服務接入等等,凡是關係到服務質量、效率、成本、安全等方面的工作,及涉及到的技術、元件、工具、平臺都在運維的技術範疇裡。做好每一個技術方向、完成相應的元件、工具、平臺研發都能對履行運維職責起到積極的作用,對業務的發展發揮關鍵影響。
3.技能和素質
運維以技術為基礎,通過技術保障產品提供更高質量的服務。運維工作的職責及在業務中的位置決定了運維工程師需要具備更加廣博的知識和深入的技術能力:
紮實的計算機基礎知識,包括計算機系統架構,作業系統,網路技術等;
通用應用方面需要了解作業系統、網路、安全,儲存,CDN,DB等,知道其相關原理;
程式設計能力,小到運維工具的開發大到大型運維繫統/平臺的開發都需要有良好的程式設計能力;
資料分析能力:能夠整理、分析系統執行的各項資料,從中發現問題及找到解決方向;
豐富的系統知識,包括系統工具、典型系統架構、常見的平臺選型等;
綜合利用工具和平臺的能力;
運維工作的複雜性對這個崗位的運維工程師們的軟素質也提出了要求:
時間管理能力,特別是碎片化時間的處理能力;
沉穩的心態,面對緊急情況時需要處變不驚;
溝通能力、團隊協作,運維工作跨部門、跨工種工作很多,需善於溝通、並且團隊協作能力要強;
工作中需膽大心細:膽大才能創新、不走尋常路,特別對於運維這種新的工種,更需創新才能促進發展;心細,運維工程師是最高線上許可權者,需要謹慎心細;
主動性、執行力,能夠主動學習國際國內的運維技術,並引入到工作中,提高運維的質量和效率;