1. 程式人生 > >運維人的故事:以新人角度思考運維,不斷反思與精進

運維人的故事:以新人角度思考運維,不斷反思與精進

從實習生到公司最年輕的部門副經理,高曉超一步步穩紮穩打——在他身上看不到領導的架子,卻意外地像新人一樣對誰都謙和有禮,而對於資料中心的運維工作,他有自己獨特的理解與詮釋。

2011年,即將畢業的高曉超抱著試一試的心情,撥通了國裕資料人力資源部的電話,一番熱情的陳述後,他獲得了一份面試的機會。和大多數故事的主人公一樣,他一路過關斬將,成為國裕資料中心空調助理工程師,這一干就是7年。“當時錯過了校招,非常懊惱,不知道為什麼,一心就想進國裕。”性格內向的他回憶道。

初到國裕,高曉超便被外派到北京現場實習,研究並跟蹤資料中心施工。科班出身的他,充分將所學與實踐相結合:每天都積極跑施工現場,不恥下問,慢慢積累。當時國裕資料中心處在籌備建設階段,他的這段經歷對資料中心的後期建設起到非常關鍵的作用。

結束現場實習後,高曉超又被指派學習資料中心裝置採購。通過與供應商的反覆溝通、無數次的查閱資料、數以千次的對比分析,他對資料中心基礎裝置的效能、效率以及優劣勢數如家珍,這也為日後的運維工作積累了豐富的經驗。資料中心驗收階段,他跟著經驗豐富的工程師們仔細核查,不放過任何細微的偏差,遇到問題積極反饋制定解決方案。

憑藉過硬的專業知識以及豐富的專案經驗,他迅速成長,晉升為空調主管工程師。2013年,為了培養複合型人才,公司任命他擔任電力主管工程師,主攻電力方向。為此,他經常加班加點,空閒時間就研究電力圖紙,加入很多專業論壇發帖討論,在公司內拜師學藝,晚上惡補專業知識。上天總是眷顧勤奮的人,2015年他成功競聘公司基礎運維部副經理一職,在同級別中他是最年輕的一個。

也是這一年的夏天,他經歷了被自己稱為最大的一次挑戰。因為上級變電所出現故障,不穩定供電長達半個月,這直接導致資料中心處於單路市電供電。高曉超為了應對這個棘手的難題,先後組織召開數十次會議,針對事件進行風險評估,與供應商爭取技術支援協議,安排運維全員處於警戒狀態。 “當時壓力真的很大,別說吃飯了,連覺也睡不著。”他說自己的精神每天都高度緊張,心裡反覆模擬一旦出現故障該如何應對。原來,在我們看來理所當然資料零中斷的背後,其實有很多人在負重前行。

“資料中心的運維工作周而復始,重複性高達70%-80%。小到下發口令,大到方案制定,任何疏忽都有可能導致嚴重的錯誤。能夠耐得住寂寞,能夠把責任落實到每一次的工作中,能夠把每一次重複當成新的挑戰去面對,以新人角度思考運維工作,不斷反思與精進,這可能就是做好運維工作的祕訣吧。” 談到工作,自嘲不會聊天的他像開啟話匣子一般。而他也透露了自己工作上的小目標:打造一支能夠及時發現和處理資料中心故障的專業運維隊伍;建立明確、規範的標準化管理流程;提高運維效率、降低綜合成本;保障資料中心業務的連續性。

本以為像他這樣技術出身,不善言辭的管理層會在實際工作中遇到很多問題,但意外的是他卻跟同事們打成一片,相處非常融洽。在被問到管理工作的祕訣時,他只回答兩個字:溝通。不僅工作上是顧全大局,紮實認真的領導,生活中的高曉超還有暖心的一面:得知同事家裡有困難,他二話不說,借給同事一萬元應急度過難關;也是同事隨口一問,他竟然手寫三千字的心得…

資料中心承載著眾多企業的業務應用和資料,是客戶的心臟,而良好的資料中心運維是心臟正常運作的基礎,幾乎所有的業務都要經由資料中心才能完成,這也讓資料中心的運維管理變得異常重要和困難。運維工程師有時是無所不能的上神,有時是分秒必爭的消防員,但更多時候他們是熬夜幹活的IT農民工,為了讓資料中心這個巨型建築正常運轉而辛勤搬磚。