1. 程式人生 > >伺服器運維服務規範

伺服器運維服務規範

目標:保障運營伺服器7*24小時正常執行 
工作流程:   
1、通過nginxstatus頁面監視負載、web、圖片伺服器當前連線狀況. nagios監視每臺伺服器所有專案的指示燈..如果燈為紅色.表示相關伺服器出現故障需要立即處理.. 如果燈為黃色.表示相關伺服器出現異常需要儘快處理.如果燈為綠色.表示目前服務一切正常.   
2、通過CACTI 頁面 檢視相關伺服器CPU、記憶體、負載、使用者登入及網絡卡流量,如果任何一項的數值與上週同一時間的數值發生較大差異 就需要檢視系統日誌找出原因.   
3、建議每三個月修改所有伺服器使用者密碼.   
4、每月提交伺服器系統狀況表.如:記憶體使用率.硬碟使用率等.   
5、建議每三個月進行一次伺服器硬體檢查.   
6、安全更新.重大漏洞即時經過測試後更新,其它漏洞每1–3月更新一次.   
故障處理   
1、確認故障   
2、根據故障級別向主管通報   
3、向客服及相關部門通報併發布相關公告   
4、提出故障處理方案經主管批准後實施   
5、每次處理完故障後需要在記錄處理過程.格式如下:   
發現故障時間. 故障具體狀況   
處理過程 
總結故障原因及預防方法.   
災備   
1、建立災備方案   
2、定期檢查災備伺服器狀況保證其100%可用性.   
3、定期做災備演習以應付突發情況   
日常管理   
1、建立管理及使用文件.        
2、及時更新相關管理文件.   
3、堅持專機專用理念.   
4、及時的補丁更新及漏洞封堵措施