伺服器運維服務規範
阿新 • • 發佈:2018-11-16
目標:保障運營伺服器7*24小時正常執行
工作流程:
1、通過nginxstatus頁面監視負載、web、圖片伺服器當前連線狀況. nagios監視每臺伺服器所有專案的指示燈..如果燈為紅色.表示相關伺服器出現故障需要立即處理.. 如果燈為黃色.表示相關伺服器出現異常需要儘快處理.如果燈為綠色.表示目前服務一切正常.
2、通過CACTI 頁面 檢視相關伺服器CPU、記憶體、負載、使用者登入及網絡卡流量,如果任何一項的數值與上週同一時間的數值發生較大差異 就需要檢視系統日誌找出原因.
3、建議每三個月修改所有伺服器使用者密碼.
4、每月提交伺服器系統狀況表.如:記憶體使用率.硬碟使用率等.
5、建議每三個月進行一次伺服器硬體檢查.
6、安全更新.重大漏洞即時經過測試後更新,其它漏洞每1–3月更新一次.
故障處理
1、確認故障
2、根據故障級別向主管通報
3、向客服及相關部門通報併發布相關公告
4、提出故障處理方案經主管批准後實施
5、每次處理完故障後需要在記錄處理過程.格式如下:
發現故障時間. 故障具體狀況
處理過程
總結故障原因及預防方法.
災備
1、建立災備方案
2、定期檢查災備伺服器狀況保證其100%可用性.
3、定期做災備演習以應付突發情況
日常管理
1、建立管理及使用文件.
2、及時更新相關管理文件.
3、堅持專機專用理念.
4、及時的補丁更新及漏洞封堵措施