危機四伏,資料中心最好的進攻便是防守
從斷電到惡劣天氣再到網路犯罪,災難事故隨時都可能發生。然而,不管危機有多大,資料中心都必須一直保持高速運轉,為客戶提供穩定安全的資料中心服務。為確保在緊急情況下的正常執行時間,對於企業快速恢復生產力,一個深思熟慮的備災計劃是十分重要的。
雖然停電一直是資料中心一直關注的核心問題,但這個問題已經變得越來越普遍。根據最近 Uptime Institute的一份報告稱,這一趨勢歸因於混合IT的複雜性,這種複雜性正導致許多企業陷入困境。該調查還顯示,雖然一個普通的資料中心正在很好地利用其能源,但它更有可能遭遇斷電。與去年相比,斷電造成的後果也更大。
由於資料中心發現自己更容易受到停機威脅,因此有必要後退一步,評估當前的災難恢復程式。
要求備份
在大多數的資料中心環境裡,防止停機的第一步是使用可靠的不間斷電源系統(UPS),這通常與備用發電機一起使用。這些系統能夠有效幫助企業避免資料丟失和硬體損壞,在斷電事件發生時維持網路和其他應用程式正常執行。由於這些系統對業務的連續性是非常重要的,因此在評估部署所帶來的特性和功能時一定要小心。
組織使用UPSs時要考慮的主要因素之一是“彈性”。例如,在緊急情況下,需要多少電池備用時間來關閉系統或切換到備用發電機?冗餘是另一個因素。維護UPSs有助於確保備份電源始終可用,如果單個模組出現故障或需要離線服務的,冗餘UPS系統仍能提供足夠的電力。
在評估備災準備時,考慮如何將電力輸送到關鍵裝置也很重要。在某些情況下,資料中心可以直接將負載插入UPS。在其他情況下,可以部署具有多個輸出的功率分配單元(PDU)來分配電力,這在機架環境或位於資料中心內的網路裝置中特別有用。
正確的監控方式
操作一個沒有電源管理軟體的UPS就像是開車沒有儀表盤。UPS解決方案與監控和管理軟體相結合,是資料中心管理人員獲得加強可見性的完美補充。當今領先的電源管理軟體解決方案所提供的最大好處之一是能夠與通用虛擬化平臺整合。這些系統提供了在物理或虛擬環境中監視和管理電力裝置所需的工具,允許使用者遠端監視、管理和控制組織網路上的UPSs和其他裝置,從而幫助確保正常執行時間和資料完整性。UPS可以與系統管理程式一起工作,在裝置斷電或惡劣天氣事件期間自動啟動資料遷移到災難恢復站點。從回顧事件歷史和提供警報到提供實時狀態和自動化問題解決,這些工具可以用來幫助關鍵裝置執行。
一些解決方案還利用了預測性分析服務的進步,這可以幫助組織將電力監控策略從被動轉向主動。通過從連線的電力基礎設施裝置收集和分析資料,這些解決方案允許工作人員在關鍵電力元件發生故障之前預測它們。維修或更新可以安排在方便的時間,避免緊急服務呼叫,並利用方便的維修視窗。而且,隨著這些系統越來越先進,它們將使組織的整個電力基礎設施(包括UPSs、PDU和跨多個供應商和平臺的其他整合電力系統)得到更集中、更高效的管理。
檢查
一般來說,為了避免意外故障,我們的車輛需要定期進行預防性維護,包括定期換油和調優。這與確保UPSs和其他電源管理系統的持續最佳效能是一樣的
最近的一項研究發現,每年進行兩次預防性維護的客戶,其負載損失事件導致意外停機的可能性要低四倍。
常規服務檢查可以幫助我們在各種疾病變得嚴重和昂貴之前發現它們。一名受過培訓的技術人員可以帶領資料中心在電話中通過檢查、評估UPSs、測試電池以及檢查其他關鍵部件(如風扇、電容器和內部連線)。如果資料中心有發電機,定期對其進行測試也很重要,以確保在出現長期停機時,能持續地提供應急電源。
展望未來
在一天結束的時候,資料中心的電子系統會有很多問題。計劃外的停電會對運營造成毀滅性的影響,並耗費大量的資金。為優化電力系統並避免停機的危險,企業和他們的IT團隊都需要做好充分且良好的防禦準備。