1. 程式人生 > >我們恢復HP DL380服務器RAID丟失信息的案例

我們恢復HP DL380服務器RAID丟失信息的案例

數據恢復 服務器 raid 元器件 操作系統

【數據恢復故障描述】

客戶服務器屬於HP品牌DL380系列,存儲是由6塊73GB SAS硬盤組成的RAID5,操作系統是WINDOWS 2003 SERVER,主要作為企業部門內部的文件服務器來應用,主機(無UPS)故障前經歷過幾次意外斷電,重啟後RAID報錯,提示無法找到存儲設備,進入RAID管理模塊後操作死機,重啟後問題依舊,用戶聯系到我們公司並且把設備帶到我公司。

【數據恢復故障分析】

主機意外斷電導致RAID模塊損壞(包括RAID管理信息丟失和RAID模塊硬件損壞)的情況並不少見,一般來說,RAID創建完成後,其管理模塊的信息就不會再發生改變,但這部分信息畢竟屬於可修改信息,意外斷電很容易造成這部分信息被篡改甚至丟失,多次斷電甚至有可能導致RAID卡上的元器件損壞,從而使主機失去對多塊物理硬盤進行RAID管理的中間層模塊。該案例中對RAID模塊的操作死機現象極有可能是由RAID卡硬件損壞引起的(後經HP售後技術人員驗證得到證實),此時通過正常途徑已無法將獲取6塊硬盤中的數據,只能依靠第三方提供數據恢復服務來解決。

技術分享

【數據恢復過程】

1.首先針對用戶提供的6塊SAS硬盤進行嚴格的物理檢測,6塊硬盤讀取狀態均良好;

2.分別鏡像用戶故障RAID組中的6塊硬盤,為保證絕對的數據安全,目標存儲為帶有冗余功能的陣列存儲;

3.鏡像完成後,對所生成的6個備份文件進行RAID結構分析,依據文件系統存儲規則確定6塊硬盤在構建RAID5的盤序、數據塊大小及校驗方式,並於虛擬環境中重新構建RAID組;

4.對所構建RAID中的數據進行邏輯校驗,確保重構RAID所應用的各參數正確無誤後,針對用戶最為關註的數據進行完全驗證;

5.用戶確認數據恢復結果已完全達到預期(數據恢復至故障前狀態)後,將所有用戶業務數據遷移至用戶存儲,至此數據恢復完成

【服務器存儲安全建議】

1.盡量保證機房電源供應穩定,以減少電源異常對主機及存儲的沖擊;

2.最好為重要的服務器及存儲配置UPS,可在機房意外斷電的情況下保證核心業務系統能繼續維持一定時間的正常工作,從而為企業尋求應急解決方案贏得寶貴的時間;

3.對於服務年限已久的服務器應定期進行安全狀況檢查,並對其整體運行狀態進行評估以決定是否進行硬件及系統的全面升級,同時提前制定突發數據災難的緊急處理方案,以降低數據災難帶來的業務損失。


本文出自 “SUN” 博客,請務必保留此出處http://sun510.blog.51cto.com/9640486/1924108

我們恢復HP DL380服務器RAID丟失信息的案例