北亞針對服務器RAID5硬盤故障進行數據恢復案例

阿新 • • 發佈：2017-11-08

服務器 raid 數據恢復硬盤 raid5 linux

【基本信息】

服務器型號：IBM X3850服務器，

硬盤型號：73G SAS硬盤，

硬盤數量：5塊硬盤其中4塊組成一個RAID5，另一塊做為熱備盤(Hot-Spare)，

操作系統：linux redhat 5.3,應用系統為構架於oracle的一個oa。

【故障表現】

3號盤早已經離線，但熱備盤未自動激活rebuild（原因不明），之後2號盤離線，RAID崩潰。

oracle已經不再對本oa系統提供後續支持，用戶要求盡可能數據恢復+操作系統復原。

【初檢結論】

熱備盤完全無啟用，硬盤無明顯物理故障，無明顯同步表現。數據通常可恢復。

【恢復方案】

1、保護原環境，關閉服務器，確保在恢復過程中不再開啟服務器。

2、把故障硬盤編號排序，用以確保硬盤取出槽位後可以完全復原。

3、將故障硬盤掛載至只讀環境，對所有故障硬盤做完全鏡像(參考<如何對磁盤做完整的全盤鏡像備份>)。備份完成後交回原故障盤，之後的恢復操作直到數據確認無誤前不再涉及原故障盤。

4、對備份盤進行RAID結構分析，得到其原來的RAID級別，條帶規則，條帶大小，校驗方向，META區域等。

5、根據得到的RAID信息搭建一組虛擬的RAID5環境。

6、進行虛擬磁盤及文件系統解釋。

7、檢測虛擬結構是否正確，如不正確，重復4-7過程。

8、確定數據無誤後，按用戶要求回遷數據。如果仍然使用原盤，需確定已經完全對原盤做過備份後，重建RAID，再做回遷。回遷操作系統時，可以使用linux livecd或win pe(通常不支持)等進行，也可以在故障服務器上用另外硬盤安裝一個回遷用的操作系統，再進行扇區級別的回遷。

9、數據移交後，由我數據恢復中心延長保管數據3天，以避免可能忽略的紕漏。

【預估周期】

備份時間：2小時左右

解釋及導出數據時間：約4小時

回遷操作系統：約4小時。

【恢復費用】

略。。。

【過程詳解】

1、對原硬盤進行完整鏡像，鏡像後發現2號盤有10-20個壞扇區，其余磁盤均無壞道。

2、通過對結構的分析得到的最佳結構為0,1,2,3盤序，缺3號盤，塊大小512扇區，backward parity(Adaptec)，結構如下圖：

圖一：

技術分享

3、組好後數據驗證，200M以上的最新壓縮包解壓無報錯，確定結構正確。

4、直接按此結構生成虛擬RAID到一塊單硬盤上，打開文件系統無明顯報錯。

5、確定備份包安全的情況下，經客戶同意後，對原盤重建RAID，重建時已經用全新硬盤更換損壞的2號盤。將恢復好的單盤用USB方式接入故障服務器，再用linux SystemRescueCd啟動故障服務器，之後通過dd命令進行全盤回寫。

6、回寫後，啟動操作系統。

7、dd所有數據後，啟動操作系統，無法進入，報錯信息為：/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied，分析為此文件權限有問題。

8、用SystemRescueCd重啟後檢查，此文件時間、權限、大小均有明顯錯誤，顯然節點損壞。

9、重新分析重組數據中的根分區，定位出錯的/sbin/pidof，發現問題因2號盤壞道引起。

10、使用0，1，3這3塊盤，針對2號盤的損壞區域進行xor補齊。補齊後重新校驗文件系統，依然有錯誤，再次檢查inode表，發現2號盤損壞區域有部分節點表現為(圖中的55 55 55部分)：

圖二：

技術分享

11、很明顯，雖然節點中描述的uid還正常存在，但屬性，大小，以最初的分配塊全部是錯誤的。按照所有可能進行分析，確定無任何辦法找回此損壞節點。只能希望修復此節點，或復制一個相同的文件過來。對所有可能有錯的文件，均通過日誌確定原節點塊的節點信息，再做修正。

12、修正後重新dd根分區，執行fsck -fn /dev/sda5，進行檢測，依然有報錯，如下圖：

圖三：

技術分享

13、根據提示，在系統中發現有多個節點共用同樣的數據塊。按此提示進行底層分析，發現，因3號盤早掉線，幫存在節點信息的新舊交集。

14、按節點所屬的文件進行區別，清除錯誤節點後，再次執行fsck -fn /dev/sda5,依然有報錯信息，但已經很少。根據提示，發現這些節點多位於doc目錄下，不影響系統啟動，於是直接fsck -fy /dev/sda5強行修復。

15、修復後，重啟系統，成功進入桌面。啟動數據庫服務，啟動應用軟件，一切正常，無報錯。

到此，數據恢復及系統回遷工作完成。

本文出自 “SUN” 博客，請務必保留此出處http://sun510.blog.51cto.com/9640486/1979995

北亞針對服務器RAID5硬盤故障進行數據恢復案例

服務器 raid 數據恢復硬盤 raid5 linux【基本信息】服務器型號：IBM X3850服務器，硬盤型號：73G SAS硬盤，硬盤數量：5塊硬盤其中4塊組成一個RAID5，另一塊做為熱備盤(Hot-Spare)，操作系統：linux redhat 5.3,應用系統為構架於oracle的一

北亞針對服務器RAID5硬盤故障進行數據恢復案例

北亞針對服務器RAID5硬盤故障進行數據恢復案例

北亞數據恢復關於服務器存儲MDisk重建的數據恢復方法的研究

西數WD3200BEVT二次開盤數據恢復，筆記本硬盤嚴重進油數據恢復

20170714L08-00老男孩Linux運維實戰培訓-DELL R710新服務器多硬盤Raid5後容量大於2TB如何分區講解

服務器數據恢復案例 / raid5陣列多塊硬盤離線處理方法

服務器數據恢復方法之存儲raid硬盤離線數據恢復案例

raid數據恢復,Raid5磁盤陣列數據恢復案例,服務器數據恢復

DELLR720服務器更換硬盤，啟動系統報錯：there are offline or missing virtual drivers with preserved cache

服務器磁盤陣列數據恢復方法，raid數據恢復案例

raid5兩塊硬盤離線數據恢復案例

raid5磁盤陣列有3塊硬盤掉線的解決方案-raid數據恢復案例

清華同方怎麽恢復硬盤丟失的數據硬盤數據恢復

RAID 硬盤掛載找數據

Jmeter 監控服務器CPU，內存等數據

ssh整合思想 Spring與Hibernate的整合項目在服務器啟動則自動創建數據庫表

Linux服務器宕機、數據丟失如何進行數據恢復

Bootstrap Table 查詢（服務器端）、刷新數據

EMC CX4-480服務器數據恢復案例

服務器數據恢復案例之xfs數據丟失數據恢復方法

服務器數據恢復案例_xfs數據丟失的數據恢復過程

北亞針對服務器RAID5硬盤故障進行數據恢復案例

相關推薦