1. 程式人生 > 其它 >阿里雲 ECS 系統崩潰恢復資料過程

阿里雲 ECS 系統崩潰恢復資料過程


故障介紹

系統:ubuntu

研發人員告知 ECS 無法 SSH 連線。登入到阿里雲後臺,通過 vnc 連線檢視,無論輸入任何命令都是:

# ls
Segmentation fault
# cd 
Segmentation fault
# reboot
Segmentation fault

隨即,嘗試軟重啟 ECS ,重啟後無法進入系統。這裡也有考慮到重啟後無法進入系統的情況,但是在無法進行任何命令操作的時候只能重啟操作,如下:


嘗試過 單使用者模式救援模式 都無法進入系統,報錯情況一致,於是只能找阿里雲技術尋求支援(這裡吐槽下,阿里雲工單是真的有點慢)。得到以下診斷結果:


然而,最終還是沒能救回來。ECS雲盤也沒有做過快照,更別提資料備份。雖然是測試機,但是研發跑了很多應用和資料。恢復還是很有必要的,阿里雲給出了其他方案,還是很不錯的。如下:


於是,準備按照阿里雲提供的恢復方案執行一下。

初始化操作:

  1. 您先對此伺服器的系統盤和資料盤建立快照進行備份。建立快照,請您參看文件:https://help.aliyun.com/document_detail/25455.html
  2. 重新初始化系統盤,恢復到最初始的狀態,然後正常啟動伺服器。重新初始化系統盤,請您參看文件:https://help.aliyun.com/document_detail/25449.html
  3. 如果是linux系統,重新初始化系統盤後,/etc/fstab檔案中的掛載資訊會被重置,您需要重新建立掛載點並掛載檔案系統。
  4. 您通過系統盤快照建立一個按量付費的雲盤,然後把該雲盤掛載到伺服器中作為資料盤,從資料盤中找回您所需資料。使用快照建立雲盤,請您參看文件:
    https://help.aliyun.com/document_detail/32317.html
  5. 掛載雲盤到伺服器上。請您參考文件 https://help.aliyun.com/document_detail/25446.html 進行。 說明:雲盤只能掛載到同一地域下同一可用區內的例項上,不能跨可用區掛載。


恢復過程


建立雲盤快照

https://help.aliyun.com/document_detail/25455.html


雲盤 建立 快照



初始化系統盤

https://help.aliyun.com/document_detail/25449.html


在初始化系統盤的時候,首先需要關閉 ECS ,然後在點選 重新初始化雲盤

切記:在進行初始化雲盤的時候,請確保雲盤快照已經完成!


重新初始化後,就可以直接 SSH 連線到 ECS 了。



快照建立雲盤

該步驟會產生費用。


通過 快照 建立雲盤


建立成功後,直接切換到 ECS 檢視磁碟。


直接就進行掛載,然後備份資料。

總結


馬爸爸說過:我不斷的提醒自己,要在陽光燦爛的日子修屋頂,不要等到下大雨去修。 共勉。


--- EOF ---