1. 程式人生 > 其它 >aws ec2啟動失敗,分離卷掛卷修復

aws ec2啟動失敗,分離卷掛卷修復

背景:

aws的ec2機器沒有正常啟動,檢查發現,機器服務不可達(就是啟動失敗)。例項作業系統日誌,我看到下面的日誌:
[DEPEND] Dependency failed for /data2.
[DEPEND] Dependency failed for Local File Systems.
...
這說明了例項在啟動的時候,找不到硬碟掛載點 /data2。


修復步驟:
1. 啟動一個暫時性的修復例項(ec2),例如 Amazon Linux t3.small 型別例項。
2. 將問題例項 i-0ccc330bac7xxxxxx 的根卷 vol-028736a366cxxxxxx 從例項上斷開,同時記錄跟裝置名稱,一般預設是/dev/sda1。斷開卷時,需要先將問題例項停機。
3. 將暫時性的修復例項關機,把上述根卷 vol-028736a366cxxxxxx掛載到修復例項上,然後啟動修復例項。
4. 登入 SSH 進暫時性的修復例項,以root使用者執行,通過下面命令掛載卷:
# lsblk

NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
nvme0n1 259:4 0 10G 0 disk
└─nvme0n1p1 259:5 0 10G 0 part /
nvme1n1 259:0 0 30G 0 disk
└─nvme1n1p1 259:1 0 30G 0 part /opt
nvme2n1 259:2 0 8G 0 disk
└─nvme2n1p1 259:3 0 8G 0 part

mount /dev/nvme2n1p1 /mnt

4. 檢查根卷的 fstab 掛載設定,並且註解 /data2 相關的掛載目標
# vim /mnt/etc/fstab

5. 存檔並解除安裝卷
# umount /mnt

6. 修復例項關機,再將卷由修復例項上斷開,重新連接回原本例項 i-0ccc330bac7xxxxx,連線為根卷裝置名稱 (/dev/sda1)

7. 嘗試開啟例項

其他命令:
# blkid

/dev/nvme1n1: UUID="2fb8601f-2b78-0a14-8c6a-3ba1fe6fbb4f" UUID_SUB="e9adc8b8-e13f-5e7f-4099-d8916ffe761c" LABEL="0" TYPE="linux_raid_member"
/dev/nvme2n1: UUID="2fb8601f-2b78-0a14-8c6a-3ba1fe6fbb4f" UUID_SUB="b867cdfc-cc33-1a17-5c3b-331052347e91
" LABEL="0" TYPE="linux_raid_member" /dev/nvme0n1p1: UUID="388a99ed-9486-4a46-aeb6-06eaf6c47675" TYPE="xfs" /dev/nvme3n1: UUID="2fb8601f-2b78-0a14-8c6a-3ba1fe6fbb4f" UUID_SUB="1b5a394d-8aba-b201-1cb5-604a63e181ae" LABEL="0" TYPE="linux_raid_member" /dev/nvme4n1: UUID="2fb8601f-2b78-0a14-8c6a-3ba1fe6fbb4f" UUID_SUB="72a5d55d-83cf-72fb-fc07-63b7239578a8" LABEL="0" TYPE="linux_raid_member" /dev/nvme5n1: UUID="3fc3349b-7ac2-49cc-8dc2-28e97d2bff2b" TYPE="ext4" /dev/nvme6n1: UUID="2fb8601f-2b78-0a14-8c6a-3ba1fe6fbb4f" UUID_SUB="614f1a08-c782-84e4-6875-21493a478480" LABEL="0" TYPE="linux_raid_member" /dev/md127: UUID="e9b02b68-dc6e-448d-801b-7318c153c4e6" TYPE="xfs" /dev/nvme0n1: PTTYPE="dos"

該命令可以看到所有的裝置掛載,與/mnt/etc/fstab上的UUID對照,這裡沒有的,就是失效的掛載,得刪除,否則就會和我一樣,機器啟動不了。

 

.