MongoDB dropDatabse 後,資料能恢復麼
最近好幾個社群使用者諮詢,錯誤的執行了 dropDatabse
把資料庫誤刪除了(或 dropCollection 誤刪集合),有什麼方法能恢復資料?本文主要介紹幾種可能有效的恢復方案。
方案1:通過備份集恢復
如果對 MongoDB 做了全量備份 + 增量備份,那麼可以通過備份集及來恢復資料。備份可以是多種形式,比如
- 通過 mongodump 等工具,對資料庫產生的邏輯備份
- 拷貝 dbpath 目錄產生的物理備份
- 檔案系統、卷管理等產生的快照等
從這裡其實也可以看出一個問題,就是「部署了多節點的複製集,為什麼還需要做資料備份?」;遇到誤刪資料庫這種問題,dropDatabase 命令也會同步到所有的備節點,導致所有節點的資料都被刪除。
方案2:通過 oplog 恢復
如果部署的是 MongoDB 複製集,這時還有一線希望,可以通過 oplog 來儘可能的恢復資料;MongoDB 複製集的每一條修改操作都會記錄一條 oplog,所以當資料庫被誤刪後,可以通過重放現有的oplog來「儘可能的恢復資料」。前不久遇到的一個使用者,運氣非常好,資料庫是最近才建立的,所有的操作都還保留在oplog裡,所以使用者通過oplog把所有誤刪的資料都找回了。
通過 oplog 恢復資料的流程非常簡單,只需要把oplog集合通過mongodump匯出,然後通過mongorestore 的 oplogReplay 模式重放一下。
Step1: 匯出 oplog 集合
mongodump -d local -c oplog.rs -d -o backupdir
Step2: 拷貝oplog集合的資料
mkdir new_backupdir
cp backupdir/local/oplog.rs.bson new_backupdir/oplog.bson
Step3: 重放oplog
mongorestore --oplogReplay new_backupdir
方案3:通過分析資料檔案恢復
MongoDB 以 bson 的格式儲存資料,所以只要 dropDatbase 或 dropCollection 後ß,對應的物理資料沒有從磁碟刪除,就有希望恢復,但從 MongoDB 引擎的特性看,能恢復的可能性較小。
引擎 | MMAPV1 | WIREDTIGER |
---|---|---|
dropDatabase | 資料檔案立即會被刪除 | 資料檔案立即會被刪除 |
dropCollection | 不會立即從磁碟刪除,空間會被複用 | 資料檔案立即會被刪除 |
從上表的描述可以看出,如果使用 mmapv1 儲存引擎,dropCollection 是不會立即刪除資料檔案的,這種情況下,可通過分析資料檔案李的bson文件來恢復資料;而其他場景的誤刪,資料檔案會立即從磁碟刪除,無法通過這種方法恢復。
總結
最後,強烈建議大家在使用 MonogDB 資料庫儲存重要資料時,一定要部署複製集,並做資料備份。通常2類使用者不做資料備份
- 沒愛過;使用 MongoDB 儲存不重要的資料,丟了也無所謂;(但即使是這樣,實際資料被誤刪時,使用者還是想盡可能的恢復資料,而不是丟了「無所謂」)
- 愛過,但傷得不夠深;使用 MongoDB 儲存了重要的資料,但從未出過問題,於是抱著僥倖心理不對資料進行備份。不要等待受傷了再做備份,有備無患。
之前做過一個 MongoDB 資料備份的技術分享,介紹了阿里雲 MongoDB 雲資料庫的備份恢復方案,能實現MongoDB複製集、MongoDB Sharding 恢復到任意時間點,有興趣的同學可以參考下,MongoDB秒級備份恢復(SDCC上海站資料庫核心技術與應用實戰峰會分享PPT)