1. 程式人生 > >Salesforce資料庫故障丟失5小時資料,僅僅是個案?

Salesforce資料庫故障丟失5小時資料,僅僅是個案?

前言:前兩天,Salesforce.com遭遇電力故障導致宕機,恢復時丟失4小時資料這則新聞的報道不知道你有沒有注意:16歲的Salesforce.com剛剛(2016年5月12日)犯了一個不小的錯誤,太平洋標準時間 (PST)週二早上6:30到週三下午14:30,遭遇了一次由於停電導致的大範圍宕機,此次宕機影響了北美的14個站點,影響了灣區的大量使用者——灣區歷來被稱為Salesforce.com的後院,同時,部分北美的使用者也受到影響。

那麼,它僅僅是一個個案嗎?

先來看看Salesforce是個什麼公司,雲端計算企業中的大佬,中國區的網頁是這樣介紹的:

Salesforce資料庫

您的所有銷售、服務和營銷資料盡在指尖,但是有將近5小時的資料蒸發了,不好意思哈!

Salesforce從1999年到現在,目前Salesforce的資料中心在美國東西海岸,日本,新加坡,都柏林。Salesforce 連續多年在IDC GATNER的評比上成為最具創新企業的第一名。據Celnet雨花石(Salesforce中國區合作伙伴)創始人裘思博(Fledman)介紹,“多租戶架構是Salesforce的基礎。Cloud database用的是Oracle的資料庫以及相關技術。在往上分為3個部分,force.com 平臺、heroku、wave。”

整個雲資料庫用的是Oracle,這個Oracle雲資料庫是怎麼丟的資料呢?

我們來看看國外媒體對salesforce的報道。Eweek.com 5月11日的文章說:

A Salesforce.com database is back up butnot at full capacity. The more than day-long issue left customers frustratedand 5 hours of data permanently lost.

面對眾多客戶的大量抱怨,CEO Benioff在twitter上道歉:

I am sorry for our service disruption onNA14; please email me [email protected] so we can call you.

Salesforce丟失近5個小時客戶資料之後並沒有更明確的賠償或補償,只是留了一個郵箱而已。

據說這次Salesforce發生客戶資料丟失主要因資料中心停電造成,在一個大型資料中心的一次大停電之後,Salesforce客戶有近5個小時的資料再也找不回來了:

“We have determined that data writtento the NA14 instance between 9:53 UTC and 14:53 UTC on May 10, 2016 could notbe restored.”

對於2015年全財年收入53.7億美元、日事務過13億的Salesforce來說,資料丟失的影響無疑是巨大的,客戶的資料啊。

據瞭解,造成資料丟失的原因是,宕機後工作人員希望將資料庫恢復到5小時以前的狀態,但不幸的是,這一操作導致了故障的發生,進而導致了資料丟失。但是,Salesforce.com的使用者們沒有簽署SLA,這也就意味著這樣的故障發生,salesforce將不會給予賠償。當然,這個不是要討論的重點。

對於使用Oracle資料庫的雲服務提供商來說,居然沒有容災,而是考慮用備份來恢復,而且還失敗,把資料都丟了,這是令我最為驚訝的地方。咱不用談Oracle公司提供的先進的Exadata、Oracle cloud machine、Zero data loss machine…..,就是傳統的解決方案也很多。

Salesforce資料庫

方案一:用Oracle GoldenGate(或者同類產品)

Salesforce資料庫

我們在全國許多銀行、交通、電信運營商已經成功實施、穩定執行5年以上了,最大的庫每日單庫日誌增量1T左右。做好的祕訣是做好變更管控,每個月做切換演練。我知道很多企業做了之後,維護不好,然後資料不一致,最終成為擺設的。

方案二:用Oracle Active Data Guard(11g以後的版本適用)

Salesforce資料庫

適用ADG的好處是,不太需要關心源端的變更,而且是物理級別的複製,而且可以適用延遲恢復。事實上,如果條件允許,我們建議最好的容災方案是ADG+OGG。

這些技術,對於現在的DBA或者說服務公司來說,都是小兒科了。重點的重點是流程,要投入資源保證災備的可用、可靠:

Salesforce資料庫

Salesforce資料庫

Salesforce的遭遇顯然不是個案,只因為她是雲服務商中亭亭玉立(17歲)的一位,知名度大,所以為眾人所知。君不見,微信群裡經常會出現某某公司又在做非常規恢復了的訊息。

文/楊志洪
文章來自/DBAplus社群微信公眾號