1. 程式人生 > >關於軟體系統可靠性的幾個9問題

關於軟體系統可靠性的幾個9問題


實現高可用系統的成本,不論是99.99%還是99.999%,都包含了軟體成本,硬體成本,人力成本,還有培訓支出。當一個公司打算要做高可用系統之前,最好先權衡,構建高可用系統的成本,與系統業務中斷所帶來的損失,哪個付出更多。若不想付出太多的資金在構建高可用系統上,那麼就得分析你的系統,什麼時候會出現業務中斷,控制住業務中斷所帶來得損失,以及構建快速恢復的能力。
實際上,關乎每分鐘有百萬美刀的系統,也可以不用做5個9的高可用系統,只要能夠控制到有計劃地中斷業務(也可以說是中斷業務可控制),如在交易時候業務不中斷業務即可。
根據愛默生對41家資料中心的統計資料報告發現:非計劃的業務中斷是導致公司業績損失的主要因素”
。報告中還指出:“業務中斷後的故障定位,分析與解決,也需要耗費不少財力”

如果一個公司的業務承諾的可靠性是99.99%,那麼每年只允許業務中斷8.76小時。如果業務中斷導致的損失是每小時100萬,那麼一年的損失是876萬。
但是,如果這個公司承諾的可靠性是99.999%,那麼每年只允許業務中斷不超過1個小時,如果業務中斷導致的損失是每小時100萬,那麼一年的損失小於100萬。
我們可以算到,可靠性從99.99%提升到99.999%,可以挽回大概700萬的損失。那麼這種情況下是值得的。
但是如果你提升可靠性到99.999%上面的花費,超過了700萬,那保持99.99%的可靠性也是一種選擇。