1. 程式人生 > >完善的IaaS雲服務的個人理解

完善的IaaS雲服務的個人理解

此文已由作者王盼授權網易雲社群釋出。

歡迎訪問網易雲社群,瞭解更多網易技術產品運營經驗。

前情提要

本文僅討論雲主機(虛擬機器)、雲硬碟(塊儲存)、雲網絡(普通虛擬網路或SDN)相關的IaaS服務,相關論調僅代表個人意見,如有謬誤,敬請批評指正。

這篇文章在7月份就列好了大綱,但是一直拖拖拉拉到11月初,才憋出了幾百字。

網易雲IaaS平臺自2012年上半年立項,到如今已有接近5年的發展歷程,生產環境雲主機數量也從個位數擴充套件到當前的5位數,機房數量也從1個擴充套件到杭州3個,北京2個,並且還在迅速擴張。有一點我特別深有體會,那就是生產環境流行“屯雲主機”,線上資源長期處於秒殺狀態,每個季度採購的幾十臺計算節點,一個月左右基本就搶光,剩下兩個月就處於等待新節點上線,無法建立新雲主機的尷尬境地,所以很多有經驗的開發人員,會在季度採購節點上線後,迅速準確的提出擴容需求(當然可能是兩三個月之後的需求),建立一批雲主機備用,當然他們也是逼不得已,因為晚了就搶不到了。說了這麼多,不知道大家看明白了沒有,我只是想強調一點,我們的IaaS服務非常受歡迎(想吐槽的人請私下聯絡我即可,千萬不要在評論區留言)。

接下來就談一談我心目中的完善的IaaS服務是長什麼樣的,至於我們的IaaS服務做到了沒有,暫且不論,權當閒聊吧。

何為完善

  • 功能完善

  • 運維便利

  • 安全可靠

  • 效能優異

  • 體驗友好

  • 服務優質

  • 成本低廉

功能完善

作為一個IaaS服務提供商,尤其是做公有云(私有云需求相對簡單一些),必須要提供完善的IaaS功能,這點是最基本、最基礎的要求,如果功能都不完善,缺少一些重要功能,甚至API都不對使用者開放,怎麼能算是完善的IaaS服務?個人認為具備如下幾個方面的功能,才能算是功能完善:

普通使用者功能

  • 基本的主機、網路、儲存資源的生命週期管理功能(增刪改查、修改規格、快照備份、VNC等)

  • 資源彙總檢視

  • 操作日誌檢視(包含web和api操作)

  • 賬戶及子賬戶管理

  • 監控報警

  • 計費充值(消費清單、充值記錄、發票申請、退款處理等)

  • 映象豐富,規格齊全

  • 客戶支援(一般為工單系統)

  • API、SDK、CLI支援

  • 移動端管理

後臺管理員功能

  • 線上、離線遷移及常規生命週期管理

  • 平臺容量規劃預警

  • 欠費通知及處理

  • 叢集狀態監控

  • 異常狀態報警

  • 租戶配額管理

  • 使用者許可權控制

  • 管理員分級

  • 管理員操作審計

  • 各種資源的詳細資訊展示

功能完善的直觀體現是使用者不會因為功能不全而選用競品。

運維便利

IaaS雲平臺運維主要包含如下幾個方面:

  • 平臺初始化部署

  • 平臺擴縮容及容量估算

  • 平臺升級更新

  • 平臺故障恢復

  • 常見錯誤排查

便利的意思主要是指如下幾個方面:

  • 故障自恢復,不需要人為介入

  • 人員互動少,跨部門跨專案組互動少,最好一個人能搞定

  • 耗時短,自動化程度高,極低的人工參與度

  • 操作簡單,容易上手,不需要高深的知識技能和經驗積累(坑少且淺)

  • 常見簡單錯誤可以自助識別原因(無資源、無網路埠、無配額等)

運維便利的直觀體現是新招員工一週內可接手全部平臺運維工作。

安全可靠

  • 計算服務多層高可用保障(多資料中心,多級可用域)

  • 網路服務冗餘鏈路保障

  • 儲存多副本保障、租戶資料隔離

  • 管理服務無單點

  • SLA保證

  • QoS保證

  • 租戶網路隔離

  • 平臺、租戶防攻擊(平臺入口如web或API、網路、虛擬化核心等方面)

  • 機房基礎設施安全(多路供電、多網路出口、防人為失誤、防火防盜防高溫防鼠防蟲等)

  • 管理員許可權管控(防止誤操作和惡意操作)

  • 使用者及管理員操作記錄和審計

  • 物理基礎設施資源冗餘保障(機房、機櫃、電力、伺服器、交換機、硬碟、記憶體、網絡卡、網路頻寬等)

  • 計算節點宕機恢復速度快(支援雲主機宕機自動遷移恢復)

  • 其他節點宕機使用者無感知

安全可靠的直觀體現為全年使用者可感知故障時間和次數(總故障時間120分鐘以內或更少,總故障次數不超過3次)

效能優異

  • 計算(cpu、記憶體)效能達到或接近扣除虛擬化損耗的理論值

  • 網路(頻寬、時延)效能達到或接近扣除虛擬化損耗的理論值

  • 儲存(頻寬、時延)效能達到或接近扣除虛擬化損耗的理論值

  • 效能波動較少,與租戶數量、測試時間段等關係較小或無關

  • 不同租戶效能相互影響較小或無相互影響

  • 相同租戶不同雲主機的效能相互影響較小或無相互影響

效能優異直觀體現為與競品廠商相比,對比測試結果排名靠前(前三或更好),並與測試時間段無關

體驗友好

  • 完善的使用指導文件(目錄清晰、內容詳細、解釋清楚、更新及時、FAQ全面)

  • 優秀的web互動、UI設計(人性化、提示明確、傻瓜式,很多使用者是不看文件直接上手操作的)

  • 詳細生動的API文件(文件更新及時、目錄清晰、示例豐富、引數儘量少、內聚程度高、版本相容性好)

體驗友好的直觀體現為使用者使用過程中問題較少(使用者極少因為使用問題找售後支援)

服務優質

  • 使用者響應及時(按問題型別、使用者型別分類制定響應時限,類似服務等級策略)

  • 渠道豐富(工單、QQ、微信群、公眾號、電話等)

  • 售前交流深入充分(將平臺的相關侷限性與使用者充分溝通,可防止給使用者過高期望而導致滿意度降低)

服務優質的直觀體現為使用者滿意度很高(如果滿分5分,則需要達到90%以上4分甚至更高)

成本低廉

成本低廉的直觀體現是相同規格服務與競品價格對比優勢明顯,並且可保證我們平臺的盈利能力。


雲硬碟是網易雲提供多種硬體介質的塊儲存裝置,使用者可以根據實際生產環境,靈活選擇雲硬碟型別和規格大小,彈性地建立、刪除、掛載、解除安裝、擴容雲硬碟。


更多網易技術、產品、運營經驗分享請點選

相關文章:
【推薦】 棋牌遊戲大咖會:人工智慧與運營、安全方面的那些事
【推薦】 Android之高效率截圖
【推薦】 Question|網站被黑客掃描撞庫該怎麼應對防範?