1. 程式人生 > >CTO 深度解讀 SMTX OS 3.5 產品特性

CTO 深度解讀 SMTX OS 3.5 產品特性

注:本文內容整理自 SmartX CTO 張凱在 SMTX OS 3.5 新品釋出會上的演講。

我們最近釋出了一個很重要的產品版本——SMTX OS 3.5,在這裡為大家做詳細的介紹。在此之前,先簡單介紹一下大家比較關注的超融合外部市場的情況以及 SmartX 的市場進展,這些市場進展都是我們做產品迭代及市場拓展的重要依據。

超融合對傳統 IT 架構的顛覆已成必然

如果說前幾年超融合還處於市場教育階段,那近兩年隨著客戶案例的增多,使用者對超融合的適用性和價值越來越明確,我們能明顯感覺到市場進入真正的爆發式增長階段。

無論是 Gartner 還是 IDC,都預測全球超融合市場將保持近 50% 複合增長率的迅猛勢頭,並在 2020 年達到近百億美金的市場規模。

當然,越來越多的廠商也看到了這個趨勢並進入超融合市場,讓競爭愈加激烈。這一必然趨勢的背景都源自於超融合架構在敏捷性、易用性、效能等相比傳統三層 IT 架構給使用者帶來的價值是質的提升。

SmartX 在彎道上穩步超車

SmartX 作為從 2013 開始就一直專注超融合的廠商,也受益於這個顛覆性的市場機會。到目前為止,我們除了擁有聯通沃雲這樣的中國最大超融合案例,也獲得了類似海爾、泰康人壽、國泰君安等金融、製造業的頭部客戶,這些客戶客戶原來在使用類似 EMC、VMware、Dell 等 IT 巨頭的產品,但是現在逐漸開始採用我們的超融合產品替代原有的架構,不僅應用在開發測試環境,還包括生產環境。實現這樣的成績不僅源自於我們在這個方向的專注,更因為超融合對傳統IT架構顛覆的必然性。

另一個值得一提的事情是,2018 Q1 IDC 的報告顯示,SmartX 在金融行業的超融合市場已經位居前三甲。金融行業是我們將進一步聚焦的行業方向,我們堅信在這個市場最能全面檢驗產品的可靠性與價值,也能獲得最具代表性的使用者反饋,同時我們 3.5 的一些重要的產品特性也源自於金融領域的實際市場需求。

關於 SMTX OS

首先介紹一下,SMTX OS 是我們軟體產品的商標,目前已經在中國以及海外的主要國家註冊。SMTX OS 當前是超融合架構的核心軟體,未來會是企業雲核心作業系統。雖然大家都在說大而全的企業雲的概念,但我們相信正如亞馬遜的成功起步於 “EC2”,做好計算、儲存的這些核心才是有效構建企業雲的第一步,目前我們的主要精力和資源都是在構建這個企業雲的 “EC2”。

圖一. SMTX OS 未來將成為超融合企業雲作業系統

為什麼釋出 SMTX OS 3.5

SMTX OS 之前已經經歷了 1.0、2.0、3.0 階段。1.0 和 2.0 是我們在 2017 年之前的版本,他們的亮點核心是在超融合下面的分散式塊儲存。中國最大的超融合案例聯通沃雲的核心就是來自於 2.0 的版本,應該說執行是非常穩定的,整個超融合包括分散式儲存預期的彈性可擴充套件、高效能、低延遲、易管理,都獲得了非常充分的體現。

到了 3.0 的版本,是在核心的分散式塊儲存的基礎上構建了完整的超融合產品,這裡面增強了很多產品化的內容,包括超融合在虛擬化層面的增強,包括像 VMware、Xenserver 更多虛擬化版本的支援,這些超融合先進的理念,都在此版本中得到實現。現在很多客戶,比如金融客戶、大型製造業客戶都是通過 3.0 的版本來切入的。

圖二. SMTX OS 版本演進

但客戶還是有一個問題,就是關於超融合架構是否能夠完全地替代現有的一些傳統 IT 的基礎設施的架構?無論傳統架構還是超融合架構,使用者在考慮 IT 基礎設施的時候需求是相同的,希望能夠簡化 IT 的複雜度,同時降低 TCO,提升整個 IT 基礎設施的敏捷度,以應對快速增長的網際網路時代的快速業務增長。這樣就能夠把更多的精力從原來的 IT 基礎設施的運維、管理等,轉移到專注於自己業務本身的創新以及發展。目前的超融合已經能較好地滿足以上大部分需求。不過對於一些核心應用場景,像核心的資料庫、生產系統,使用者希望能夠達到和傳統 IT 方案匹配的 RPO、RTO 和容災能力,但是同時還要保持超融合敏捷、易用等優勢。

我們想要做的或者產品目標就是幫助使用者把核心業務系統在超融合架構上更好地使用起來,並且獲得更好的體驗。這樣一方面可以享受到超融合本身帶來的包括簡化 IT、降低 TCO 的好處,同時也避免產生像傳統架構與超融合架構混合存在於 IT 基礎架構裡複雜的情況。

還要特別強調一下關於容災能力,我們從低到高不同的級別可以劃分成比如單個磁碟的故障容災、單節點容災、單故障、單個數據中心以及城域的故障。對於核心的應用系統來說,當然要求不僅僅提供單磁碟、單節點、單機架故障的容災能力,同時要提供站點級別以及城域級別的容災能力,這也是 3.5 裡面所要釋出功能的重點。接下來我會依次介紹一下 3.5 裡面所提供的一些比較重點的功能。

SMTX OS 3.5 五大特性解析

特性一:雙活叢集

首先介紹的重要點是雙活叢集,剛才我們提到了 IT 基礎設施需要不同的容災保護。雙活叢集實際上是 SMTX OS 3.5 裡為了應對站點級別的故障、同城站點故障所推出的功能。

我們看一下雙活叢集的部署模式。首先我們需要在一個城市中的兩個不同的資料中心裡分別部署 SMTX OS 叢集,同時這裡面要求兩個站點之間的 RTT 要小於 5 毫秒。同時我們需要在第三個站點裡面去部署仲裁節點,仲裁節點主要是用於解決當叢集的 IT 系統出現腦裂的時候做仲裁,決定哪個站點應該是唯一存在的站點。

在底層的資料上做到實時同步才叫所謂的雙活,這樣可以實現同城多個數據中心實現 RPO=0,秒級 RTO 級別的保證。當其中一個站點發生故障的時候,上面所執行的業務或所執行的 VM 會被自動通過我們系統所提供的 HA 功能,自動恢復到另外一個站點,這樣就能夠實現業務的連續性。

這裡強調一個很重要的點,也是釋出 3.5 一直貫通的主題,我們提供的雙活或雙活的功能不僅僅是指儲存層面的雙活。首先我們的雙活叢集是完全依賴於底層雙活儲存的功能,也就是說資料是在兩個不同的站點之間,而且實時能夠同步。更主要的是除了提供儲存層面的雙活之外,還對整個 IT 基礎設施提供了站點級別的保護。這個 IT 基礎設施包含的儲存、虛擬化、網路以及一些監控部署等等支撐的業務。也就是說我們在一個超融合的軟體架構裡面,提供了完整的 IT 基礎設施的雙活功能,或者說是站點級別的容災功能。

當我們的一個站點發生故障的時候,不僅僅是資料能夠保證 RPO=0,秒級 RTO 級別,VM 是可以漂移過去的。同時我們虛擬機器管理的功能、網路管理功能,以及容災、監控、報警等等所有的功能,都可以在另外一個站點自動去恢復。這個是我們認為超融合所帶來的巨大好處。傳統 IT 的部署方式,我們的虛擬化、儲存、網路,包括一些支撐的系統,可能每一個系統都來自於不同廠家,每個廠家的產品在部署的時候都需要有自己獨立的配置或者是雙活部署的要求。我們如果想要達到整個 IT 基礎設施的雙活或者站點容災的保護,就需要針對每一個產品去做獨立配置。同時因為產品和產品之間有一定的依賴性,所以我們想把 IT 基礎設施做成站點保護的時候是非常複雜的。而因為 SMTX O S是一個超融合的架構,裡面提供了所有的一站式的功能,你只需要在我們的介面裡面做簡單的雙活的配置,就可以實現 IT 基礎設施容災的保護,這個就實現了我們所強調的簡化提升核心系統在超融合上的使用體驗,大大降低了 IT 管理員平常的運維負荷度。

特性二:資料的備份與異地災備

上面是我們雙活叢集的介紹,接下來介紹資料的備份以及異地災備,剛才提到雙活實際上是指同城雙活,我們有一個嚴格要求是兩個站點之間的 RTT 必須要小於 5 毫秒。因為這個限制,所以導致雙活只能在同城之間做資料保護。有時候企業有更遠距離的異地災備的保護需求,這個時候我們通過在 3.5 裡提供的資料備份和異地災備的功能來滿足要求。

首先來看一下部署的模式,在部署的時候我們可以在不同的城市,比如在 A 城市和 B 城市分別部署 A 站點和 B 站點,把我們現在 VMware 所執行的 A 站點稱為保護站點,把 B 站點稱為備份站點。如果我們想要對 A 站點的業務或虛擬化做保護的話,只需要在管理介面上通過建立保護計劃來選擇需要保護的物件。我們需要保護的物件,可以保護一個或一組保護物件。保護物件也有兩種不同的型別,包括使用者的虛擬化,就是 VM,我們以 VM 為例對業務做保護,也可以選擇獨立的虛擬卷做保護。

當我們在建立保護計劃的時候,選擇完保護物件就可以選擇備份的時間、備份的間隔,比如最低可以提供 1 小時的備份間隔,比如說可以選擇 B 站點作為備份的目標站點,這樣就完成了保護計劃的建立。當建立完保護計劃以後,SMTX OS 的系統就會定期在保護站點裡面對 VM,或者對選擇的保護物件做快照。當快照結束以後,會把變更的資料通過增量以及壓縮的方式傳輸到備份站點。

假設當我們的站點 A 發生故障的時候,使用者可以選擇在站點 B 通過介面的操作把 VM 恢復,這樣就可以保證業務的連續性。因為我們備份的間隔目前是一小時,所以能夠達到小時級別的 RPO,同時 RTO 整體來說是在分鐘級別。

除了我們可以把資料備份出去以外,還可以支援當 A 站點恢復的時候,我們可以把資料從 B 站點再拉回或同步回到 A 站點,因為 B 站點可能是災備站點,資源是有限的。當 A 站點恢復的時候,自然希望把資料還是執行在 A 站點,我們只是需要在介面上操作把資料同步回來,這個業務就遷移到 A 站點的保護站點。

更進一步的是我們不僅僅支援從 A 站點到 B 站點的備份,也可以支援到 B 站點到 A 站點的備份,也就是說我們的備份是雙向的。除此之外可以多站點多對多的備份,一個 A 站點可以同時備份到 B 站點和 C 站點,以提供更高級別的容災保護能力。

在我們所提供的資料備份和異地災備功能裡面,我們保護的內容不僅僅是資料,而是以業務為出發點去考慮業務的延續性。當我們被保護的物件比如 VM 本身發生一些配置變更的時候,這個配置的變更也會自動被同步到備份站點。

我們舉個例子,假設在 A 站點使用 VM 時,一開始建立保護計劃時只有兩個虛擬卷。隨著我們不斷使用和業務的擴充套件,我們希望再增加一個虛擬卷,也就是三個虛擬卷,同時上面運行了一些業務。這個時候在下一次做資料同步和備份過程中,除了把新增的虛擬卷裡面的內容同步到備份站點以外,同時還會把虛擬機器增加一個虛擬的操作變更同步到遠端站點,當遠端站點啟動虛擬機器構時候同時載入三個虛擬盤,這樣避免了有些資料執行在新增的資料盤上,可能啟動的時候會有一些問題,這也是最大化保證業務的延續性,也就是從業務的角度出發進行資料的保護。

這個是我們提供的 SMTX OS 3.5 跨城市資料保護和容災功能。這兩個功能從目前所看到的情況,都是隻有很少的超融合廠商才能夠具備,而且是完全不同於傳統儲存廠商角度做的保護,我們是從整個 IT 基礎設施的角度做的資料保護。

特性三:虛擬機器管理

接下來我們來介紹一下虛擬化,超融合裡面三個最主要的模組:計算、儲存、網路,計算指的就是虛擬化。大家如果之前瞭解過我們的話,我們在虛擬化的平臺支援上還是很豐富的,包括 VMware、Xenserver 的平臺以及內嵌的 KVM 的平臺,都可以提供很好的超融合的部署和支援。這裡更強調自身提供的基於 KVM 的內嵌的虛擬化平臺,這是高度定製化的,而且做了很多深度優化和整合的平臺,提供了我們認為最佳的易用性以及最好的使用者體驗。

在 3.5 的版本里面也對內部的虛擬化功能做了很大的增強,我簡單地通過四點來介紹。

首先是放置組的功能。當叢集規模比較大,尤其是當用戶使用核心業務的時候,比如說像 Oracle RAC 場景,其實要求每一個虛擬機器或業務所執行的節點有特殊限制,比如說 Oracle RAC 兩個 VM 希望執行在不同的物理節點上,或者有些特殊的要求是執行在相同的物理節點上。針對這種需求,我們提供了放置組的功能,根據使用者提供的放置策略幫助你選擇 VM 到底執行在哪個節點上。

這個結合了我們下面提供的自動化排程功能,自動化排程是說當我建立 VM 的時候,其實使用者不需要手動去選擇或指定執行在哪個節點,系統會根據兩個條件來自動選擇。第一個條件是使用者所定義的放置組的功能,看你到底屬於哪一個放置組策略,看怎麼定義你的放置規則。同時結合當前叢集內部每一個節點的壓力,包括 CPU 的壓力、記憶體的壓力等等,我來選擇一個負載儘可能低的節點去運載當前的業務。

第三個功能是 VM HA 的功能,作為虛擬化管理平臺 VM HA 是很基礎的功能。我們在之前的 3.0 版本里面,提供了可靠性的保證是在剛發生故障切換的時候,保證 5 分鐘之類一定可以把虛擬化業務自動 HA 到另外一個可執行的節點上。在 3.5 版本里面做了進一步提升,把 5 分鐘限制降低到 3 分鐘,也就是說你的業務當發生故障的時候,最多有 3 分鐘故障的切換時間,整個速度上我們提升了 40%。

第四,同時我們也提供了基於虛擬化批量的建立,以及批量遷移的操作,這也是進一步在使用者體驗上的提升。

特性四:塊儲存服務

塊儲存服務,在 3.5 之前塊儲存服務只服務於超融合內部的虛擬化服務,比如說在上面建一個虛擬機器,虛擬機器是可以直接使用到超融合架構底層的池化儲存能力。但其實我們在跟客戶溝通交流的時候遇到一個問題,客戶實際的生產環境中執行的應用系統的環境要求是複雜多樣的。比如有些系統必須是執行在物理機上,有些系統希望執行在容器裡面,比如 K8S、Docker 裡面,這都是有可能的。有些是執行在虛擬化環境裡面,有些是執行在超融合裡面。我們有沒有可能把客戶多種多樣不同的需求,尤其是對儲存的需求能夠統一管理和整合起來。

我們在 3.5 裡面為了滿足客戶的需求,我們就提供了塊儲存的服務,顧名思義把 SMTX OS 本身所提供的塊儲存的能力,通過 iSCSI 標準介面對外輸出。這樣對於外面是不管是物理機、容器、K8S 或其他的應用環境,只需要通過標準的 iSCSI 協議,就可以訪問到我們超融合叢集裡面儲存的能力,這就是塊儲存服務。

塊儲存帶來了什麼的好處呢?首先我們可以看到最明顯的,因為 SMTX OS 本身的塊儲存功能非常強大,包含的資料保護的功能,剛才提到了本身包含了單磁碟、單節點、單機架的保護功能,以及 3.5 推出了雙活功能,以及跨地域容災保護功能。這些功能都可以繼續被複用,只要採用了超融合的塊儲存服務,也可以享受這些的儲存功能。同時 SmartX 分散式塊儲存裡面像穩定、簡單、可靠、有彈性、易擴充套件,這些功能也都是包含在本身的塊儲存服務裡面。

圖三/四. 一個 OS 整合穩態與敏態業務

特性五:全新介面設計與運維功能增強

圖五. SMTX OS 3.5 軟體介面

此外,我們來介紹一下關於 3.5 版本里面全新設計的介面,以及比較強大易用的運維管理功能。首先是增加了多叢集管理很重要的功能,我們現在很多客戶其實在使用 SMTX OS 產品的時候,已經是多個叢集,最多的客戶可能有很多叢集需要同時管理。當他需要管理多個叢集的時候,我們在 3.5 裡面就提供了多叢集管理,就是在一個介面可以同時管理 SMTX OS 所有的叢集。

同時我們在提供了一個更高階的監控分析以及報警的功能,在這個版本里面提供了超過 200 個計算、儲存、網路以及相關的指標監控和統計,以及變化的趨勢。同時提供了 TopK 的分析,可以快速找到哪些虛擬機器或資料卷是被訪問頻繁的,哪些是熱點虛擬化,我們根據統計來做一些規劃或者部署。我們還提供了監控面板的自定義,使用者可以自定義希望看到的監控面板和報警屬性,比如說報警可以根據哪些條件去做。

還有包括硬體資產的報表匯出,這是很實用的功能,很多客戶會遇到資產統計的問題。此外,還可以智慧識別節點佈局和硬體磁碟的位置,還支援第三方服務拓撲的視覺化。

模組化授權模式與更廣泛硬體適配

以上是我們關於 3.5 新功能、新產品最重要內容的介紹,下面介紹的是關於 License 這一方面,大家如果熟悉其他的產品,像一般 IT 產品提供 License 的時候不是那麼靈活,比如基礎版、增強版、加強版等等,每一個不同的版本里麵包含的是一組功能。當你想要高階功能的時候不能只為一個功能付費,要為一組功能付費,可能有一些功能不是你需要的。我們根據客戶的需求,提供了更加靈活的 License 授權的方式,也就是我們的整體 License 是授權到企業版,企業版包含了 3.5 裡面所有的基礎功能,包括本身的虛擬化、網路、儲存等等功能,高階功能包括雙活、異地災備,通過獨立的 License 的方式去進行授權。比如客戶只需要雙活的保護,你只需要對雙活一個功能付費就可以了。如果只需要異地災備的功能,只需要購買異地災備的 License,而不需要打包強制賣給你一些你並不需要的功能,這個是根據使用者的需求來定製的很靈活的 License 的模式。

圖六. 靈活的 license 模式與最新硬體平臺的廣泛適配

同時我們在這個版本里做了硬體相容性的適配,包含了主流的硬體廠商型號,包括像聯想、浪潮、戴爾、超威、華為以及惠普的一些最主流的機型支援。從硬體磁碟的角度來講,SSD 上支援了英特爾、三星、東芝,最主流的 SSD 型號都可以支援。

3.5 版本總結

對於我們 3.5 來做一個總結,我們首先從幾個角度對業務功能做了加強,包含了虛擬化、運維和 Web 介面都是做了很好的加強,同時也推出了一些新的功能,包括塊儲存、雙活、異地容災功能。

在這裡還是要再強調一下,我們之所以能夠推出這些功能,一方面是因為提供了超融合的架構,能夠提供最好的使用者體驗,幫助使用者把他核心的生產系統儘可能遷移到超融合架構裡面;同時因為我們有自己的產品研發團隊,才能夠在這麼短的時間裡面把這些功能,把很重要、很難開發的功能快速推出來,這就是我們認為和其他的超融合廠商很大的區別。

圖七. SMTX OS 3.5 極大拓展價值邊界

當我們釋出了 3.5 以後,其實我們的產品價值邊界就得到了極大的擴充套件。我們認為目前 SMTX OS 3.5 的產品,實際上是極具全球競爭力的超融合產品。我們支援了虛擬化場景到裸金屬場景,包括穩態、敏態、單資料中心、多資料中心、容災的要求以及簡單易用的要求等等。

SMTX OS 的未來規劃

以上是我們對 3.5 產品的介紹,實際上到現在為止我們已經有一些客戶在使用 3.5 版本的產品。我們目前的研發團隊,已經開始去對未來的版本,包括對 4.0 版本以及 4.0 之後的版本去做更進一步的新功能的開發和設計。開發和設計的目標,也還是圍繞著剛才提到的讓使用者的核心應用系統更好地在超融合裡面得到更好的體驗,這就是我們的產品始終不變的目標。

圖八. SMTX OS 未來發展

可以看一下上圖,我們目前的產品發展思路是這樣的,首先底層提供了四個最核心的基石的模組,其中上面是塊儲存功能,下面是虛擬化功能,左邊是零運維管理(非常強大的自動運維管理功能),以及資料保護和容災功能。有這四個基礎的功能以後,實際上可以覆蓋的場景就包含了像伺服器虛擬化、塊儲存,服務像 VDI、ROBO、核心業務場景的應用,這些場景我們就可以得到覆蓋了。對於一些更高階產品的使用者的需求,其實後面還會發展到包括備份生態的整合,我們會開放一些儲存訪問和備份的介面,我們支援向第三方被廠家能夠和 SMTX OS 產品做整合,由他們去備份我們超融合裡面的資料。同時也會提供一些像二級儲存的應用。

其次有一些更核心的應用場景,像核心的資料戶應用場景對效能的需求是非常高的,也包括了現在全閃的趨勢也是越來越明顯,所以我們會進一步在全閃和提供全閃場景下 SLA 的保證。以及根據企業雲的發展思路,會提供許可權管理包括多租戶、自服務等等高階功能,幫助一個大型企業的IT基礎設施去做很好的運維和管理。

最後我們還會進一步去拓展整個的生態,包括對 K8S 容器的支援,包括提供應用中心,我們也支援第三方廠家能夠把他的一些應用內嵌到超融合架構產品裡面來。通過我們互相的合作,能夠給使用者帶來最完美的超融合體驗。