1. 程式人生 > >vSAN 6.6雙活新特性 和 vSAN雙活使用者的演講視訊

vSAN 6.6雙活新特性 和 vSAN雙活使用者的演講視訊

微信公眾號 VMware中國 在 2017-07-20 釋出了一篇好文:《為何選擇 HCI 以及為何要立即開始使用?》

隨後,有一位銷售同事(沒看錯,是銷售,厲害吧)做了言簡意賅的總結。基於他的總結,我做了一下擴充套件,選擇超融合架構時,需要關心的問題:

1、是不是開放式架構麼?硬體是否有更廣泛的相容性?使用者不願被硬體鎖定;

2、是否能輕易的過度到雙活架構?並具備成熟的備份、容災方案?

3、是不是能和軟體定義儲存的控制平面無縫整合,為私有云奠定儲存自動化的基礎;

4、是不是真正做到了計算、儲存和網路三個關鍵元件的融合?

基於vSAN的VMware Cloud Foundation(VCF)就能做到三者融合,使得使用者購買的vSAN成為未來就緒的超融合架構;

5、是不是更長遠的延展性,形成私有云乃至混合雲的基礎架構?

 不久後VMware和AWS基於VCF的方案將推出,使有狀態的業務負載在私有云和公有云之間線上漂移成為可能;

6、廠商是不是業內所認可的?技術是不是具有前瞻性?生態是不是成熟?這關係到資料能否長期、安全地存放;也關係到萬一出問題是否有足夠的專業人員來解決?

言歸正傳,下面介紹vSAN雙活(也即Virtual SAN Stretched Cluster)。自從vSAN雙活推出了,國內已經陸陸續續不少使用者使用了,甚至有些使用者在上面執行Oracle、ERP等關鍵應用。

下面的介紹分成三個部分:

1是青島農業大學客觀地介紹vSAN雙活,乃至整個VMware SDDC(還包含了NSX)的優劣;2是

vSAN 6.6雙活新特性;3是vSAN雙活的基本介紹,包含最小頻寬的計算公式;

一、青島農業大學 vSAN雙活案例視訊

這個儲存雙活的專案,其實VMware介入的比較晚,此前已經有儲存硬體雙活的方案推薦給使用者了。得益於當地的VMware同事的推薦,使用者從成本、管理等方面進行綜合考慮,最終選擇了儲存軟體雙活也即VMware vSAN延伸叢集。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

青島農業大學的老師在vForum 2016中國大會上親自演講:

二、vSAN 6.6雙活新特性

更多vSAN 6.6的其他特性,參見 微信公眾號 樂生活與愛IT 《vSAN 6.6十大特性的文件和視訊》

vSAN 6.6新增的23個特性中,最亮眼的幾個之一,一定包含雙活新特性。在此之前,大家知道,VMware只支援FTT=1,兩副本分別存放在資料中心的兩個不同站點。這樣確實有不方便的地方,舉個例子,A站點的H11出了故障,虛機就必須利用vSphere HA在B站點的H21上啟動。如果在A站點本地還有冗餘資料,就不用那麼費神了。vSAN 6.6在雙活上新的增強就解決了這個問題,不僅如此,還有更出色的表現。

在vSAN 6.6支援Failure Tolerance Method (縮寫為FTM) 配置:

混合陣列和全快閃記憶體陣列都支援的是:跨站點做RAID 1 , 每個站點內做RAID 1;

僅全快閃記憶體支援:跨站點做RAID 1 , 每個站點內做RAID 5或RAID 6;

跨站點的冗餘特性,對應的儲存策略是Primary Failures to Tolerate (縮寫為PFTT) ,它的值可以設定為1,或者為0。設定為1時,表示跨站點做映象;設定為0時,表示只在一個站點上有副本,其使用場景後面會介紹。

站點內的冗餘特性,對應的儲存策略是Secondary Failures to Tolerate(縮寫為SFTT),它的值可以設定為0到3。

0?wx_fmt=png

 1 - vSAN 6.6雙活 之 PFTT和SFTT  

0?wx_fmt=png

 2 - vSAN 6.6雙活 雙重資料保護

這樣,即使發生站點級故障時,剩餘站點仍具本地的資料冗餘,提高了可用性。以跨站點的RAID 1+本地的RAID 1,也即SFTT=1且PFTT=1為例,雖然一份資料共有4份副本,儲存利用率只有25%。但針對關鍵業務應用,犧牲一些儲存利用率,換取更高的可用性是非常值得的。而且,這個冗餘特性是可以在vmdk這個級別來設定的,也就是說,一個虛機裡,可以根據不同的業務特性,為不同的vmdk設定不同的冗餘度。有不少其他HCI產品,副本個數必須在整個叢集設定,就過於粗糙了,這樣它只適用於單一的業務場景。

前面提到,PFTT還可以設定為0時,表示只在一個站點上有副本。它的使用場景包括,例如開發測試資料可能不需要在兩個站點上都有副本;或者,已經使用應用冗餘(Exchange DAG、SQL AlwaysOn等)的解決方案。需要注意的是,Oracle RAC不太一樣,RAC使用的是共享儲存,如果要全部層級高可用則需要在儲存這一級做雙活,vSAN做為分散式的共享儲存,其雙活技術是可以支援Oracle RAC。白皮書《Oracle Real Application Clusters on VMware Virtual SAN - REFERENCE ARCHITECTURE》上有更多細節。

微軟Exchange DAG和SQL AlwaysOn,更像是伺服器+JBOD儲存,在虛擬化環境裡也即虛機+vmdk的方式,兩個JBOD儲存之間做映象。也就是說,在應用層,就實現了兩份副本,這樣就不需要儲存層來跨站點做兩份副本了。所以,針對這種場景,需將PFTT設定為0。SFTT設定為多少,看使用者希望在本地站點得到怎樣的冗餘度。

在vSAN雙活上部署DAG或AlwaysOn的時候,還需要注意Affinity的設定。有兩個不同層次的Affinity,計算資源池對應的是vSphere DRS Affinity,而儲存資源池對應的是由SPBM設定的,決定儲存元件存放位置的,與vSAN雙活特性相關的Affinity。

白皮書《Microsoft Exchange Server on VMware vSphere》,裡面清楚地提到,為了防止兩個DAG的虛機執行在同一個ESXi Host,也即防止單點故障,建議設定為DRS anti-affinity或者guest-to-host affinity。原文如下:

Allowing two nodes from the same DAG to run on the same ESXi host for an extended period is not recommended when using symmetrical mailbox database distribution. This condition will create a single-point-of-failure scenario if the two nodes have the only copies of one or more mailbox

databases. DRS anti-affinity or guest-to-host affinity rules should be used to mitigate the risk of running active and passive mailbox databases on the same ESXi host.

在vSAN 6.6雙活的配置過程中,是在配置SPBM,也即儲存策略時進行選擇的。Affinity可選擇的值有三個:None,Preferred Fault Domain(首選故障域),Secondary Fault Domain ,如下圖。

0?wx_fmt=png

 3 - vSAN site Affinity

其實,Preferred 和Secondary Fault Domain在vSAN 6.1(也即首次推出雙活技術的vSAN版本)時出現過。

0?wx_fmt=png

 4 - vSAN 雙活 首選故障域

設計的原則是,Exchange VM #1的DRS affinity 規則和vSAN雙活站點的affinity 規則設定成,讓虛機和儲存(也即vmdk物件)都在同一站點,如站點A上;Exchange VM #2的DRS affinity 規則和vSAN雙活站點的affinity 規則設定成,讓虛機和儲存(也即vmdk物件)都在另外的同一站點上,如站點B。這兩個虛機屬於一個DAG,兩個vmdk物件是同步的。

三、vSAN延伸叢集(Stretched Cluster)基礎知識

以下描述圍繞著vSAN 6.1版來展開。

在業界為數不多的儲存雙活方案中,VMware在原有成本較高的儲存硬體廠商提供的雙活方案之外,提供了具有高可靠、低成本、更細顆粒度、操作更簡單的軟體雙活方案– VSAN延伸叢集。

VSAN延伸叢集相當於一個VSAN叢集橫跨兩個不同的站點,每個站點是一個故障域。和其他儲存硬體的雙活方案類似,兩個資料站點之間的往返延時少於5毫秒(距離一般在100公里以內),另外還需要一個充當仲裁的見證(Witness)存放在不同於兩個資料站點之外的第三個站點上。Witness不一定是物理伺服器的 ESXi 主機上,也可以執行在第三個站點的虛機上,或者可以執行在公有云上,如國內的天翼混合雲,或者AWSAzure、阿里雲等。如下圖所示,Witness所在站點與資料站點之間的網路要求較為寬鬆,往返延時在200毫秒以內,頻寬超過100Mb/s即可。

0?wx_fmt=png

 -  VSAN 6.1支援軟體雙活,也即延伸叢集(Stretched  Cluster

    用X+Y+Z的形式表示延伸叢集的主機情況,XYZ分別代表ABC站點的主機數,A和B都是資料站點,C站點放置見證主機。當前情況下,vSAN延伸叢集可支援最小1+1+1個主機,最大15+15+1個主機。

而兩個資料中心站點之間的頻寬,在VMware網站和部落格裡建議的是10Gb/s,但實際上,只需要滿足業務需求即可,這個需求就是:

Bandwidth(B) >  Write bandwidth(Wb) * Data Multiplier(md)*Resynchronization Multiplier(mr)

其中,Data mutiplier指資料倍數,包含了VSAN傳輸及其他相關操作的元資料開銷。VMware建議設為1.4Resynchronization指重同步倍數,將可能的重同步的事件考慮在內。VMware建議規劃頻寬的時候,在最大頻寬基礎之上,額外預留25%,用於偶爾可能發生的重同步需求。也即,這個值建議為1.25。舉例來說:

假設VSAN上工作負載為每秒10000個寫操作,寫IO大小為4KB,這就意味著寫頻寬為40MB/s,或者320Mb/s。這樣網路頻寬要求為:

B = 40MB/s * 1.4 * 1.25 = 70MB/s 或者 560 Mb/s

VSAN延伸叢集結合vSphereReplicationVR)、SRM可以實現自動化更高、成本較低的兩地三中心的高階容災。同城之間,利用VSAN延伸叢集提供資料的同步複製,異地之間,利用VR提供資料的非同步複製。

0?wx_fmt=png

6 - VSAN延伸叢集結合VRSRM實現兩地三中心高階容災

VMware建議VSAN延伸叢集在二層上部署組播,這樣比較簡單。如果部署在三層,有NSXVMware的軟體定義網路)的支援,會如虎添翼,通過NSX實現跨站點的網路虛擬化,包括跨三層的二層網路延伸,全分散式閘道器,以及安全策略延伸,無需昂貴的私有的硬體交換機,即可實現L2 Extension,如OTVVPLSEVI等。

不過需要注意的是,VSANNSX本身是相互獨立的,沒有相互依賴的關係。

0?wx_fmt=png

 7 - VSAN延伸叢集結合NSX

---End---

0?wx_fmt=jpeg

640?wx_fmt=png

微信公眾號平臺"樂生活與愛IT"在目前階段,主要是分享軟體定義儲存(SDS),及VMware VSAN相關的文章,偶爾也會分享虛擬化、雲端計算、大資料,甚至生活類的好文章。歡迎投稿,特別是原創文章,我的QQ號:9269216

投稿一經採用併發布,獲得的讚賞收入,作者可獲得60%。投稿可微信私信我,或者通過QQ號 9269216聯絡我。

歡迎對SDS感興趣的朋友,加入軟體定義儲存討論 QQ群:122295009,可下載原創的一些文章,及其他有參考價值的文件。可直接搜尋群號,或者掃描如下二維碼:

640?wx_fmt=png

同時,歡迎您加入 "開放討論群-SDS&虛擬化" 微信群,並邀請其他對SDS和虛擬化感興趣的朋友加入此微信群。可以通過新增如下管理員之一的微訊號,建議新增管理員時,告知你的公司名和姓名,方便備註儲存。

sdg8848

libo9538

yangzhuan

dts0103

歡迎您通過掃描關注微信公眾號:“樂生活與愛IT”。

640?wx_fmt=png

關注後,可以通過點選左下角的文章目錄,通過輸入三位數(記住!是三位數,目前第一位是0或者1)詳細瞭解如何檢視歷史文章。

開啟 閱讀原文 ,是文章《vSAN 6.6十大特性的文件和視訊》