1. 程式人生 > >王李明:“一步上雲:FlexHCS定義新型資料中心” – 運維派

王李明:“一步上雲:FlexHCS定義新型資料中心” – 運維派

由工業和資訊化部指導,中國資訊通訊研究院主辦,業界知名組織雲端計算開源產業聯盟(OSCAR)承辦的2017全球雲端計算開源大會於4月19日-20日在北京國家會議中心順利召開。本文為本屆大會嘉賓分享的PPT內容,敬請瀏覽。

嘉賓介紹:王李明

公司職務:賽特斯資訊科技股份有限公司雲基礎平臺產品線研發部高階架構師

大會演講速記

各位領導、各位來賓,大家下午好。我是來自賽特斯資訊科技的王李明,我今天跟大家分享的題目是“一步上雲:FlexHCS定義新型資料中心”。

資料中心

大家看到這個題目可能會有幾個疑問,第一個問題大家會問FlexHCS是什麼東西?以及什麼是一步上雲?我們FlexHCS是怎麼定義新型資料中心的?這幾個問題我今天可能會主要跟大家來討論這三個主要問題。

第一個問題我說一下我們的公司背景,賽特斯原來是做網路的,剛開始的時候有智慧城市、網路監控軟體層面的網路產品。

在2010年的時候公司開始轉型做SDN+Openstack方面,轉型到SDN+Openstack有很大的優勢,而且這也是一個趨勢。

在2010年轉型SDN以後,大概是在2012年的時候,因為我們發現SDN其實跟雲也可以很好的結合起來,我們公司就開始把我們SDN產品跟雲去進行結合,也就是我們引入了SDN的產品形態。FlexHCS這個發展比較迅猛,我們公司又開始做跟FlexHCS相關的東西。我們公司曾經研發出世界上第一個運營商級別,大家可以到我們官網看一下,我們是世界第一家作出的產品。

我今天跟大家更多討論的是我們的FlexHCS,我們公司是做SDN的私有云產品,私有云產品大家的感覺應該是可能需要很多的網路裝置、很多伺服器才擁有一個自己的私有云產品。

一般對於中小型企業他可能也根本就沒有這麼多的資源,但是他又想用到這些雲的一些很好的功能。我們公司把我們原來的雲平臺縮減到一臺X86的伺服器上,也就是我們的FlexHCS,也就是我們的超融合產品。我們的FlexHCS可以講就是我們公司自己獨立研發的一個超融合產品。

說到超融合,在座應該很多人都聽過這個概念,因為超融合這兩年非常的火,有很多廠家也在做。現在講一下什麼是超融合?以及我們為什麼要用超融合。我們為什麼需要超融合,這是我們公司為什麼從原來的做很大的運營商私有云以及很大的IDC的私有云,為什麼後面需要做超融合的雲平臺。

從我這個PPT裡面可以看出來,經過不同的時代,我們這個裝置會有不同的演進形態。比如說我們在大機時代,這個我們也不再多說了,因為大機時代可能現在用的廠家也不會很多。

當然不能說它沒有,它還確實有存在的。更多現在可能是大家用的是獨立伺服器以及這種計算虛擬化這種形態所用的廠家一般是用比較多的。這兩種形態其實都有它的優點也有它的缺點,比如說獨立伺服器的形態,更多企業買到這個伺服器以後通過網路把這些伺服器之間相互打通,他就可以靈活的去進行各種管理配置。

但是這種獨立伺服器也會有它的很多缺點,比如說我們很多企業買了這種伺服器以後,他會發現他在伺服器上面我去裝了幾個自己開發的應用。如果這個應用業務量很高的時候,可能還好一些,它的CPU、記憶體利用率還是可以的。如果它的業務量達不到的時候,你會發現這個伺服器上面經常CPU、記憶體都處於很低的狀態,而且長時間處於這樣的狀態,這對企業就是一種資源的浪費。

這樣的話有的時候我們的應用可能還不能鋪在一臺伺服器上,這時候他為了能夠部署更多的應用,他還要去買更多的伺服器。所以有些伺服器他裡面資源沒有用完,你又要去買新的伺服器,說白了這更是一種浪費。

這時候可能虛擬化就提出來了,更多的代表像VM他做了計算虛擬化。他可以實現我們一臺物理機上面虛擬出很多虛擬機器,這個大家也都比較清楚了。這種虛擬機器相當於可以從一臺物理機上面可以衍生出很多獨立的物理機,裡面各種架構和物理機都是相似的。

這種形態存在之後,也會有一些問題。我們雖然有一種虛擬機器存在了,但是我的虛擬機器裡面的資料要儲存在哪個地方,還是要儲存在儲存裡面。我們的儲存要儲存在哪個地方?簡單來講就儲存物理機上面,物理機儲存不是無限的,可能要買磁陣。計算和儲存是分離的,我的計算可以在物理機上跑,還要專門買額外的儲存裝置。這時候的儲存裝置需要更好的管理系統。

這時候我們能不能把這個計算和儲存合在一起呢?後面到了這時候我們提出了計算與儲存融合,也就是我們現在說的超融合。

我們現在公司做的不僅可以做到計算與儲存融合,還可以把計算、儲存、網路三個融合在一起,甚至你可以兩兩融合在一起。比如你把計算和儲存融合或者是計算跟網路融合都可以。這是我們大概分析了一下我們為什麼提出超融合這個原因。

超融合

下面還有市場對超融合產品的一些關注點。排在首先就是成本,因為像剛才我們分析了說如果你單買伺服器不用超融合的時候,這個成本和我們現在的超融合的成本是有很大的差距。所以第一考慮就是成本,你用了超融合,也就是說企業更多的考慮我用了超融合,我的成本節約多少。我們做這個產品的時候,首先也是把這個排在重點,我們能為企業節約多少成本。

第二不僅需要節約成本,還要提供高可用性。我們上了超融合產品以後,我們的應用不可能說經常沒事就會掛掉,這是使用者也不能接受的。因為你這個成本再低,服務不可用,也是不能當做一個產品來賣。

第三我們考慮的是效能以及擴容。超融合有一個好處是什麼意思?相對重型企業才開始的時候他的伺服器不是很多,後面隨著他的業務量慢慢增加,他會發現他需要買更多的機器。他這個雲平臺虛擬的資料中心需要加進來,和我們原來已經存的伺服器能夠對接起來,把自己的搭建的超融合裡面的節點能夠很容易的橫向擴充套件。所以這個橫向擴充套件,也是我們要考慮的一個方面。

最後可能還有資料備份,因為儲存安全是大家都比較關心的。

其他的幾個我們大概就不列舉了,主要我們可以看出來這裡面使用者更多關注是成本以及可靠性以及靈活性。

驅動因素

超融合現在有這麼多廠家做它,以及為什麼這個時候我們能把它做出來。其實也是有一定的原因的,因為現在硬體資源以及網路它的速度以及硬體的效能已經可以達到我們可以用一臺X86伺服器可以把網路儲存全部在臺伺服器上去實現。

早些年這個概念能提出來,他也實現不了。因為早些年一臺這種X86伺服器上面可能它的效能以及我們外面的網路的速率,他也根本不可能允許我們在一臺伺服器上能把這個計算、網路、儲存全部實現掉。現在硬體和網速上面都能滿足我們,我們現在的超融合也是可以去把它給做出來的。

還有虛擬化和雲端計算,因為雲端計算也經過這幾年的發展,他也已經相當於是可以到了一個商務階段,也有很多廠家開始在上雲端計算的東西。所以雲端計算這個技術的成熟也標示著我們可以把超融合的產品能做出來。

定義

這是我們超融合裡面一些定義,超融合大概需要哪些東西。

第一我們是天然耦合,什麼意思?我們可以把這個計算、網路、儲存它們幾個全部合在一臺物理機上面。我舉個比較形象的例子,公司可能原來你還要去買一個很貴的儲存裝置,你還要去再買一個很貴的網路裝置,你還要去再買一個很貴的伺服器裝置,這樣才把網路、計算、儲存全部給聚齊,你才去部署你的應用。

但是我們現在如果用了我們的超融合,我們可以不用這麼費事,可以買了一臺X86伺服器,當然網路的資源你還要是買,但是不會像你原來那樣買一個很貴的交換機或者是很貴的路由器,你可能只需要一個成本很低的交換機就可以實現你們企業想要的私有云出來。這個X86裡面會聚集計算、網路、儲存。像我剛才講的它可以兩兩以上組合。

還有NoSAN,你原來還去買很貴的儲存裝置,現在就不需要了,如果用到超融合產品,你的儲存裝置就徹底不要買了。你的網路裝置可能還要去買,但是如果你超融合之後,儲存裝置就徹底不用買了。因為我們在X86上面裝了我們的儲存軟體以後,我們可以給你提供類似SAN裝置的儲存系統。

還有軟硬結合,這個好處相當於原來我們廠商直接賣給你一個X86伺服器,上面不會有軟體,你自己裝作業系統,自己裝一些應用。如果用了我們的超融合,可以一體機的形式交付給你。

你如果想要一個超融合的產品,我可以把我的一體機擡到你那邊去,這裡已經裝好我們現成的超融合軟體,可以在裡面包含我們說的計算、儲存、網路元件,你把伺服器開啟,在瀏覽器上簡單配置一下,這樣一個X86伺服器立刻變成一個虛擬交換機,就變成了一個虛擬的儲存裝置,就變成了虛擬機器的管理器,你就可以把它當成一個我們說的SAN裝置掛給其他伺服器去用,可以把它當成一個我們起虛擬機器的一個管理系統,去建立它的虛擬機器。

最後就是虛擬化,我們就不多說了,因為這裡面計算虛擬化、儲存虛擬化和網路虛擬化是我們做超融合裡面必須的這幾個技術。

我剛才說了一下我們為什麼需要超融合,大概講了一下,我們超融合能夠給企業帶來哪些價值?我下面稍微講一下。我們的這個超融合產品能夠給我們企業帶來什麼價值?

這個PPT裡有兩張圖,主要是描述了一個我們傳統資料中心的構建,傳統資料中心構建要有伺服器、交換機還有SAN裝置和NAS裝置,這些東西都是需要自己獨立去買的。

如果說用了超融合的產品以後,它就是像類似這種圖裡面,大量的X86伺服器我可以大量的通過硬體,根據自己的實際需求。什麼意思?我如果公司規模很大,我可以末多買一些這種伺服器然後去做超融合一體機。如果我的規模很小,我可能就買兩三臺就可以了。按需求的購買。還有SAN裝置和NAS裝置不需要買了,交換機可以買低成本的交換機。

資料

我剛才講了一下我們的FlexHCS是什麼東西,我再講我們的一步上雲到底是什麼意思。和我們怎麼去定義資料中心。

這裡有幾個東西,第一個是我們快速部署和彈性擴充套件,這個是什麼意思?就我們現在的雲無論是公有云還是私有云已經到達一個成熟的地步了。這個成熟地步以後我們如果想讓這個雲讓某個企業給搭建起來,還是很困難的事情。

雲這個東西牽扯很多技術細節,不僅是軟體的問題,還有硬體的問題。這時候我們想能夠做出一個產品,能夠讓一個企業能夠很快速的擁有自己的一個雲,其實對企業是會很有價值的。這個是我們說的一步上雲。

我不會讓你的企業再去招聘自己很專職的技術人員把雲搭建好、升級好、運維好。而是需要我們這邊擁有自己的安裝系統,自己的升級系統,自己的運維繫統,我會幫你們去做到你們企業裡面只需要拿到我們的超融合一體機在瀏覽器上面進行一鍵升級和安裝以及自動化的運維。我們說快速部署就是為了讓企業能夠輕鬆的擁有自己的私有云產品,也就是我們說的一步上雲。

說到定義新型的資料中心是什麼意思?我們公司提出一個柔性網路以及軟體定義的概念,軟體定義現在也是很火的一個概念,我們軟體定義網路,軟體定義儲存很多很多這些概念。

我們公司把軟體定義的東西全部集中在一個伺服器上,我們可以實現這種軟體定義的資料中心。大概的意思是什麼意思呢?原來你可能一個數據中心,我們大概有50臺機器只能給一個企業用。現在不需要了,你可以在你的伺服器上面裝上我們的超融合產品,裝上我們的系統以後,我們可以在所有的伺服器之上我們再模擬出來很多很多的虛擬的資料中心。

我們知道資料中心裡面,一定會有交換機,所以我們可以給你模擬出虛擬交換機,一定有路由器,我可以給你模擬出虛擬路由器。他一定有伺服器,我可以給你模擬出虛擬機器。他有防火牆,我可以給你模擬出虛擬防火牆。我們的資料中心的小盒子,小裝置可以用軟體定義掉。因為軟體定義的東西你只要在把底下的物理層面的東西全部給維護好,給網路連通好以後,剩下交給我們的超融合系統,我們的超融合系統會幫你定義出所有你們想要的資料中心裡面的各個裝置。

還有我們說的雲它能為你安裝,快速部署以及安裝完了之後,後期就會進入維護期了,因為雲的維護也是需要很多的專業人員,需要有專業知識才能做。我們是把我們這麼多年來對雲的一些做維護的一些經驗,我們都把它在我們的系統裡面進行了展現,進行了儲存,把我們經驗做成自動化的運維,我們系統可以根據我們原來的經驗,把自己原來系統裡面出現的問題,我可以自動化的去自動修復掉,不需要運維人員再來干預。

我們說的裝置利舊經濟環保,說到經濟環保可以看出來我們超融合產品可以大量的減少原來伺服器和符合SAN裝置,我們會減少機房裡面更多的這種裝置,可以給我們節省更多的能源的消耗,也可以為企業減少更多的購買裝置的成本以及聘請這些專業人員的運營成本。

如果我們雲平臺已經幫你們部署完了以後,它在使用的時候,一定要是確實是可以給企業用的,一定要有這種高可用以及高可靠。這種高可用和高可靠,更多不僅僅體現在我們說的儲存裝置上。我們說的儲存裝置高可靠是我們的最低保證。否則你比如說資料都沒有保證,我們的虛機資料很快丟掉了,說白了這個高可靠也沒有什麼談論的一個地。

我們首先資料的高可靠這塊我們是第一個優先考慮的,資料高可靠的基礎之上我們又做了一些應用層面的高可用。比如我們的虛擬HA,比如說我們的跟其他的PaaS上合作,做了應用的高可用。

架構

這個圖裡面我大概說了一下我們的FlexHCS提倡的一步上雲,以及軟體定義的資料中心大概是怎麼實現以及它為我們所帶來的一些價值。

這裡面應該是我剛才所描述的部分做了一個更詳細的說明,第一個我們是在基於X86伺服器上的超融合,而且我們是X86伺服器沒有跟廠家鎖定,只要你是X86伺服器,我們都是可以支援。

國內很多廠家,浪潮寶德,像華為我們都測試。國外伺服器像惠普、戴爾知名廠家我們都測試過。我們資料中心裡面所有裝置都可以通過虛擬化把它虛擬化掉。比如說防火牆,比如伺服器我們有虛擬機器,交換機我們有虛擬交換機。還有分散式,這種資料是分散式儲存和處理,這是什麼意思?

我在上一頁講的,我們首先要保證資料的高可用,所以我們的資料現在全部都是分散式來處理的,每一個使用者所產生的資料都用多副本機制實現。當你產生一個數據我們可以在多臺伺服器上把它進行儲存,如果某一臺伺服器或者某一臺伺服器上面的硬碟出現故障,我們可以從其他的伺服器或者是從其他的磁碟上面把這個資料進行恢復。

雲平臺也是基於分散式,可以任意進行擴容,有哪一天你發現你的虛擬機器建的很多,你的雲平臺負載有點高了,你可以直接買一個X86伺服器,裝上我們超融合系統,可以自動註冊加入到我們的雲平臺裡面去。

還有自我修復系統就像我剛才說的我們是把我們運維經驗會放到我們的平臺裡來,讓它自動運維。以及我們的資料故障隔離以及多副本機制。最後是API驅動,我們考慮到生態方面,我們給其他廠家提供API,其他廠家調動我們的API,和我們的超融合系統進行對接。

我們剛才看了FlexHCS提供的價值,下面介紹一下我們FlexHCS的產品概念以及它的一些架構。

這個圖裡面首先看到系先有我們傳統的X86伺服器,很普通的的X86伺服器。這個X86伺服器我們會把它變成計算、儲存和網路功能都具有的一個伺服器。這個X86伺服器上面會有宿主機的作業系統,這是很常見的一種形式。這也是我們最底層的一個架構,就跟我們原來的普通的X86伺服器一樣,你買了伺服器上面裝了客戶機的作業系統,宿主機的作業系統。

這上面是我們自己的部分,這部分是我們自己的部分。它是用我們的HCS  Server+Agent Docker實現底層容器雲平臺,實現對容器的編排、排程和管理。

我們為什麼用容器?為什麼把儲存、計算和網路放在臺X86伺服器的時候,為什麼會不產生衝突,我們用了容器的隔離。為什麼我們要用容器的隔離?在座有很多人瞭解容器,我不再詳細的去描述了。我們用了容器隔離了這種計算、儲存和網路,這樣的話這三個功能的元件之間實現了他們在伺服器上之間隔離,功能上可以相互引用的。

這個大概是我們的上面寫的一個元件,第一個是我們有Docker容器,上面有Agent,是監控這些Docker容器元件的。在容器裡面我們會部署我們的雲平臺,我們的雲平臺開始進行生命週期管理,在每一個容器裡面會起不同的計算元件、網路元件和儲存元件。

在這個元件搭建好的基礎之上,我們可以開始提供我們的虛擬機器建立,雲平臺這層搭建好基礎之上,我們開始提供這個網路功能以及我們的儲存功能和我們的計算功能,開始去建立一個這種儲存的池子,這個儲存池子可以給虛擬機器用。我們上面只是畫了虛擬機器,我們儲存池子還可以給伺服器用。可以直接把這個伺服器當成一個SAN裝置,可以把它掛給另外一個X86伺服器。它是磁針,可以這樣用。

這是我們超融合的大體架構,分為三層,一個是通路伺服器層,一個是我們的容器元件管理層,一個是雲平臺層。然後這個加入幾個優勢,第一個我們是容器的資源隔離以及它的資源限制,保證計算儲存網路在同一臺裝置上也可以執行穩定以及安全。

因為我們現在如果把這個計算、儲存、網路同時放在一臺伺服器上,他們很有可能會出現比如說搶佔資源,比如說會出現引用記憶體會出現重疊,我們用這個容器功能保證計算、儲存、網路在這個伺服器上不會出現相互之間的干擾,不會出現他們之間會有一些問題存在。我們利用容器便捷和輕量特性,進行雲平臺的快速部署和升級。

我們談到容器的話,很多人會想到容器可以提供很快速的部署以及它的便捷升級。我們確實用了容器很快捷的部署以及它的升級來實現我們雲平臺本身的快速安裝部署以及升級。所以這也是為什麼我們說的可以實現一鍵安裝和一鍵升級,就是用了容器本身自己的特性。

我們針對這個容器自己又開發了一個容器管理系統,容器管理系統可以去管理大量的容器以及對這些容器進行監控,進行負載均衡,進行排程,進行自動化運維,保證雲平臺的高可用以及高效能。

容器雖然有這麼多特徵,這麼多容器在一起還是需要管理系統,這個管理系統是我們自己開發,我們說的第三點怎麼對容器進行負載均衡以及進行管理,這需要額外的工作來做。這個容器管理系統可以保證我們雲平臺的高可用以及高效能。這是大概介紹一下我們的大概架構以及我們所用到的一些技術。

還有我們這個雲也是用了Openstack,我們跟其他的Openstack廠商不同的地方就是我們不僅用了Openstack,我們這裡還可以支援SDN。我們Openstack大部分的廠家可能,回用SDN會少一些,不能說沒有,也是有人在Openstack+SDN。我們公司才開始做  DN,我們是把Openstack+SDN都融在超融合產品裡面。還有我們可以支援很多的Hypervisor和ESXI五和KVM。

下面這個圖演示了一下我們超融合裡面的一些功能,比如我們在集散方面,我們有虛擬機器的高可用,可以實現我們比如說有一個虛擬機器某一臺伺服器上面執行,有可能這個伺服器不知道什麼原因宕機了,我們可以實現能夠自動做遷移,可以遷移到其他物理機上,保證虛擬機器的高可用。我們可以實現計算的彈性伸縮,我們可以根據你的自己的業務規模,某一天你的業務量達到很高的時候可以自動在雲平臺上幫你新建虛擬機器,實現虛擬機器的擴充套件。

還有NFV概念在裡面,軟體定義防火牆,軟體定義VPN,還有租戶級的QOS,還有可以做到某一個企業可以限制他的網路頻寬,還有SDN架構以及VPC。這幾個不詳細講了,大家可能也聽的比較多了。儲存這方面有多負荷安全保證,我們能保證資料可靠性,我們用多副本機制,我們現在其實實現異地災備我在這裡沒寫。運維方面我們可以實現虛擬機器和物理環境的統一監控以及多角色控制以及日誌統一管理。平臺方面可以做到一鍵升級微服務架構,無縫對接,實現高可用。

資料中心

在後面這裡面大概說了一下我剛才講的一些特性在裡面。簡單易用,就實現了一步上雲的東西,當你把它給裝好以及升級好了以後,剩下就是後面你怎麼讓它去執行,執行的時候我們要求穩定可靠。當你執行完了一段時間之後想擴容怎麼辦,我們還支援水平擴充套件。三個聯合起來它的成本會不會很高,我們又提供這種可控成本。這是我們的安裝升級部分做到簡單易用。這是我們的執行方面保證它穩定可靠,以及運行了之後要能做到水平擴充套件,總體成本要能可控。

這是產品形態,多字星系列,可以讓你的機櫃裡面佔用空間很少,就能夠實現一個2U裡面實現四個伺服器。這是我們的天蠍系列,整個機櫃。還有通用系列就是X86伺服器。這裡有每個優點,可以看一下。

硬體

這是我們一體機的樣子。這是我們一體機剛才說的第二個機櫃的的一些優點,開放架構無廠商鎖定,開箱即用,可以一鍵安裝。還有為了提高節省能源,我們有一些電力和散熱模組優化,還有集中供電,也有一些效率提升。

這個大概說明了一下我們怎麼把一個X86伺服器變成了一個雲的這樣一個動態的圖。因為時間有點趕,我這個圖不給大家詳細講了。剛才大概描述基本也就這些東西。

最後可以看一下我們給上海某貿易公司搭建的超融合的一個產品。

當時這個客戶是一個貿易公司,因為貿易公司對伺服器這些東西懂得不是太多,他們想讓我們很快的大概也就是兩個星期之內跟他們搭建一個他們能夠用的一個私有云出來,所以我們當時給他推薦的方案就是一體機的形式。

我們連硬體和軟體一起賣給他,在客戶那邊他要求我們是兩個星期,但實際上我們是三天把他的伺服器報過去之後,對他機房裡面網路升級都進行了一下改造,實現我們開箱即用,瀏覽器配了之後。也就是說那個三天裡面可能更多的時間是跟他溝通它的網路應該怎麼部署,真正去安裝的時候可能就是需要幾個小時就做完了。這個跟他用的三臺伺服器裡面大概的部署形態。

後是客戶的一些收益,可以降低他的成本以及開箱很感謝大家的聆聽,謝謝。

文章來自微信公眾號:雲端計算開源產業聯盟