1. 程式人生 > >肖力:“OpenStack政企專享雲運維實踐” – 運維派

肖力:“OpenStack政企專享雲運維實踐” – 運維派

由工業和資訊化部指導,中國資訊通訊研究院主辦,業界知名組織雲端計算開源產業聯盟(OSCAR)承辦的2017全球雲端計算開源大會於4月19日-20日在北京國家會議中心順利召開。本文為本屆大會嘉賓分享的大會演講速記內容,敬請瀏覽。

嘉賓介紹:肖力

公司職務:北京中聯潤通資訊科技有限公司運維總監

大會演講速記

以前都是我當主持人,別人講,今天換個個,我發現明宇主持水平非常高。我給大家帶來的是OpenStack企業專享雲運維實踐。

OpenStack

第一,介紹一下我們對政企專享雲建設過程。我們公司成立於2009年,我們自己定位是一個雲端計算、大資料解決方案公司,目前我們通過ISO20000、20007,國家等保三級認證,可信雲認證,SP認證。

我們的客戶有國家發改委、中國海關、中國海監局、中國聯通,中國紅十字會等等。

雲端計算

我們包括雲端計算、大資料資源管理平臺,分散式資料庫,安全態勢感知和資料交換等服務,還提供一些專業服務,運維外包,SDN託管,還包括一些行業解決方案,巨集觀經濟決策,軍民融合,電子稅務,政務公開辦公,製造和醫療。

核心

我們做過很多國家級的大型專案,還有一些上市公司,在這些專案中,一些核心需求是什麼,我們自己總結十二個字,六個方面,自主、開放、成本、效能、定製、遷移,怎麼滿足這些核心需求呢?我們有兩個字祕訣“開源”,通過使用開源解決方案,我們可以滿足自主、開放、成本方面的需求,通過自主研發能力,運維能力,可以很好地滿足效能、定製、遷移方面的需求。

大資料

我們有兩個案例,第一個是國家級大資料中心建設,底層雲和上層大資料都是使用我們的解決方案,我們首先會做業務需求分析,確定建設思路,這是以點帶面的思路。包括建設方式,我們是統籌的資料資源,這個專案建設成果可以促進國家經濟發展,大資料中心,有效支撐了國家大資料分析應用,有利於顯著提高國家經濟部門管理效能和決策水平。

OpenStack

這是一個醫藥行業某上市公司的案例,這是非常典型的OpenStack案例。

這個案例目標是製造核心雲,從傳統模式自建SDC,遷移到OpenStack私有云,同時支援多層複雜的內部雲,包括醫院業務系統醫療和辦公系統等,設計架構採用混合架構,新建以OpenStack為核心的企業私有云,提供用於SDP等特殊配置物理集合,標準配置虛擬機器,使用點對點專線連線到使用者現場,辦公現場。

建設成果以使用者需求為導向,以穩定性、安全性、靈活性為設計目標,建設私有云平臺,滿足行業監管機構對業務系統的特殊安全要求,包括醫療檔案資料隔離,資料庫等等。

使用者收益,通過部署私有云實現客戶IP資源標準化,通過服務目錄互動服務,企業不再承擔固定資產投入,以靈活的方式選擇IP投入,這是典型的OpenStack雲的建設案例。

運維

雲的運維非常重要,我們雲的運維如何組織的呢?運維方面我們主要有兩個挑戰。

運維挑戰

第一,我們經常有多個OpenStack專案同時實施,而且許多又是國家級大型OpenStack專案,經常一個週期是大半年時間,甚至有的超過一年時間,而且這些專案經常做完以後轉為我們去服務,我們目前有幾十個OpenStack專案提供服務,這是我們運維方面碰到的兩個挑戰。

 解決方案

解決方案:我們有三板斧,第一,我們有一套運維工具,我們有持續不斷的共享和培訓。我們非常重要的是專案導向的團隊建設,先看一下我們運維工具,我們有一套自動化的運維繫統,我們建設是用微服務的理念建設出來的,完全自己開發出來的,我們的開發團隊幫助我們做一個平臺,所有運維都為了完善這個平臺。一切的指令碼都是原子的,我們可以快速對指令碼進行重新組合,比如原來機遇OpenStackM版寫了一個指令碼,現在N版出來了很多指令碼是公用的,我們也可以很快的把指令碼寫出來。

另外我們要為幾十個OpenStack專案服務,我們整個服務用公端驅動的,所有客戶需求都是用公端體現的。我們還有日誌系統,我們把雲主機、物理機日誌收集起來。現在我們還在做一件事情,做一些智慧的預警,建立一個智慧系統,通過日誌分析,在故障沒有發生之前做預測。以及我們還有一個專案管理系統。

開源

這是我們的工單系統,我們日常就是靠工單系統運轉,最早我們使用的一套開源工單系統,這套系統功能比較全一點,但是東西也比較笨重一點,後來我們開發了一套完全滿足我們一套輕量級的工單系統,非常不錯,介面是簡陋一點。

這是我們的運維繫統,基本上我們把它叫平臺整合器,我們的研發幫我們做一個平臺,底層有一個整合器。基本上我們目前運維就是高公端系統和自動化運維繫統作為兩個支撐點支撐的,在內部也執行比較順暢。

我們有一個計劃,我們使用了很多開源軟體,我們也希望回饋一些東西,我們預計今年下半年或者明年年初,我們的公端系統和運維工具系統準備拿出來開源,和大家共享。因為我們覺得這些系統跟OpenStack結合的時候,我們還是有一些經驗和心得的,希望能夠分享出來。

管理工具

另外運維我們還有一個非常大的特色,就是引入一些專案管理工具,比如我們拿到OpenStack專案會首先分成幾個任務包,任務包可以再細分到天、人,每個人每天做什麼,一些特別重要的專案,我們甚至會分解到小時,我們每天都有一個list,每天大家彙報資訊,完成什麼樣,每天持續檢查跟蹤,這樣可以保證我們對一個運維專案,對一個OpenStack專案,譜儀保質保量,而且在可控範圍內能夠把它做完。

運維團隊

這是我們運維團隊的演進,最早的時候我們運維團隊分為四組,一個是知識組,知識組分為兩塊,一個是24小時值班,一直看監控螢幕,還有一個是客服接電話的終端處理,還有一個組是現場組,這個組主要做一些物理伺服器上架,還有作業系統安裝,還有一個組叫網路安全組,做一些網路安全裝置上架配置,還有網路服務的需求。

還有是系統組,系統組主要做作業系統以上,比如OpenStack部署,Ceph部署,客戶系統的需求,可以做一些變更。這個劃分可以滿足我們業務需要,但是有一個問題,如果有專案來的時候,現場組工作量非常忙,但是專案結束以後,有一段時間可能沒專案,這段時間他又相對比較清閒一點,工作量不飽和,而且還有一個問題,現場組這些人永遠接觸的都是硬體,網路組接觸的都是網路的一些東西,然後我們做了團隊的變革。

目前我們有三個組,一個是支援組,基本上還是做以前支援組的事情。還有是實施組,我們把現場組、網路組、系統組部署的活分到一個組裡面,這樣對於實施組來說有很好的學習機會,既可以做硬體部署,也可以做系統部署,也可以做OpenStack部署,也可以做終端處理。還有架構組,架構組主要做一些方案設計,方案實施,有時候需要見一些客戶,對他來說也是很好的鍛鍊。

專案怎麼實施呢?我們目前採用的是虛擬專案的機制,一般是架構組出一個人,實施組根據專案大小,人數不一樣,有時候三到五人有時候更多,這個專案就一直歸架構組處理。整個專案週期由一個人負責,這樣的好處是專案他比較熟悉,客戶一直接觸他,有些問題也比較好處理,以及資料流量他都很清晰,能夠保證專案不管是實施,以及實施後的專案服務,都可以保證。

文章來自微信公眾號:雲端計算開源產業聯盟