1. 程式人生 > >從此以後運維與開發過上了沒羞沒臊的性福生活

從此以後運維與開發過上了沒羞沒臊的性福生活

原文連結:Kubernetes 控制器的進化之旅

我是一堆 Kubernetes 控制器。

你可能會疑惑為什麼是一堆,因為我不是一個人,我只是眾多控制器中的一員,你也可以把我看成是眾多控制器的集合。我的職責就是監控叢集內資源的實際狀態,一旦發現其與期望的狀態不相符,就採取行動使其符合期望狀態。

想當初,Kubernetes 老大哥創造我時,只是打算讓我用控制迴圈簡單維護下資源的狀態。但我後來的發展,遠遠超出了他的想象。

1. 控制迴圈

所謂控制迴圈就是一個用來調節系統狀態的週期性操作,在 Kubernetes 中也叫調諧迴圈(Reconcile Loop)。我的手下控制著很多種不同型別的資源,比如 Pod,Deployment,Service 等等。就拿 Deployment

來說吧,我的控制迴圈主要分為三步:

  1. API Server 中獲取到所有屬於該 Deployment 的 Pod,然後統計一下它們的數量,即它們的實際狀態。
  2. 檢查 Deployment 的 Replicas 欄位,看看期望狀態是多少個 Pod。
  3. 將這兩個狀態做比較,如果期望狀態的 Pod 數量比實際狀態多,就建立新 Pod,多幾個就建立幾個新的;如果期望狀態的 Pod 數量比實際狀態少,就刪除舊 Pod,少幾個就刪除幾個舊的。

然而好景不長,我收到了 Kubernetes 掌門人(看大門的) API Server 的抱怨:“你訪問我的次數太頻繁了,非常消耗我的資源,我連上廁所的時間都沒有了!”

我仔細一想,當前的控制迴圈模式確實有這個缺陷——訪問 API Server 的次數太頻繁了,容易被老大反感。

所以我決定,找一個小弟。

2. Informer

這次我招的小弟叫 Informer,它分擔一部分我的任務,具體的做法是這樣的:由 Informer 代替我去訪問 API Server,而我不管是查狀態還是對資源進行伸縮都和 Informer 進行交接。而且 Informer 不需要每次都去訪問 API Server,它只要在初始化的時候通過 LIST API 獲取所有資源的最新狀態,然後再通過 WATCH API 去監聽這些資源狀態的變化,整個過程被稱作 ListAndWatch

而 Informer 也不傻,它也有一個助手叫 Reflector,上面所說的 ListAndWatch 事實上是由 Reflector 一手操辦的。

這一次,API Server 的壓力大大減輕了,因為 Reflector 大部分時間都在 WATCH,並沒有通過 LIST 獲取所有狀態,這使 API Server 的壓力大大減少。我想這次掌門人應該不會再批評我了吧。

然而沒過幾天,掌門人又找我談話了:“你的手下每次來 WATCH 我,都要 WATCH 所有兄弟的狀態,依然很消耗我的資源啊!我就納悶了,你一次搞這麼多兄弟,你虎啊?”

我一想有道理啊,沒必要每次都 WATCH 所有兄弟的狀態,於是告訴 Informer:“以後再去 API Server 那裡 WATCH 狀態的時候,只查 WATCH 特定資源的狀態,不要一股腦兒全 WATCH。“

Informer 再把這個決策告訴 Reflector,事情就這麼愉快地決定了。

本以為這次我會得到掌門人的誇獎,可沒過幾天安穩日子,它又來找我訴苦了:“兄弟,雖然你減輕了我的精神壓力,但我的財力有限啊,如果每個控制器都招一個小弟,那我得多發多少人的工資啊,你想想辦法。”

3. SharedInformer

經過和其他控制器的討論,我們決定這麼做:所有控制器聯合起來作為一個整體來分配 Informer,針對每個(受多個控制器管理的)資源招一個 Informer 小弟,我們稱之為 SharedInformer。你們可以理解為共享 Informer,因為有很多資源是受多個控制器管理的,比如 Pod 同時受 DeploymentStatefulSet 管理。這樣當多個控制器同時想查 Pod 的狀態時,只需要訪問一個 Informer 就行了。

但這又引來了新的問題,SharedInformer 無法同時給多個控制器提供資訊,這就需要每個控制器自己排隊和重試。

為了配合控制器更好地實現排隊和重試,SharedInformer 搞了一個 Delta FIFO Queue(增量先進先出佇列),每當資源被修改時,它的助手 Reflector 就會收到事件通知,並將對應的事件放入 Delta FIFO Queue 中。與此同時,SharedInformer 會不斷從 Delta FIFO Queue 中讀取事件,然後更新本地快取的狀態。

這還不行,SharedInformer 除了更新本地快取之外,還要想辦法將資料同步給各個控制器,為了解決這個問題,它又搞了個工作佇列(Workqueue),一旦有資源被新增、修改或刪除,就會將相應的事件加入到工作佇列中。所有的控制器排隊進行讀取,一旦某個控制器發現這個事件與自己相關,就執行相應的操作。如果操作失敗,就將該事件放回佇列,等下次排到自己再試一次。如果操作成功,就將該事件從佇列中刪除。(圖片來自網路)

現在這個工作模式得到了大家的一致好評。雖然單個 SharedInformer 的工作量增加了,但 Informer 的數量大大減少了,老大可以把省下來的資金拿出一小部分給 SharedInformer 漲工資啊,這樣大家都很開心。

4. CRD

全民 Kubernetes 時代到了。

隨著容器及其編排技術的普及,使用 Kubernetes 的使用者大量增長,使用者已經不滿足 Kubernetes 自帶的那些資源(Pod,Node,Service)了,大家都希望能根據具體的業務建立特定的資源,並且對這些資源的狀態維護還要遵循上面所說的那一套控制迴圈機制。

幸好最近掌門人做了一次升級,新增了一個外掛叫 CRD(Custom Resource Definition),建立一個全新的資源例項,只需要經過以下兩步:

  1. 建立一個 CRD 資源(沒錯,CRD 也是一種資源型別),其中定義”自定義資源“的 API 組、API 版本和資源型別。這樣就會向 API Server 註冊該資源型別的 API。
  2. 指定上面定義的 API 組 和 API 版本,建立自定義資源。

當然,中間還要加入一些程式碼讓 Kubernetes 認識自定義資源的各種引數。

到這一步就基本上完成了自定義資源的建立,但 Kubernetes 並不知道該資源所對應的業務邏輯,比如你的自定義資源是宿主機,那麼對應的業務邏輯就是建立一臺真正的宿主機出來。那麼怎樣實現它的業務邏輯呢?

5. 自定義控制器

Controller Manager 見多識廣,說:”這裡的每個控制器都是我的一部分,當初創造你們是因為你們都屬於通用的控制器,大家都能用得上。而自定義資源需要根據具體的業務來實現,我們不可能知道每個使用者的具體業務是啥,自己一拍腦袋想出來的自定義資源,使用者也不一定用得上。我們可以讓使用者自己編寫自定義控制器,你們把之前使用的控制迴圈和 Informer 這些編碼模式總結一下,然後提供給使用者,讓他們按照同樣的方法編寫自己的控制器。“

Deployment 控制器一驚,要把自己的祕密告訴別人?那別人把自己取代了咋辦?趕忙問道:”那將來我豈不是很危險,沒有存在的餘地了?“

Controller Manager 趕忙解釋道:”不用擔心,雖然使用者可以編寫自定義控制器,但無論他們玩出什麼花樣,只要他們的業務跑在 Kubernetes 平臺上,就免不了要跑容器,最後還是會來求你們幫忙的,你要知道,控制器是可以層層遞進的,他們只不過是在你外面套了一層,最後還是要回到你這裡,請求你幫忙控制 Pod。“

這下大家都不慌了,決定就把自定義控制器這件事情交給使用者自己去處理,將選擇權留給使用者。

6. Operator

使用者自從獲得了編寫自定義控制器的權力之後,非常開心,有的使用者(CoreOS)為了方便大家控制有狀態應用,開發出了一種特定的控制器模型叫 Operator,並開始在社群內推廣,得到了大家的一致好評。不可否認,Operator 這種模式是很聰明的,它把需要特定領域知識的應用單獨寫一個 Operator 控制器,將這種應用特定的操作知識編寫到軟體中,使其可以利用 Kubernetes 強大的抽象能力,達到正確執行和管理應用的目的。

ETCD Operator 為例,假如你想手動擴充套件一個 ETCD 叢集,一般的做法是:

  1. 使用 ETCD 管理工具新增一個新成員。
  2. 為這個成員所在的節點生成對應的啟動引數,並啟動它。

而 ETCD Operator 將這些特定於 etcd 的操作手法編寫到了它的控制迴圈中,你只需要通過修改自定義資源宣告叢集期望的成員數量,剩下的事情交給 Operator 就好了。(圖片來自網路)

本以為這是一個皆大歡喜的方案,但沒過多久,就有開發 Operator 的小哥來抱怨了:”我們有很多開發的小夥伴都是不懂運維那一套的,什麼高可用、容災根本不懂啊,現在讓我們將運維的操作知識編寫到軟體中,臣妾做不到啊。。“

這確實是個問題,這樣一來就把開發和運維的工作都塞到了開發手裡,既懂開發又懂運維的可不多啊,為了照顧大家,還得繼續想辦法把開發和運維的工作拆分開來。

7. OAM

這時候阿里和微軟發力了,他們聯合釋出了一個開放應用模型,叫 Open Application Model(OAM)。這個模型就是為了解決上面提到的問題,將開發和運維的職責解耦,不同的角色履行不同的職責,並形成一個統一的規範,如下圖所示(圖片來自網路):

這個規範告訴我們:

  • 開發人員負責描述元件的功能,如何配置元件,以及執行需要多少資源
  • 運維人員負責將相關元件組合成一個應用,並配置執行時引數和運維支撐能力,比如是否需要監控,是否需要彈性伸縮。
  • 基礎設施工程師負責建立和維護應用的執行時環境(如底層系統)。

其中每一個團隊負責的事情都用對應的 CRD 來配置。

這樣一來,開發和運維人員的職責就被區分開來了,簡化了應用的組合和運維。它將應用的配置和運維特徵(如自動伸縮、流量監控)進行解耦,然後通過建模構成一個整體,避免了 Operator 這種模型帶來的大量冗餘。

自從用上了這個模型之後,運維和開發小哥表示現在他們的關係很融洽,沒事還能一起出去喝兩杯。

微信公眾號

掃一掃下面的二維碼關注微信公眾號,在公眾號中回覆◉加群◉即可加入我們的雲原生交流群,和孫巨集亮、張館長、陽明等大佬一起探討雲原生技術

相關推薦

從此以後開發沒羞生活

原文連結:Kubernetes 控制器的進化之旅 我是一堆 Kubernetes 控制器。 你可能會疑惑為什麼是一堆,因為我不是一個人,我只是眾多控制器中的一員,你也可以把我看成是眾多控制器的集合。我的職責就是監控叢集內資源的實際狀態,一旦發現其與期望的狀態不相符,就採取行動使其符合期望狀態。 想當初,K

關於curl網站開發的那些事

curl網站開發指南 常見引數: -A/--user-agent <string> 設定使用者代理髮送給伺服器 -b/--cookie <name=string/file> cookie字串或檔案讀取位

2015.09-2016.08年終總結 需求、設計、開發、測試、部署、……統統將矛頭指向管理,目前認為會管理才是王道

    15年9月和10月,是我們在學校的最後兩個月,那兩個月,迎來了小小徒弟,13期一波兒活蹦亂跳的孩子們,甚是喜歡。     11月我們搬到萬達學習,新環境雖說不如學校方

老男孩:做比做開發崗位有哪些特殊好處,你知道麽?

老男孩思想 運維屌絲 逆襲之路 現實中很多網友,包括大學生對編程開發了解很多,但對運維了解較少,有經驗的部分人員(包括一些從事運維的)也會覺得開發更牛逼,運維就是背黑鍋(如何不背黑鍋,看老男孩的以後文章)的,運維==黑鍋俠。那麽,老男孩就給大家講講老男孩眼中運維的好處,讓大家重新認識下運維崗

循序漸進DB2.DBA系統管理、應用案例pdf

數據庫配置 配置更改 存儲 安全相關 快照 fmt 常用工具 tween 數據庫對象 下載地址:網盤下載 內容簡介  DB2數據庫是IBM公司關系型數據庫核心產品,在國內以及全球有著廣泛的應用。針對DB2初學者,《循序漸進DB2:DBA系統管理、運維與應用案例》循序漸進

IT技術,開發資源站---小公舉網站導航測試版

IT技術運維開發資源站網站導航:dh.gaopengju.cn網站導航:dh.gaopengju.cn網站導航:dh.gaopengju.cnIT技術,運維,開發資源站---小公舉網站導航測試版

Linuxweb集群需要解什麽內容?

Linux運維 Linux學習 Linux入門 Linux基礎 系統運維 Linux運維web集群需要了解什麽內容??在充斥著各種的互聯網+的數字時代,IT運維方面也越來越趨於Linux系統的應用,掌握 Linux 運維技術已成為IT 技術人員的必經之路,但是,構建在Linux系統上的高性

Kubernetes實戰 高可用叢集搭建,配置,應用

1-1 K8S導學 1-2 搭建K8S叢集步驟和要點介紹 1-3 搭建三節點Ubuntu環境 1-4 安裝容器引擎 1-5 下載Kubeadm、node元件和命令列工具 1-6 向叢集中加入worker節點 1-7 安裝dashboard和heapste

shell指令碼

運維工作內容 負載均衡GSLB 方式 輪詢 ip hash:這樣的話由於hash值是一樣的,那麼伺服器可以為使用者做快取 權重:按照伺服器能力,權重 業務運營支援系統BOSS 例如:計費、結算

架構—Nginx的優缺點

Nginx的優點是:  1、工作在網路的7層之上,可以針對http應用做一些分流的策略,比如針對域名、目錄結構 它的正則規則比HAProxy更為強大和靈活,這也是它目前廣泛流行的主要原因之一 Nginx單憑這點可利用的場合就遠多於LVS了。 2、Nginx對網路穩定性的依賴非常小,理論上能p

管理技術之規範spring-boot配置提高管理效率

會用與靈活的用好之間是妙之巔豪,失之千里,小細節大管理。管理沒有大小之分, 很小的細節管理可能會很大在個個方面提升效率,降低成本。本章節是鳥菜啊在實踐靈活用好spring-boot配置的案例,只是進行一次比較簡單有效的規範,很大程度上提高的管理,運維與合作效率。

開發

運維會比開發更加重要 運維的發展日新月異,曾幾何時,運維僅僅是被認知為跑機房,裝系統,設計網路,給開發擦屁股。但是現在運維變得極度重要,運維職責也更加細化,譬如稍大點的公司就將運維劃分為基礎運維,網路運維,DBA, 應用運維,架構師。其實我個人認為系統架構師應該都安排在運維裡,開發團隊應該率

網路管理系統

· 模組化 系統模型可以很好的理解網路環境,即使很複雜的環境,也可以進行詳細的分析。系統模型的核心用來描述裝置的基礎資訊,系統模型是基於物件的,可以通過繼承物件對模型進行擴充套件。 · 自動發現 使用自動發現來應對複雜環境。在自動發現過程中,系統會訪問現有環境下所有的監控裝置,從而獲取裝置資

自動化監控

一:運維開發     運維開發一般需要熟悉Python和Shell,運維工具有:     SaltStack(自動化運維),Ansible(自動化運維),Jinkens(持續整合&持續交付)  

Nginx入門到實踐 不管是還是開發 Nginx都是你的必備技能

3-1 場景實踐篇內容介紹 3-2 Nginx作為靜態資源web服務_靜態資源型別 3-3 Nginx作為靜態資源web服務_CDN場景 3-4 Nginx作為靜態資源web服務_配置語法 3-5 Nginx作為靜態資源web服務_場景演示 3-6 Nginx作為靜態資源web服務_瀏覽器

聽說你是做的,那這8項技能你get齊嗎?

運維在經過多年發展,得益於分散式、高可用的系統架構和高效能、易伸縮的基礎資源,系統得以穩定執行,儼然已經擺脫被動背鍋的命運。 但運維依然是個非常“苦”的行業,這種“苦”主要來自於變化太快。技術在不停變更,還有變得越來越快的趨勢,其中又以雲作為這兩年變化最快的領域和最重要的環節。如今想要在運維這個行當

香奈兒:聽說女裝更配哦!

說起資料中心,總會令人想起幾個關鍵字:IT 男,各種大型機櫃,整排伺服器和配線架。但香奈兒告訴你:現在我們走的是時尚之路,看懂香奈兒的,更懂新一代資料中心。香奈兒的 2017 春夏時裝釋出會把秀場變成了資料中心,時裝秀色彩鮮明對比,告訴你時尚的靈感也可以和資料中心結合的很好。 1、先來看看香奈兒2

老男孩:做比做開發崗位有哪些特殊好處,你知道麼?

現實中很多網友,包括大學生對程式設計開發瞭解很多,但對運維瞭解較少,有經驗的部分人員(包括一些從事運維的)也會覺得開發更牛逼,運維就是背黑鍋(如何不背黑鍋,看老男孩的以後文章)的,運維==黑鍋俠。 那麼,老男孩就給大家講講老男孩眼中運維的好處,讓大家重新認識下運維崗位的魅力吧。 1、做運維可以認識更

WOT2015網際網路開發者大會(1)

WOT2015網際網路運維與開發者大會將於4月10日~11日在北京舉行,運維派接下來將對WOT的關鍵資訊進行跟蹤,那麼今年的大會的主要議題和技術風向是什麼呢?下面先給大家開個場: 有人說,IT運維從傳統部署到大規模自動化的轉變,Coding能力要求越來越高。 也有人說,大部分IT企業都是重研發輕運

社群首次活動:500G開發、架構師學習資料免費下載_Kubernetes中文社群

這是一份大禮包!!! K8S中文社群網站從2016年10月運營以來,已經為30萬+愛好者提供免費資料分享,網站月流量突破20萬,雙11來臨之際,我們也為小夥伴準備豐富大禮包,500G運維、開發、架構師學習資料免費下載。 目錄如下: 精選40篇 Kubernetes PPT 文件 (媽媽在也不