還不會用 K8s 叢集控制器?那你會用冰箱嗎?(多圖詳解)
作者 | 阿里雲售後技術專家 聲東
**導讀:**當我們嘗試去理解 K8s 叢集工作原理的時候,控制器(Controller)肯定是一個難點。這是因為控制器有很多,具體實現大相徑庭;且控制器的實現用到了一些較為晦澀的機制,不易理解。但是,我們又不能繞過控制器,因為它是叢集的“大腦”。今天這篇文章,作者通過分析一個簡易冰箱的設計過程,來幫助讀者深入理解叢集控制器的產生,功能以及實現方法。
K8s 叢集核心元件大圖
下圖是 K8s 叢集的核心元件,包括資料庫 etcd,排程器 Scheduler,叢集入口 API Server,控制器 Controller,服務代理 kube-proxy 以及直接管理具體業務容器的 kubelet。
這些元件邏輯上可以被分為三個部分:
- 核心元件 etc 資料庫;
- 對 etcd 進行直接操作的入口元件 API Server;
- 其他元件, 這裡的“其他元件”之所以可以被劃分為一類,是因為它們都可以被看做是叢集的控制器。
今天我們要講的就是叢集控制器原理。
控制器原理
雖然控制器是 K8s 叢集中比較複雜的元件,但控制器本身對我們來說並不陌生的。我們每天使用的洗衣機、冰箱、空調等,都是依靠控制器才能正常工作。在控制器原理這一節,我們通過思考一個簡易冰箱的設計過程,來理解 K8s 叢集控制器的原理。
簡易的冰箱
這個冰箱包括五個元件:箱體、製冷系統、照明系統、溫控器以及門。
冰箱只有兩個功能:
- 當有人開啟冰箱門的時候,冰箱內的燈會自動開啟;
- 當有人按下溫控器的時候,製冷系統會根據溫度設定,調節冰箱內溫度。
統一入口
對於上邊的冰箱,我們可以簡單抽象成兩個部分:統一的操作入口和冰箱的所有元件。
在這裡,使用者只有通過入口,才能操作冰箱。這個入口提供給使用者兩個介面:開關門和調節溫控器。使用者執行這兩個介面的時候,入口會分別調整冰箱門和溫控器的狀態。
但是這裡有一個問題,就是使用者通過這兩個介面,既不能讓冰箱內部的燈開啟,也不能調節冰箱的溫度。
控制器
控制器就是為了解決上邊的問題產生的。控制器就是使用者的操作,和冰箱各個元件的正確狀態之間的一座橋樑:
- 當用戶開啟門的時候,控制器觀察到了門的變化,它替使用者開啟冰箱內的燈;
- 當用戶按下溫控器的時候,控制器觀察到了使用者設定的溫度,它替使用者管理製冷系統,調節冰箱內溫度。
控制器管理器
冰箱有照明系統和製冷系統,顯然相比一個控制器管理著兩個元件,我們替每個元件分別實現一個控制器是更為合理的選擇。同時我們實現一個控制器管理器來統一維護所有這些控制器,來保證這些控制器在正常工作。
SharedInformer
上邊的控制器和控制器管理器,看起來已經相當不錯了。但是當冰箱功能增加,勢必有很多新的控制器加進來。這些控制器都需要通過冰箱入口,時刻監控自己關心的元件的狀態變化。比如照明系統控制器就需要時刻監控冰箱門的狀態。當大量控制器不斷的和入口通訊的時候,就會增加入口的壓力。
這個時候,我們把監控冰箱元件狀態變化這件事情,交給一個新的模組 SharedInformer 來實現。
SharedInformer 作為控制器的代理,替控制器監控冰箱元件的狀態變化,並根據控制器的喜好,把不同元件狀態的變化,通知給對應的控制器。通過優化,這樣的 SharedInformer 可以極大的緩解冰箱入口的壓力。
ListWatcher
SharedInformer 方便了控制器對冰箱元件的監控,而這個機制最核心的功能,當然是主動獲取元件狀態和被動接收元件狀態變化的通知。這兩個功能加起來,就是 ListWatcher。
假設 SharedInformer 和冰箱入口通過 http 協議通訊的話,那麼 http 分塊編碼(chunked transfer encoding)就是實現 ListWatcher 的一個好的選擇。控制器通過 ListWatcher 給冰箱入口傳送一個查詢然後等待,當冰箱元件有變化的時候,入口通過分塊的 http 響應通知控制器。控制器看到 chunked 響應,會認為響應資料還沒有傳送完成,所以會持續等待。
舉例說明
以上我們從一個簡易冰箱的進化過程中,瞭解了控制器產生的意義,扮演的角色,以及實現的方式。現在我們回到K8s 叢集。K8s 叢集實現了大量的控制器,而且在可以預見的未來,新的功能的控制器會不斷出現,而一些舊的控制器也會被逐漸淘汰。
目前來說,我們比較常用的控制器,如 Pod 控制器、Deployment 控制器、Service 控制器、Replicaset 控制器等。這些控制器一部分是由 kube controller manager 這個管理器實現和管理,而像 route 控制器和 service 控制器,則由 cloud controller manager 實現。
之所以會出現 cloud controller manager,是因為在不同的雲環境中,一部分控制器的實現,會因為雲廠商、雲環境的不同,出現很大的差別。這類控制器被劃分出來,由雲廠商各自基於 cloud controller manager 分別實現。
這裡我們以阿里雲 K8s 叢集 cloud controller manager 實現的 route 控制器和 service 控制器為例,簡單說明 K8s 控制器的工作原理。
服務控制器
首先,使用者請求 API Server 建立一個 LoadBalancer 型別的服務,API Server 收到請求並把這個服務的詳細資訊寫入 etcd 資料庫。而這個變化,被服務控制器觀察到了。服務控制器理解 LoadBalancer 型別的服務,除了包括存放在 etcd 內部的服務記錄之外,還需要一個 SLB 作為服務入口,以及若干 endpoints 作為服務後端。所以服務控制器分別請求 SLB 的雲 openapi 和 API Server,來建立雲上 SLB 資源,和叢集內 endpoints 資源。
路由控制器
在叢集網路一章中,我們提到過,當一個節點加入一個 K8s 叢集的時候,叢集需要在 VPC 路由表裡增加一條路由,來搭建這個新加入節點到 Pod 網路的主幹道。而這件事情,就是路由控制器來做的。路由控制器完成這件事情的流程,與上邊服務控制器的處理流程非常類似,這裡不再贅述。
結束語
基本上來說,K8s 叢集的控制器,其實扮演著叢集大腦的角色。有了控制器,K8s 叢集才有機會擺脫機械和被動,變成一個自動、智慧、