Kubernetes 架構組成&&重要概念
Kubernetes 架構
Kubernetes Cluster 由 Master 和 Node 組成,節點上執行著若干 Kubernetes 服務。
Master 節點
Master 是 Kubernetes Cluster 的大腦,執行著如下 Daemon 服務:kube-apiserver
、kube-scheduler
、kube-controller-manager
、etcd
和 Pod 網路
(例如 flannel)。
- API Server(kube-apiserver):API Server 提供 HTTP/HTTPS RESTful API,即
Kubernetes API。API Server 是 Kubernetes Cluster 的前端介面,各種客戶端工具(CLI 或 UI)以及 Kubernetes 其他元件可以通過它管理 Cluster 的各種資源。 - Scheduler(kube-scheduler):Scheduler負責決定將Pod放在哪個Node上執行。Scheduler在排程時會充分考慮Cluster的拓撲結構,當前各個節點的負載,以及應用對高可用、效能、資料親和性的需求。
- Controller Manager(kube-controller-manager):Controller Manager 負責管理
Cluster 各種資源,保證資源處於預期的狀態。Controller Manager 由多種 controller 組成,包括replication controller、endpoints controller、namespace controller、serviceaccounts controller
- etcd:etcd 負責儲存 Kubernetes Cluster 的配置資訊和各種資源的狀態資訊。當資料發生變化時,etcd會快速地通知 Kubernetes 相關元件。
- Pod 網路:Pod 要能夠相互通訊,Kubernetes Cluster 必須部署 Pod 網路,flannel 是其中一個可選方案。
Node 節點
Node 是 Pod 執行的地方,Kubernetes 支援 Docker、rkt 等容器 Runtime。 Node上執行的 Kubernetes 元件有 kubelet
、kube-proxy
和 Pod 網路
(例如 flannel)。
- kubelet:kubelet 是 Node 的 agent,當 Scheduler 確定在某個 Node 上執行 Pod 後,會將 Pod 的具體配置資訊(image、volume 等)傳送給該節點的 kubelet,kubelet 根據這些資訊建立和執行容器,並向 Master 報告執行狀態。
- kube-proxy:service 在邏輯上代表了後端的多個 Pod,外界通過 service 訪問 Pod。service 接收到的請求是如何轉發到 Pod 的呢?這就是 kube-proxy 要完成的工作。每個 Node 都會執行 kube-proxy 服務,它負責將訪問 service 的 TCP/UPD 資料流轉發到後端的容器。如果有多個副本,kube-proxy 會實現負載均衡。
- Pod 網路:Pod 要能夠相互通訊,Kubernetes Cluster 必須部署 Pod 網路,flannel 是其中一個可選方案。
一張圖理解k8s:
通過例子理解k8s架構:
執行命令:
kubectl run httpd-app --image=httpd --replicas=2
等待應用部署完成檢視:
# kubectl get deployment
NAME READY UP-TO-DATE AVAILABLE AGE
httpd-app 2/2 2 2 31h
# kubectl get pod -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
httpd-app-f9ccf4675-mxd8d 1/1 Running 0 31h 172.18.100.2 192.168.20.203 <none> <none>
httpd-app-f9ccf4675-sdhcs 1/1 Running 0 31h 172.18.85.2 192.168.20.202 <none> <none>
Kubernetes 部署了 deployment httpd-app
,有兩個副本 Pod,分別執行在master和host2上
整個部署過程為:
- ① kubectl 傳送部署請求到 API Server。
- ② API Server 通知 Controller Manager 建立一個 deployment 資源。
- ③ Scheduler 執行排程任務,將兩個副本 Pod 分發到 master 和 host2。
- ④ master 和 host1 上的 kubectl 在各自的節點上建立並執行 Pod。
補充:
- ① 應用的配置和當前狀態資訊儲存在 etcd 中,執行 kubectl get pod 時 API Server 會從 etcd中讀取這些資料
- ② flannel 會為每個 Pod 都分配 IP。因為沒有建立 service,目前 kube-proxy 還沒參與進來。
重要概念
Pod
Pod 是 Kubernetes 的最小工作單元。每個 Pod 包含一個或多個容器。Pod 中的容器會作為一個整體被 Master 排程到一個 Node 上執行。
Kubernetes 引入 Pod 主要基於下面兩個目的:
- 可管理性:有些容器天生就是需要緊密聯絡,一起工作。Pod 提供了比容器更高層次的抽象,將它們封裝到一個部署單元中。Kubernetes 以 Pod 為最小單位進行排程、擴充套件、共享資源、管理生命週期。
- 通訊和資源共享:Pod 中的所有容器使用同一個網路 namespace,即相同的 IP 地址和 Port 空間。它們可以直接用 localhost 通訊。同樣的,這些容器可以共享儲存,當 Kubernetes 掛載 volume 到 Pod,本質上是將 volume 掛載到 Pod 中的每一個容器。
Pods 有兩種使用方式:
- 執行單一容器:one-container-per-Pod 是 Kubernetes 最常見的模型,這種情況下,只是將單個容器簡單封裝成 Pod。即便是隻有一個容器,Kubernetes 管理的也是 Pod 而不是直接管理容器。
- 執行多個容器:放到一個pod的這些容器聯絡必須 非常緊密,而且需要 直接共享資源
Controller
Kubernetes 通常不會直接建立 Pod,而是通過 Controller 來管理 Pod 的。Controller 中定義了 Pod 的部署特性,比如有幾個副本,在什麼樣的 Node 上執行等。為了滿足不同的業務場景,Kubernetes 提供了多種 Controller,包括 Deployment、ReplicaSet、DaemonSet、StatefuleSet、Job
等。
Deployment
Deployment 是最常用的 Controller,比如前面線上教程中就是通過建立 Deployment 來部署應用的。Deployment 可以管理 Pod 的多個副本,並確保 Pod 按照期望的狀態執行。
ReplicaSet
ReplicaSet 實現了 Pod 的多副本管理。使用 Deployment 時會自動建立 ReplicaSet,也就是說 Deployment 是通過 ReplicaSet 來管理 Pod 的多個副本,我們通常不需要直接使用 ReplicaSet。
DaemonSet
DaemonSet 用於每個 Node 最多隻執行一個 Pod 副本的場景。正如其名稱所揭示的,DaemonSet 通常用於執行 daemon。
StatefuleSet
StatefuleSet 能夠保證 Pod 的每個副本在整個生命週期中名稱是不變的。而其他 Controller 不提供這個功能,當某個 Pod 發生故障需要刪除並重新啟動時,Pod 的名稱會發生變化。同時 StatefuleSet 會保證副本按照固定的順序啟動、更新或者刪除。
Job
Job 用於執行結束就刪除的應用。而其他 Controller 中的 Pod 通常是長期持續執行。
Service
Deployment 可以部署多個副本,每個 Pod 都有自己的 IP,外界就是通過Service訪問這些副本的
Kubernetes Service 定義了外界訪問一組特定 Pod 的方式。Service 有自己的 IP 和埠,Service 為 Pod 提供了負載均衡。
Kubernetes 執行容器(Pod)與訪問容器(Pod)這兩項任務分別由 Controller 和 Service 執行。
Namespace
如果有多個使用者或專案組使用同一個 Kubernetes Cluster,如何將他們建立的 Controller、Pod 等資源分開呢?答案就是 Namespace。
Namespace 可以將一個物理的 Cluster 邏輯上劃分成多個虛擬 Cluster,每個 Cluster 就是一個 Namespace。不同 Namespace 裡的資源是完全隔離的。
Kubernetes 預設建立了兩個 Namespace。
# kubectl get namespace
NAME STATUS AGE
default Active 2d19h
kube-system Active 2d19h
- default :建立資源時如果不指定,將被放到這個 Namespace 中。
- kube-system :Kubernetes 自己建立的系統資源將放到這個 Namespace 中。