kubernetes 1.2版彈性伸縮HPA
一:前言
在kubernetes中,Pod是最基礎的排程單位,多個pod 可以組成一個集合,這個集合向外提供服務。這時候,我們需要以下兩種情形需要關注:
1)集合中的Pod可能會由於某種原因Fail,這時候需要某種機制能夠建立新的Pod以確保有足夠數量的Pod在執行。
2)Pod 的個數由訪問請求決定。即當前例項個數不足以滿足訪問請求時,需要增加例項個數,反之,需要通過某種策略減少例項數。
如果人工來實時監控例項的執行狀態,手動啟動新的pod以替代fail的pod,監控例項的負載情況,手動建立或者刪除pod,這個工作繁瑣且工作量大,好在kubernetes已經有相應的機制來應對這種變化。
本篇文章主要介紹在k8s1.2版本下,HPA基於CPU的彈性伸縮。
二:部署目標
- 執行一個php-apache例項
- 建立一個基於CPU彈性的HPA資源
- 對例項進行壓測
- 對HPA進行驗證
三:HPA原理圖 ##
Kubernetes有一個HPA(Horizontal Pod Autoscaler)的資源,可以實現基於CPU使用率的Pod自動伸縮的功能。HPA基於Master Node上的kube-controller-manager服務啟動引數–horizontal-pod-autoscaler-sync-period定義的時長(預設為30秒),週期性的檢測Pod的CPU使用率(需要事先安裝heapster)。如果需要設定–horizontal-pod-autoscaler-sync-period可以在Master Node上的/etc/default/kube-controller-manager中修改。
四:部署步驟
建立php-apache例項的RC
通過kubectl create -f php-rc.yaml檔案建立RC.
檔案內容如下:
apiVersion: v1
kind: ReplicationController
metadata:
name: php-apache
spec:
replicas: 1
template:
metadata:
name: php-apache
labels:
app: php-apache
spec:
containers:
- name: php-apache
image: gcr.io /google_containers/hpa-example:latest
imagePullPolicy: IfNotPresent
resources:
requests:
cpu: 200m
ports:
- containerPort: 80
建立php-apache例項的SVC
通過kubectl create -f php-svc.yaml檔案建立SVC.檔案內容如下:
apiVersion: v1
kind: Service
metadata:
name: php-apache
labels:
k8s-app: php-apache
spec:
ports:
# The port that this service should serve on.
- port: 80
# Label keys and values that must match in order to receive traffic for this service.
selector:
app: php-apache
- 建立HPA
通過kubectl create -f hpa-example.yaml檔案建立HPA.檔案內容如下:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: php-apache
namespace: default
spec:
scaleTargetRef:
apiVersion: v1
kind: ReplicationController
name: php-apache
minReplicas: 1
maxReplicas: 10
targetCPUUtilizationPercentage: 50
檢視建立的hpa,結果發現當前的CPU使用率CURRENT顯示為waiting.
# kubectl get hpa php-apache
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% <waiting> 1 10 8s
注意:有可能是由於heapster元件沒有安裝,也有可能是資料沒有檢測到,預設heapster採集時間為1分,需要稍等一會看一下狀態。
# kubectl get hpa php-apache
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% 0% 1 10 60s
如果要檢視hpa的事件,kubectl describe hpa php-apache ,會出這些錯誤資訊 MetricsNotAvailableYet unable to get metrics for resource cpu: no metrics returned from heapster。
這種錯誤資訊需要稍等一會多看幾次,分析一下是什麼原因導致的,有可能只是時間差導致的。
對php-apache進行壓力測試
kubectl run -i --tty load-generator --image=busybox:latest /bin/sh #進入容器後執行一下命令
while true; do wget -q -O- http://php-apache.default.svc.cluster.local; done
壓測幾分鐘後檢視hpa狀態,如果cpu壓力超過了設定的閾值,可以停止壓測。
檢視hpa狀態:
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% 200% 1 10 60s
狀態已經超過了閾值,此時檢視pod,pod的數量已經增加了。
root@ansible:/data/hpa/k81.2/autoscaling_v1/cpu/rc# kubectl get pods
NAME READY STATUS RESTARTS AGE
load-generator-535521892-scxsg 1/1 Running 0 6d
ache-1czu1 1/1 Running 0 6d
php-apache-a4g4x 1/1 Running 0 6d
php-apache-d2nn1 1/1 Running 0 6d
php-apache-epnpf 1/1 Running 0 6d
php-apache-ffuhk 1/1 Running 0 6d
php-apache-g78ms 1/1 Running 0 6d
php-apache-nglin 1/1 Running 0 6d
php-apache-sxz5y 1/1 Running 0 7d
php-apache-t7s8e 1/1 Running 0 6d
php-apache-v7zxm 1/1 Running 0 6d
當停止壓力測試之後,過一段時間,Pod數量又會恢復到1。
四:總結
- 上述操作也可以通過kubectl命令執行,但是我測試是有問題的,如果想要通過命令可以參考官方文件HPA官方文件
- 在kubernetes1.2中伸縮Deployment也有些許問題,可以在自行驗證
- HPA其他指標的支援按照官方文件v1.6.1中已經支援了。記憶體的我驗證過後續文章為介紹。