Kubernetes27--彈性伸縮--HPA實踐

阿新 • • 發佈：2018-12-26

參考連結https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/

Horizontal Pod Autoscaler automatically scales the number of pods in a replication controller, deployment or replica set based on observed CPU utilization (or, with beta support, on some other, application-provided metrics).

首先構建一個基礎映象用來進行開方計算，會消耗大量的cpu資源

準備index.php

[[email protected] hpa]# cat index.php 
<?php
  $x = 0.0001;
  for ($i = 0; $i <= 1000000; $i++) {
    $x += sqrt($x);
  }
  echo "OK!";
?>

準備apache基礎映象dockerfile檔案

[[email protected] hpa]# cat Dockerfile 
FROM php:5-apache
ADD index.php /var/www/html/index.php
RUN chmod a+rx index.php

構建映象

啟動容器限制cpu=200m 開放80埠

kubectl run php-apache --image=chenwenkai123456/hpa-example --requests=cpu=200m --expose --port=80

建立hpa策略 cpu利用率閾值50% 副本數量在1--10之間

kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10

kubectl get hpa

kubectl get deployment php-apache

檢視當前hpa情況

[[email protected] hpa]# kubectl get hpa
NAME         REFERENCE               TARGETS         MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   <unknown>/50%   1         10        0          7s
[[email protected] hpa]# kubectl get deployment php-apache
NAME         DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
php-apache   1         1         1            1           5m40s

使用v1 CPU利用率來自動控制

可以直接使用docker hub映象

docker pull pilchard/hpa-example

使用yaml方式來部署php服務

[[email protected] hpa]# cat php-svc.yaml 
apiVersion: extensions/v1beta1  
kind: Deployment  
metadata:  
  name: hpa-ds
spec:  
  replicas: 1
  template:
    metadata:
      labels:
        app: hpa-ds
    spec:
      containers:
      - name: hps-ds
        image: pilchard/hpa-example
        ports:
        - containerPort: 80
        resources:  
          limits:  
            cpu: 0.2  
            memory: 64Mi
---
apiVersion: v1  
kind: Service  
metadata:  
  name: hpa-svc
  labels:
    app: hpa-ds
spec:  
  ports:
  - port: 80
    targetPort: 80
    nodePort: 30964
  type: NodePort
  selector:
    app: hpa-ds

定義HPA物件

[[email protected] hpa]# cat hpa.yaml 
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: extensions/v1beta1
    kind: Deployment
    name: hpa-ds
  minReplicas: 1
  maxReplicas: 10
  targetCPUUtilizationPercentage: 50

訪問php service暴露的NodePort

while true; do wget -q -O- http://192.168.1.16:30964; done

觀察HPA的策略變化

初始時cpu利用率叢集數量1

[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   0%/50%    1         10        1          25s

併發訪問cpu以及叢集數量的變化

[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   55%/50%   1         10        2          5m49s

[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   32%/50%   1         10        3          6m43s

[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   59%/50%   1         10        4          7m39s

停止訪問時

[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   0%/50%    1         10        4          12m
[[email protected] ~]# kubectl get hpa
NAME         REFERENCE           TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
my-app-hpa   Deployment/hpa-ds   0%/50%    1         10        1          15m

可知當併發訪問增加時，HPA通過不斷調整叢集數量使得叢集cpu利用率維持在50%左右。

使用v2 更多指標以及自定義指標來控制

獲取v2版本的yaml檔案

kubectl get hpa.v2beta2.autoscaling -o yaml > /tmp/hpa-v2.yaml

v1版本cpu利用率

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: extensions/v1beta1
    kind: Deployment
    name: hpa-ds
  minReplicas: 1
  maxReplicas: 10
  targetCPUUtilizationPercentage: 50

v2版本自定義指標

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50

新增metrics標籤 type=Resource name=cpu type=Utilization

type可以選擇Pods以及Object物件

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        kind: AverageUtilization
        averageUtilization: 50
  - type: Pods
    pods:
      metric:
        name: packets-per-second
      targetAverageValue: 1k
  - type: Object
    object:
      metric:
        name: requests-per-second
      describedObject:
        apiVersion: extensions/v1beta1
        kind: Ingress
        name: main-route
      target:
        kind: Value
        value: 10k

Then, your HorizontalPodAutoscaler would attempt to ensure that each pod was consuming roughly 50% of its requested CPU, serving 1000 packets per second, and that all pods behind the main-route Ingress were serving a total of 10000 requests per second

檢視日誌

[[email protected] ~]# kubectl describe hpa php-apache
Name:                                                  php-apache
Namespace:                                             default
Labels:                                                <none>
Annotations:                                           <none>
CreationTimestamp:                                     Tue, 18 Dec 2018 15:48:43 +0800
Reference:                                             Deployment/hpa-ds
Metrics:                                               ( current / target )
  resource cpu on pods  (as a percentage of request):  0% (1m) / 50%
Min replicas:                                          1
Max replicas:                                          10
Deployment pods:                                       1 current / 1 desired
Conditions:
  Type            Status  Reason            Message
  ----            ------  ------            -------
  AbleToScale     True    ReadyForNewScale  recommended size matches current size
  ScalingActive   True    ValidMetricFound  the HPA was able to successfully calculate a replica count from cpu resource utilization (percentage of request)
  ScalingLimited  True    TooFewReplicas    the desired replica count is increasing faster than the maximum scale rate
Events:           <none>

Kubernetes27--彈性伸縮--HPA實踐

參考連結https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/ Horizontal Pod Autoscaler automatically scales the number

Kubernetes29--彈性伸縮--HPA原始碼--控制演算法分析2

HPA執行控制演算法，根據設定的指標計算當前需要的副本數量 func (a *HorizontalController) reconcileAutoscaler(hpav1Shared *autoscalingv1.HorizontalPodAutoscaler, key string) err

Kubernetes28--彈性伸縮--HPA原始碼--控制演算法分析1

程式碼位置 kubernetes/pkg/controller/podautoscaler/horizontal.go HPA工作機制：構建HorizontalController，啟動Run方法 func (a *HorizontalController) Ru

Kubernetes26--彈性伸縮--HPA原始碼--HPA執行過程

HPA由HPAController控制實現，啟動程式碼 kubernetes/cmd/kube-controller-manager/app/controllermanager.go func NewControllerInitializers(loopMode Cont

Kubernetes25--彈性伸縮--HPA原始碼--HorizontalController構建

HPA可以根據一定的效能指標自動監測以及控制叢集的數量，使其滿足一定的預定條件。預設使用cpu利用率來控制叢集數量動態變化，同時也可以使用custom metrics來自定義指標。HPA支援的資源型別有replication controlle

kubernetes 1.6版以上1.8版以下彈性伸縮HPA-Memory

一：前言在kubernetes中，Pod是最基礎的排程單位，多個pod 可以組成一個集合，這個集合向外提供服務。這時候，我們需要以下兩種情形需要關注： 1）集合中的Pod可能會由於某種原因Fail，這時候需要某種機制能夠建立新的Pod以確保有足夠數量的Po

kubernetes 1.2版彈性伸縮HPA

一：前言在kubernetes中，Pod是最基礎的排程單位，多個pod 可以組成一個集合，這個集合向外提供服務。這時候，我們需要以下兩種情形需要關注：1）集合中的Pod可能會由於某種原因Fail，這時候需要某種機制能夠建立新的Pod以確保有足夠數量的Pod在執行。2）Pod

Kubernetes彈性伸縮全場景解析（三） - HPA實踐手冊

前言在上一篇文章中，給大家介紹和剖析了HPA的實現原理以及演進的思路與歷程。在本文中，我們會為大家講解如何使用HPA以及一些需要注意的細節。 autoscaling/v1實踐 v1的模板可能是大家平時見到最多的也是最簡單的，v1版本的HPA只支援一種指標 —— CPU。傳統意義上，彈性伸縮最少也會支

Kubernetes彈性伸縮全場景解讀（二） - HPA的原理與演進

前言在上一篇文章中，我們介紹了在Kubernetes在處理彈性伸縮時的設計理念以及相關元件的佈局，在今天這篇文章中，會為大家介紹在Kubernetes中彈性伸縮最常用的元件HPA（Horizontal Pod Autoscaler）。HPA是通過計算Pod的實際工作負載進行重新容量規劃的元件，在資源池符合

【Kubernetes】最佳實踐3：服務部署與彈性伸縮

作者：彭靖田在Kubernetes的世界中，一切服務都是跑在容器中的，最簡單的容器組是Pod。基於現實世界中的具體任務，Kubernetes抽象了更高階的容器組，如：ReplicaSet、Deployment、Job等。對於Web型別的長週期服務來說，重點考察兩個需求：

Kubernetes 彈性伸縮全場景解讀（二）- HPA 的原理與演進

前言在上一篇文章 Kubernetes 彈性伸縮全場景解析（一）：概念延伸與元件佈局中，我們介紹了在 Kubernetes 在

在騰訊雲容器服務 TKE 中利用 HPA 實現業務的彈性伸縮

# 在 TKE 上利用 HPA 實現業務的彈性伸縮 ## 概述 Kubernetes Pod 水平自動擴縮（Horizontal Pod Autoscaler，以下簡稱 HPA）可以基於 CPU 利用率、記憶體利用率和其他自定義的度量指標自動擴縮 Pod 的副本數量，以使得工作負載服務的整體度量水平與使用

實現IT服務彈性伸縮的利器

automation 運維自動化自動化交付隨著互聯網業務快速持續增長，IT資源使用量按需變化成為常態，這就要求信息部門能快速響應資源使用的變化要求，對運維提出不小挑戰。比如電商、在線教育等企業經常推出一些秒殺、搶紅包活動，在特定時間段對資源的利用處於高峰期，之後基本處於空閑。幾年前，我們從申請采購到應用部署

雲計算之路-阿裏雲上：彈性伸縮無服務器可彈，已有服務器無兵可援

cit spec -h ebs request sca 天上 chan binding 活動起因： A scheduled task executes scaling rule "eBsJ2veNkwJkcGinmICVH1Q", changing the Total

如何通過Rancher webhook微服務實現Service/Host的彈性伸縮

docker 容器 kubernetes 微服務概述結合大家CICD的應用場景，本篇Blog旨在介紹如何通過Rancher的webhook微服務來實現Service/Host的彈性伸縮。流程介紹Service Scale創建example服務對象。創建service scale webhoo

京東618：Docker扛大旗，彈性伸縮成重點 (2015-06-23)

目前 ati 提升 2015年如何 vlan 才會擴容消息隊列不知不覺中，年中的618和年終的11.11已經成為中國電商的兩大促銷日，當然，這兩天也是一年中系統訪問壓力最大的兩天。對於京東而言，618更是這一年中最大的一次考試，考點是系統的擴展性、穩定性、容災能力、

阿裏雲ACP筆記-彈性伸縮

acp彈性伸縮（Auto Scaling）功能：1、根據業務需求橫向擴展ECS實例的容量，即自動增加和減少ECS實例 1）定時模式 2）動態模式2、支持SLB負載均衡配置3、支持RDS訪問白名單Scaling Group伸縮組，是具有相同應用場景的ECS實例的集合。Scaling COnfiguratio

CSS3 彈性伸縮布局

CSS3 彈性伸縮布局 CSS3 提供一種嶄新的布局方式：Flexbox 布局，即彈性伸縮布局模型(Flexible Box)。用來提供一個更加有效的方式實現響應式布局。但是用於這個布局方式還處於 W3C 的草案階段，並且它還分為舊版本、新版本以及混合過渡版本三種不同的編碼方式。在發展中，可能還

深入玩轉K8S之業務彈性伸縮和滾動更新操作（一）

nginx 副本 mil 容器 history 博客 limit 新的 ima 在實際應用場景中避免不了因為業務的壓力而增加容器數量以及業務應用版本叠代更新，那麽本篇文章我們來學習下簡單的業務彈性伸縮、滾動更新操作，滾動操作的好處在於零停機更新，也就是說每次更新一小部分副本

AutoScaling 彈性伸縮附加與分離RDS實例

完成一次 new pid 全部社區 ppa 線數據 lin 阿裏雲彈性伸縮服務（AutoScaling）推出新功能：AttachDBInstances和DetachDBInstances。新功能使得您可以自由的對伸縮組附加和移除Rds實例。本文將為您介紹如何將 Rds

Kubernetes27--彈性伸縮--HPA實踐

使用v1 CPU利用率來自動控制

使用v2 更多指標以及自定義指標來控制

相關推薦