kubernetes 上手指南:前言
大家好,我叫謝偉,是一名程式設計師。
今天的主題:kubernetes 學習前言,主要和容器相關。
部署方案
容器技術誕生後,成為雲端計算領域的絕對主角,但容器本身價值並不大,任何網際網路領域都涉及到部署,容器編排才重要。創造docker 的dotCloud 的公司並沒有獲取到雲端計算領域的紅利,雖然之後也推出的自家的 docker swarm 應用於容器編排,相比設計理念更為先進的 kubernetes,存在更多的問題,事實上 k8s 已經成為容器編排領域的領頭羊。幾乎所有的網際網路公司,雲端計算公司都使用 k8s 用於容器編排。
簡單的說容器編排的意思是:將應用容器化,按照一套規則自動在節點按照使用者的需求部署。這套規則由k8s 規定,開發者應用容器化,按照規則編寫編排指令碼即可。
整體上 k8s設計理念先進,得益於 Google 領域內的多年實踐總結,儘管如此,對開發者而言,掌握 k8s 知識,卻有點複雜。
複雜體現在兩方面:
- 叢集部署
叢集部署有規格要求,如果你是初學者,想要親手部署這樣一套叢集服務,環境可能都沒有。基礎的容器元件拉取也可能是問題,不過這一情況正在好轉。
- 概念繁多
開發者需掌握 k8s 諸多的概念,另外得掌握編排指令碼語法約束,不過,只要肯花時間都可以掌握。
簡單的說 k8s 適用於複雜的部署,多節點,多應用,系統越複雜,上 k8s 排程起來更方便。簡單的系統,應用容器化,執行容器即可,如果多應用使用單節點部署方案 docker-compose 即可。
容器
容器技術給應用創造一個完全獨立的環境,可以跨平臺使用,我認為是每一個開發者需要掌握的技術之一。
如何使用容器技術?
- 開者專注自身業務需求,編寫程式碼
- 編寫映象製作指令碼,將應用打包
- 伺服器上拉取製作的映象
- 容器啟動,執行服務
容器技術主要包四大組成部分:
- 映象 image
- 容器 container
- 網路 network
- 資料卷 volume
何為映象:簡單的說,包含虛擬執行環境的檔案包,是一堆檔案的合集,服務在該系統之上能夠執行起來。docker 映象採用了分層架構。
何為容器:簡單的說,映象的執行狀態,用來隔離虛擬環境的基礎設施。主要包含:映象、執行環境、指令集
何為網路:網路是應用之間通訊的媒介。
何為資料卷:應用肯定會涉及到資料持久化操作,資料卷就是用於宿主機和容器之間共享或者持久化。
容器技術的實現: 得益於以下三點技術
- Namespace名稱空間 : 作用是隔離
- Control Groups控制組:作用是限制計算機資源的使用
- Union File System 聯合檔案系統:作用是實現不同目錄掛載到同一目錄
問題一: Namespace 怎麼就能做到隔離?
容器本質上是程式,Linux作業系統提供了 PID,Mount,Network 等 namespace,使被隔離的程式只能看到當前的環境狀態。
比方說 PID namespace,啟動容器執行命令,為什麼該程式的 PID 是 1 呢?
>> ps -ef | grep 1
root 1 0 0 14:08 ? 00:00:01 /go/src/github.com/wuxiaoxiaoshen/go-anything/go-anything
root 15 0 0 15:20 pts/0 00:00:00 bash
root 33 15 0 15:22 pts/0 00:00:00 ps -ef
root 34 15 0 15:22 pts/0 00:00:00 grep 1
複製程式碼
其中 /go/src/github.com/wuxiaoxiaoshen/go-anything/go-anything
是我自己的容器啟動時的命令。
主要原因是:Linux 建立程式可以指定 PID
int pid = clone(main_function,stack_size,CLONE_NEWPID | SIGCHLD,NULL);
複製程式碼
類似的其他也可以依靠對應的 namespace 技術做到隔離。
問題二:control Groups 怎麼就能夠現在計算機資源的使用了?
首先限制的資源包括:CPU,記憶體,磁碟,網路等。如果你經常使用 docker,一定會經常看到一些目錄: /sys/fs/cgroup
>> mount -t cgroup
cgroup on /sys/fs/cgroup/systemd type cgroup (rw,nosuid,nodev,noexec,relatime,xattr,name=systemd)
cgroup on /sys/fs/cgroup/blkio type cgroup (rw,blkio)
cgroup on /sys/fs/cgroup/memory type cgroup (rw,memory)
cgroup on /sys/fs/cgroup/cpu,cpuacct type cgroup (rw,cpu,cpuacct)
cgroup on /sys/fs/cgroup/net_cls,net_prio type cgroup (rw,net_cls,net_prio)
cgroup on /sys/fs/cgroup/freezer type cgroup (rw,freezer)
cgroup on /sys/fs/cgroup/pids type cgroup (rw,pids)
cgroup on /sys/fs/cgroup/hugetlb type cgroup (rw,hugetlb)
cgroup on /sys/fs/cgroup/devices type cgroup (rw,devices)
cgroup on /sys/fs/cgroup/perf_event type cgroup (rw,perf_event)
cgroup on /sys/fs/cgroup/rdma type cgroup (rw,rdma)
cgroup on /sys/fs/cgroup/cpuset type cgroup (rw,cpuset)
複製程式碼
以 CPU 為例,如何實現對資源的限制呢?
首先檢視我本機執行的容器:
>> docker ps --format "{{.ID}}: {{.Status}}"
81f4b0f829c9: Up 4 days
226749434f46: Up 4 days
3102306bf580: Up 4 days
複製程式碼
>> ls /sys/fs/cgroup/cpu/docker
drwxr-xr-x 2 root root 0 Dec 1 07:31 226749434f46cc4197a24c09e691536b679b372735f1197608bc9085c1d95d9f
drwxr-xr-x 2 root root 0 Nov 26 08:44 3102306bf58037012bd5d2b6f595ae00450125d4152ed53d2db71d35ab297439
drwxr-xr-x 2 root root 0 Nov 26 14:17 81f4b0f829c9558228691c979af188b30cfaec01dd78b97d90e95aff00cbfb99
-rw-r--r-- 1 root root 0 Dec 1 07:30 cgroup.clone_children
-rw-r--r-- 1 root root 0 Dec 1 07:30 cgroup.procs
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.stat
-rw-r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_all
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_percpu
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_percpu_sys
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_percpu_user
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_sys
-r--r--r-- 1 root root 0 Dec 1 07:30 cpuacct.usage_user
-rw-r--r-- 1 root root 0 Dec 1 07:30 cpu.cfs_period_us
-rw-r--r-- 1 root root 0 Dec 1 07:30 cpu.cfs_quota_us
-rw-r--r-- 1 root root 0 Dec 1 07:30 cpu.shares
-r--r--r-- 1 root root 0 Dec 1 07:30 cpu.stat
-rw-r--r-- 1 root root 0 Dec 1 07:30 notify_on_release
-rw-r--r-- 1 root root 0 Dec 1 07:30 tasks
>> cd 226749434f46cc4197a24c09e691536b679b372735f1197608bc9085c1d95d9f
-rw-r--r-- 1 root root 0 Dec 1 07:31 cgroup.clone_children
-rw-r--r-- 1 root root 0 Nov 26 14:06 cgroup.procs
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.stat
-rw-r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_all
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_percpu
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_percpu_sys
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_percpu_user
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_sys
-r--r--r-- 1 root root 0 Dec 1 07:31 cpuacct.usage_user
-rw-r--r-- 1 root root 0 Dec 1 07:31 cpu.cfs_period_us
-rw-r--r-- 1 root root 0 Dec 1 07:31 cpu.cfs_quota_us
-rw-r--r-- 1 root root 0 Dec 1 07:31 cpu.shares
-r--r--r-- 1 root root 0 Dec 1 07:31 cpu.stat
-rw-r--r-- 1 root root 0 Dec 1 07:31 notify_on_release
-rw-r--r-- 1 root root 0 Dec 1 07:31 tasks
複製程式碼
沒錯,docker 實現對資源的限制靠的是寫檔案的形式,即對類似這樣的檔案進行限制:假設:cpu.cfs_period_us(10000),cpu.cfs_quota_us(2000)表明只能使用到20 % 的CPU 資源。
cpu.cfs_period_us
cpu.cfs_quota_us
...
複製程式碼
問題三:聯合檔案系統是什麼意思?
將多個位置的不同目錄掛載到同一目錄下。
比如:
>> tree
├── A
│ ├── a
│ └── x
└── B
├── b
└── x
複製程式碼
掛載到 C 目錄下:
$ tree C
├── a
├── b
└── x
複製程式碼
當然實際的實現比我說的要複雜的多。docker 正是依靠這三種技術,使的可以為我們創造一個完全隔離的沙箱,這樣做的好處是:環境的一致性,方便部署。你會越來越少的問這樣一個問題:我本地可以執行啊?為什麼在伺服器上就不行。
Docker 架構
docker 採用典型的 C/S 架構,你安裝 docker 軟體。預設會在本機啟動一個守護程式 docker daemon , 同時提供一個命令列客戶端 docker cli . 你可以使用命令列操作包括:映象、容器等各種資源。
根據 docker 的四大組成部分,docker cli 的命令主要圍繞這四個命令展開:
- docker image // 操作映象
- docker container // 操作容器
- docker network // 操作網路
- docker volume // 操作資料卷
你可能會覺得命令列命令太多,怎麼辦?創造高頻使用環境即可,即:日常工作中頻繁的不斷的使用docker 即可。
製作映象
Docker Hub 是最大的映象託管平臺,作用是:1. 映象儲存 2. 映象分發。無數的開源軟體的官方映象託管在該平臺,使用者可以完全免費的從該平臺拉取映象,完成自己的任務。
那麼對於開發者如何製作自己的映象呢?
答案是:編寫 Dockerfile 檔案。
docker 公司對於製作映象,約束了一套語法規範,其實命令也就 10幾個。
先不談具體的命令是什麼,假設你自己開發了一套系統,沒有容器之前,你部署應用會執行什麼操作?
- 應用執行涉及依賴,你會提前在主機上安裝相應的依賴軟體
- 指定應用目錄
- 拷貝,將應用程式拷貝至主機,不管是本機直接拷貝還是程式碼託管平臺克隆程式碼,都算
- 應用訪問涉及埠開放,應用多了,你還得考慮埠會不會衝突不是?
- 應用啟動
這是不是大概的操作流程?
是的,dockerfile 將這一系列動作指令化。
舉個例子:我這邊自己寫了個服務,對外暴露的是 API,我現在想製作映象,我會怎麼做呢?
FROM golang:1.13.4
MAINTAINER XieWei([email protected])
EXPOSE 8888 8081
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime;\
echo "Asia/Shanghai" > /etc/timezone;\
dpkg-reconfigure -f noninteractive tzdata
WORKDIR /go/src/github.com/wuxiaoxiaoshen/go-anything
RUN echo $PWD
COPY . /go/src/github.com/wuxiaoxiaoshen/go-anything
RUN apt-get update && apt-get install -q -y vim nginx git openssh-client cron && apt-get clean;\
go mod vendor;\
make remove;\
make prod;\
echo Succeed!
CMD ["bash","-c","/go/src/github.com/wuxiaoxiaoshen/go-anything/go-anything"]
複製程式碼
簡單的說:
- FORM 依賴的基礎映象,我這個服務是 Go 編寫的,依賴 Go 的執行環境,所以繼承官方基礎映象
- MAINTAINER 維護者,將被拋棄的命令,使用替代指令 LABEL
- EXPOSE 暴露埠,意思是容器會暴露8888,8081 兩個埠
- RUN 將一些命令傳送到終端執行,安裝一些依賴
- WORKDIR 指定目錄
- COPY 拷貝上下文內容至指定目錄
- CMD 容器啟動時執行的命令
dockerfile 檔案編寫並不用太複雜,就可以按照開發者的約束製作映象。非常便利。如果記不住命令,仍然建議自身創造高頻使用環境,在日常工作中,有意無意的多使用。
一般我會把製作好的映象直接推送至 Docker Hub,需要使用到再從 Docker Hub 上拉取,當然你需要先註冊個賬號。
多應用
還是我這個應用:go-anything,實質它是個 web 服務,為創造稍微複雜的系統,這個系統,我使用到了 MySQL, Redis,Kafka 等技術整合進來。
如果這些 MySQL,Redis, Kafka 等都選擇的是雲服務,go-anything 中指定相應的雲服務地址即可,相當於沒有外部依賴。當然我沒錢買雲服務,這些服務都選擇的是在本地啟動相應的容器,這麼說,這其實是個多應用的編排的問題。
如果是單節點或者測試環境,那麼我推薦使用 docker-compose 來連結和啟動多服務。我這個服務依賴於上面三個服務,這三個服務啟動之後,才能正確的執行服務。
那麼什麼是 docker-compose,簡單的說,是用 Python 編寫的命令列工具,用來定義和執行由多個容器組成的應用。它規定了一套語法規範,這些規範的關鍵字都和上文提到的容器相關。
就我這個應用,我怎麼編寫 docker-compose 呢?
version: "3"
services:
redis:
image: redis:latest
ports:
- 6379:6379
expose:
- 6379
container_name: redis_for_go_anything
command: redis-server --appendonly yes --requirepass "adminRedis"
networks:
- go-anything-network
volumes:
- data:/data
mysql:
image: mysql:latest
container_name: mysql_for_go_anything
networks:
- go-anything-network
command: --default-authentication-plugin=mysql_native_password
environment:
MYSQL_ROOT_PASSWORD: adminMysql
MYSQL_DATABASE: go-anything
MYSQL_USER: root
ports:
- 3306:3306
kafka:
image: index.docker.io/wurstmeister/kafka:latest
container_name: kafka_for_go_anything
ports:
- 9092:9092
environment:
KAFKA_OFFSETS_TOPIC_REPLIATION_FACTOR: 1
KAFKA_ADVERTISED_LISTENERS: "PLAINTEXT://127.0.0.1:9092"
KAFKA_LISTENERS: "PLAINTEXT://:9092"
KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
KAFKA_CREATE_TOPICS: "go-anything:20:1:compact"
KAFKA_LOG_DIRS: /kafka/kafka-logs
depends_on:
- zookeeper
networks:
- go-anything-network
volumes:
- data:/kafka/kafka-logs
zookeeper:
image: index.docker.io/wurstmeister/zookeeper:latest
container_name: zookeeper_for_go_anything
ports:
- 2181:2181
networks:
- go-anything-network
networks:
go-anything-network:
driver: bridge
volumes:
data: {}
複製程式碼
看上去稍微複雜點,其實可以劃分為四個部分:
version: 版本
services: 服務
volume: 資料卷
network: 網路
複製程式碼
其中最重要的是 services,像 network,volume 這些,不寫都可以使用預設的,但我一般都會寫,顯式化得定義 network 和 volume。
單獨抽出 redis 服務來看,其實是關於容器的操作:
redis:
image: redis:latest
ports:
- 6379:6379
expose:
- 6379
container_name: redis_for_go_anything
command: redis-server --appendonly yes --requirepass "adminRedis"
networks:
- go-anything-network
volumes:
- data:/data
複製程式碼
redis: 服務的名稱,自定義 image: 映象地址和版本 ports: 主機和容器埠對映 expose: 暴露容器埠 container_name: 容器自定義名稱 command: 容器啟動時命令 networks: 指定網路 volume: 資料卷定義
這些比如埠,執行命令等,開發者有時候記不住,怎麼辦? 我也記不住,都是檢視 docker hub 上相應的檔案說明,畢竟這是別人製作的映象,不看檔案,怎麼知道怎麼做。
編排好上文三個服務:MySQL,Redis,Kafka,怎麼一鍵讓服務執行?
>> docker-compose -f docker-compose.yml up -d
複製程式碼
可以命名為 docker-compose.yml,也可以不這樣命名。不指定檔案,自動會在當前目錄下尋找 docker-compose.yml。docker-compose 還提供了其他命令,絕大多數也是用來操作映象和容器的。
假設我把我的應用已經推送至 docker hub 上:wuxiaoshen/go-anything:v0.19
我現在應該怎麼啟動我的服務呢?
>> docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
wuxiaoshen/go-anything v0.19 1788461daca4 30 hours ago 1.43GB
>> docker run --name go-anything-2 --link mysql_for_go_anything --link redis_for_go_anything --link kafka_for_go_anything --net go-anything_go-anything-network -p 8081:8888 -d 1788461daca4
複製程式碼
其中:
--name 指定容器名稱
--link 連結服務
-p 埠對映
--net 指定網路
-d 後臺執行
複製程式碼
為什麼要 --link 服務呢?因為我專案的配置檔案是這樣的:
mysql:
port: "3306"
db: go-anything
user: root
passwd: adminMysql
host: mysql
redis:
port: "6379"
auth: adminRedis
host: redis
kafka:
broker: kafka:9092
topic: go-anything
consumerGroup: go-anything-consumer-group
複製程式碼
其中對應的 host 和 docker-compose.yml 對應的services 中命名的服務名稱一致。這樣可以直接使用服務名稱代替 host,而不用顯式的指定主機地址(127.0.0.1)
這樣我們就啟動了多應用:
>> docker ps --format "{{.ID}}: {{.Command}}: {{.Ports}}"
c7d820406af2: "bash -c /go/src/git…": 8081/tcp,0.0.0.0:8081->8888/tcp
d197ec955421: "start-kafka.sh": 0.0.0.0:9092->9092/tcp
50cdda796143: "/bin/sh -c '/usr/sb…": 22/tcp,2888/tcp,3888/tcp,0.0.0.0:2181->2181/tcp
3cb75161e860: "docker-entrypoint.s…": 0.0.0.0:3306->3306/tcp,33060/tcp
46d16bd9837e: "docker-entrypoint.s…": 0.0.0.0:6379->6379/tcp
複製程式碼
啟動服務中指定了對映埠:將宿主機的 8081 和 容器內的 8888 的埠相互對映,而應用指定的埠是:8888,這樣本機訪問 8081 埠可以訪問到容器 8888 埠。
# 專案內指定埠
router.Run("8888")
複製程式碼
測試下:
- 先檢視應用啟動日誌
>> docker logs -f c7d820406af2
2019/12/01 14:08:46 Env: service
2019/12/01 14:08:46 Web Start...
2019/12/01 14:08:46 Step 0: Configs...
2019/12/01 14:08:46 Step 1: Mysql...
2019/12/01 14:08:46 configs: LoadConfigs: key: service.mysql
2019/12/01 14:08:46 Keys: MySQL: map[string]interface {}{"db":"go-anything","host":"mysql","passwd":"adminMysql","port":"3306","user":"root"}
2019/12/01 14:08:46 root:adminMysql@tcp(mysql:3306)/go-anything?charset=utf8&parseTime=True&loc=Local
2019/12/01 14:08:47 Step 2: Redis...
2019/12/01 14:08:47 configs: LoadConfigs: key: service.redis
2019/12/01 14:08:47 Keys: Redis: map[string]interface {}{"auth":"adminRedis","host":"redis","port":"6379"}
2019/12/01 14:08:47 Step 3: Kafka...
2019/12/01 14:08:47 configs: LoadConfigs: key: service.kafka
2019/12/01 14:08:47 Keys: Kafka: map[string]interface {}{"broker":"kafka:9092","consumergroup":"go-anything-consumer-group","topic":"go-anything"}
2019/12/01 14:08:47 Step 4: Email...
2019/12/01 14:08:47 configs: LoadConfigs: key: service.email
// 省略
[DBUG] 2019/12/01 14:08 GET: /v1/api/status/health -> github.com/wuxiaoxiaoshen/go-anything/src/Healthz.healthZHandler() and 2 more
// 省略
[DBUG] 2019/12/01 14:08 Application: running using 1 host(s)
[DBUG] 2019/12/01 14:08 Host: addr is :8888
[DBUG] 2019/12/01 14:08 Host: virtual host is 0.0.0.0:8888
[DBUG] 2019/12/01 14:08 Host: register startup notifier
[DBUG] 2019/12/01 14:08 Host: register server shutdown on interrupt(CTRL+C/CMD+C)
Now listening on: http://0.0.0.0:8888
Application started. Press CTRL+C to shut down.
複製程式碼
- 呼叫下介面:/v1/api/status/health
>> curl http://127.0.0.1:8081/v1/api/status/health | jq .
{
"code": 200,"data": "pong","status": "ok"
}
複製程式碼
可以看到完成了多應用的啟動部署。
可以看到單節點上部署多應用,其實 docker-compose 是個很好的工具,那假如多節點呢?docker-compose 完全無用武之地啊。
之後我會仍然使用這個示例在 k8s 叢集上進行啟動部署。
下期:k8s 基本概念。
程式碼:go-anything
<全文完>