1. 程式人生 > 實用技巧 >Dockerfile多階段構建

Dockerfile多階段構建

Docker 17.05版本以後,新增了Dockerfile多階段構建。所謂多階段構建,實際上是允許一個Dockerfile 中出現多個 FROM 指令。這樣做有什麼意義呢?

老版本Docker中為什麼不支援多個 FROM 指令

在17.05版本之前的Docker,只允許Dockerfile中出現一個FROM指令,這得從映象的本質說起。

你可以簡單理解Docker的映象是一個壓縮檔案,其中包含了你需要的程式和一個檔案系統。其實這樣說是不嚴謹的,Docker映象並非只是一個檔案,而是由一堆檔案組成,最主要的檔案是

Dockerfile 中,大多數指令會生成一個層,比如下方的兩個例子:

# 示例一,foo 映象的Dockerfile
# 基礎映象中已經存在若干個層了
FROM ubuntu:16.04

# RUN指令會增加一層,在這一層中,安裝了 git 軟體
RUN apt-get update \
  && apt-get install -y --no-install-recommends git \
  && apt-get clean \
  && rm -rf /var/lib/apt/lists/*
Copy
# 示例二,bar 映象的Dockerfile
FROM foo

# RUN指令會增加一層,在這一層中,安裝了 nginx
RUN apt-get update \
  && apt-get install -y --no-install-recommends nginx \
  && apt-get clean \
  && rm -rf /var/lib/apt/lists/*
Copy

假設基礎映象 ubuntu:16.04 已經存在5層,使用第一個Dockerfile打包成映象 foo,則foo有6層,又使用第二個Dockerfile打包成映象bar,則bar中有7層。

如果 ubuntu:16.04 等其他映象不算,如果系統中只存在 foo 和 bar 兩個映象,那麼系統中一共儲存了多少層呢?

是7層,並非13層,這是因為,foo和bar共享了6層。層的共享機制可以節約大量的磁碟空間和傳輸頻寬,比如你本地已經有了foo映象,又從映象倉庫中拉取bar映象時,只拉取本地所沒有的最後一層就可以了,不需要把整個bar映象連根拉一遍。但是層共享是怎樣實現的呢?

原來,Docker映象的每一層只記錄檔案變更,在容器啟動時,Docker會將映象的各個層進行計算,最後生成一個檔案系統,這個被稱為 聯合掛載。對此感興趣的話可以進一步瞭解一下 AUFS

Docker的各個層是有相關性的,在聯合掛載的過程中,系統需要知道在什麼樣的基礎上再增加新的檔案。那麼這就要求一個Docker映象只能有一個起始層,只能有一個根。所以,Dockerfile中,就只允許一個 FROM 指令。因為多個 FROM 指令會造成多根,則是無法實現的。但為什麼 Docker 17.05 版本以後允許 Dockerfile支援多個 FROM 指令了呢,莫非已經支援了多根?

多個 FROM 指令的意義

多個 FROM 指令並不是為了生成多根的層關係,最後生成的映象,仍以最後一條 FROM 為準,之前的 FROM 會被拋棄,那麼之前的FROM 又有什麼意義呢?

每一條 FROM 指令都是一個構建階段,多條 FROM 就是多階段構建,雖然最後生成的映象只能是最後一個階段的結果,但是,能夠將前置階段中的檔案拷貝到後邊的階段中,這就是多階段構建的最大意義。

最大的使用場景是將編譯環境和執行環境分離,比如,之前我們需要構建一個Go語言程式,那麼就需要用到go命令等編譯環境,我們的Dockerfile可能是這樣的:

# Go語言環境基礎映象
FROM golang:1.10.3

# 將原始碼拷貝到映象中
COPY server.go /build/

# 指定工作目錄
WORKDIR /build

# 編譯映象時,執行 go build 編譯生成 server 程式
RUN CGO_ENABLED=0 GOOS=linux GOARCH=amd64 GOARM=6 go build -ldflags '-w -s' -o server

# 指定容器執行時入口程式 server
ENTRYPOINT ["/build/server"]
Copy

基礎映象 golang:1.10.3 是非常龐大的,因為其中包含了所有的Go語言編譯工具和庫,而執行時候我們僅僅需要編譯後的 server 程式就行了,不需要編譯時的編譯工具,最後生成的大體積映象就是一種浪費。

使用多映象構建將程式編譯和映象打包分開,然後在構建步驟中編譯。

最後將編譯介面拷貝到映象中就行了,那麼Dockerfile的基礎映象並不需要包含Go編譯環境:

# 不需要Go語言編譯環境
FROM scratch

# 將編譯結果拷貝到容器中
COPY server /server

# 指定容器執行時入口程式 server
ENTRYPOINT ["/server"]
Copy

提示: scratch 是內建關鍵詞,並不是一個真實存在的映象。 FROM scratch 會使用一個完全乾淨的檔案系統,不包含任何檔案。 因為Go語言編譯後不需要執行時,也就不需要安裝任何的執行庫。 FROM scratch 可以使得最後生成的映象最小化,其中只包含了 server 程式。

在 Docker 17.05版本以後,就有了新的解決方案,直接一個Dockerfile就可以解決:

# 編譯階段
FROM golang:1.10.3

COPY server.go /build/

WORKDIR /build

RUN CGO_ENABLED=0 GOOS=linux GOARCH=amd64 GOARM=6 go build -ldflags '-w -s' -o server

# 執行階段
FROM scratch

# 從編譯階段的中拷貝編譯結果到當前映象中
COPY --from=0 /build/server /

ENTRYPOINT ["/server"]
Copy

這個 Dockerfile 的玄妙之處就在於 COPY 指令的 --from=0 引數,從前邊的階段中拷貝檔案到當前階段中,多個FROM語句時,0代表第一個階段。除了使用數字,我們還可以給階段命名,比如:

# 編譯階段 命名為 builder
FROM golang:1.10.3 as builder

# ... 省略

# 執行階段
FROM scratch

# 從編譯階段的中拷貝編譯結果到當前映象中
COPY --from=builder /build/server /
Copy

更為強大的是,COPY --from 不但可以從前置階段中拷貝,還可以直接從一個已經存在的映象中拷貝。比如,

FROM ubuntu:16.04

COPY --from=quay.io/coreos/etcd:v3.3.9 /usr/local/bin/etcd /usr/local/bin/
Copy

我們直接將etcd映象中的程式拷貝到了我們的映象中,這樣,在生成我們的程式映象時,就不需要原始碼編譯etcd了,直接將官方編譯好的程式檔案拿過來就行了。

有些程式要麼沒有apt源,要麼apt源中的版本太老,要麼乾脆只提供原始碼需要自己編譯,使用這些程式時,我們可以方便地使用已經存在的Docker映象作為我們的基礎映象。但是我們的軟體有時候可能需要依賴多個這種檔案,我們並不能同時將 nginx 和 etcd 的映象同時作為我們的基礎映象(不支援多根),這種情況下,使用 COPY --from 就非常方便實用了。