理解Docker的多阶段镜像构建
Docker技术从 2013年诞生 到目前已经4年有余了。对于已经接纳和使用 Docker技术 在日常开发工作中的开发者而言,构建 Docker镜像 已经是家常便饭。但这是否意味着Docker的image构建机制已经相对完美了呢?不是的,Docker官方依旧在持续优化镜像构建机制。这不,从今年发布的 Docker 17.05版本 起,Docker开始支持容器镜像的 多阶段构建(multi-stage build) 了。
什么是 镜像多阶段构建 呢?直接给出概念定义太突兀,这里先卖个关子,我们先从日常开发中用到的镜像构建的方式和所遇到的镜像构建的问题说起。
一、同构的镜像构建
我们在做镜像构建时的一个常见的场景就是:应用在开发者自己的开发机或服务器上直接编译,编译出的二进制程序再打入镜像。这种情况一般要求编译环境与镜像所使用的base image是兼容的,比如说:我在 Ubuntu 14.04 上编译应用,并将应用打入基于 ubuntu系列base image 的镜像。这种构建我称之为“同构的镜像构建”,因为应用的编译环境与其部署运行的环境是兼容的:我在Ubuntu 14.04下编译出来的应用,可以基本无缝地在基于ubuntu:14.04及以后版本base image镜像(比如:16.04、16.10、17.10等)中运行;但在不完全兼容的base image中,比如 centos 中就可能会运行失败。
1、同构镜像构建举例
这里举个同构镜像构建的例子(后续的章节也是基于这个例子的),注意:我们的编译环境为 Ubuntu 16.04 x86_64虚拟机、Go 1.8.3和docker 17.09.0-ce 。
我们用一个Go语言中最常见的http server作为例子:
// github.com/bigwhite/experiments/multi_stage_image_build/isomorphism/httpserver.go package main import ( "net/http" "log" "fmt" ) func home(w http.ResponseWriter, req *http.Request) { w.Write([]byte("Welcome to this website!\n")) } func main() { http.HandleFunc("/", home) fmt.Println("Webserver start") fmt.Println(" -> listen on port:1111") err := http.ListenAndServe(":1111", nil) if err != nil { log.Fatal("ListenAndServe:", err) } }
编译这个程序:
# go build -o myhttpserver httpserver.go # ./myhttpserver Webserver start -> listen on port:1111
这个例子看起来很简单,也没几行代码,但背后Go net/http包在底层做了大量的事情,包括很多系统调用,能够反映出应用与操作系统的“耦合”,这在后续的讲解中会体现出来。接下来我们就来为这个程序构建一个docker image,并基于这个image来启动一个myhttpserver容器。我们选择ubuntu:14.04作为base image:
// github.com/bigwhite/experiments/multi_stage_image_build/isomorphism/Dockerfile From ubuntu:14.04 COPY ./myhttpserver /root/myhttpserver RUN chmod +x /root/myhttpserver WORKDIR /root ENTRYPOINT ["/root/myhttpserver"]
执行构建:
# docker build -t myrepo/myhttpserver:latest . Sending build context to Docker daemon 5.894MB Step 1/5 : FROM ubuntu:14.04 ---> dea1945146b9 Step 2/5 : COPY ./myhttpserver /root/myhttpserver ---> 993e5129c081 Step 3/5 : RUN chmod +x /root/myhttpserver ---> Running in 104d84838ab2 ---> ebaeca006490 Removing intermediate container 104d84838ab2 Step 4/5 : WORKDIR /root ---> 7afdc2356149 Removing intermediate container 450ccfb09ffd Step 5/5 : ENTRYPOINT /root/myhttpserver ---> Running in 3182766e2a68 ---> 77f315e15f14 Removing intermediate container 3182766e2a68 Successfully built 77f315e15f14 Successfully tagged myrepo/myhttpserver:latest # docker images REPOSITORY TAG IMAGE ID CREATED SIZE myrepo/myhttpserver latest 77f315e15f14 18 seconds ago 200MB # docker run myrepo/myhttpserver Webserver start -> listen on port:1111
以上是最基本的image build方法。
接下来,我们可能会遇到如下需求:
* 搭建一个Go程序的构建环境有时候是很耗时的,尤其是对那些依赖很多第三方开源包的Go应用来说,下载包就需要很长时间。我们最好将这些易变的东西统统打包到一个用于Go程序构建的builder image中;
* 我们看到上面我们构建出的myrepo/myhttpserver image的SIZE是200MB,这似乎有些过于“庞大”了。虽然每个主机node上的docker有cache image layer的能力,但我们还是希望能build出更加精简短小的image。
2、借助golang builder image
Docker Hub上提供了一个带有go dev环境的官方 golang image repository ,我们可以直接使用这个golang builder image来辅助构建我们的应用image;对于一些对第三方包依赖较多的Go应用,我们也可以以这个golang image为base image定制我们自己的专用builder image。
我们基于golang:latest这个base image构建我们的golang-builder image,我们编写一个Dockerfile.build用于build golang-builder image:
// github.com/bigwhite/experiments/multi_stage_image_build/isomorphism/Dockerfile.build FROM golang:latest WORKDIR /go/src COPY httpserver.go . RUN go build -o myhttpserver ./httpserver.go
在同目录下构建golang-builder image:
# docker build -t myrepo/golang-builder:latest -f Dockerfile.build . Sending build context to Docker daemon 5.895MB Step 1/4 : FROM golang:latest ---> 1a34fad76b34 Step 2/4 : WORKDIR /go/src ---> 2361824677d3 Removing intermediate container 01d8f4e9f0c4 Step 3/4 : COPY httpserver.go . ---> 1ff14bb0bc56 Step 4/4 : RUN go build -o myhttpserver ./httpserver.go ---> Running in 37a1b76b7b9e ---> 2ac5347bb923 Removing intermediate container 37a1b76b7b9e Successfully built 2ac5347bb923 Successfully tagged myrepo/golang-builder:latest REPOSITORY TAG IMAGE ID CREATED SIZE myrepo/golang-builder latest 2ac5347bb923 3 minutes ago 739MB
接下来,我们就基于golang-builder中已经build完毕的myhttpserver来构建我们最终的应用image:
# docker create --name appsource myrepo/golang-builder:latest # docker cp appsource:/go/src/myhttpserver ./ # docker rm -f appsource # docker rmi myrepo/golang-builder:latest # docker build -t myrepo/myhttpserver:latest .
这段命令的逻辑就是从基于golang-builder image启动的容器appsource中将已经构建完毕的myhttpserver拷贝到主机当前目录中,然后删除临时的container appsource以及上面构建的那个golang-builder image;最后的步骤和第一个例子一样,基于本地目录中的已经构建完的myhttpserver构建出最终的image。为了方便,你也可以将这一系列命令放到一个Makefile中去。
3、使用size更小的alpine image
builder image并不能帮助我们为最终的应用image“减重”,myhttpserver image的Size依旧停留在200MB。要想“减重”,我们需要更小的base image,我们选择了 alpine 。 Alpine image 的size不到4M,再加上应用的size,最终应用Image的Size估计可以缩减到20M以下。
结合builder image,我们只需将Dockerfile的base image改为alpine:latest:
// github.com/bigwhite/experiments/multi_stage_image_build/isomorphism/Dockerfile.alpine From alpine:latest COPY ./myhttpserver /root/myhttpserver RUN chmod +x /root/myhttpserver WORKDIR /root ENTRYPOINT ["/root/myhttpserver"]
构建alpine版应用image:
# docker build -t myrepo/myhttpserver-alpine:latest -f Dockerfile.alpine . Sending build context to Docker daemon 6.151MB Step 1/5 : FROM alpine:latest ---> 053cde6e8953 Step 2/5 : COPY ./myhttpserver /root/myhttpserver ---> ca0527a62d39 Step 3/5 : RUN chmod +x /root/myhttpserver ---> Running in 28d0a8a577b2 ---> a3833af97b5e Removing intermediate container 28d0a8a577b2 Step 4/5 : WORKDIR /root ---> 667345b78570 Removing intermediate container fa59883e9fdb Step 5/5 : ENTRYPOINT /root/myhttpserver ---> Running in adcb5b976ca3 ---> 582fa2aedc64 Removing intermediate container adcb5b976ca3 Successfully built 582fa2aedc64 Successfully tagged myrepo/myhttpserver-alpine:latest # docker images REPOSITORY TAG IMAGE ID CREATED SIZE myrepo/myhttpserver-alpine latest 582fa2aedc64 4 minutes ago 16.3MB
16.3MB,Size的确降下来了!我们基于该image启动一个容器,看应用运行是否有什么问题:
# docker run myrepo/myhttpserver-alpine:latest standard_init_linux.go:185: exec user process caused "no such file or directory"
容器启动失败了!为什么呢?因为alpine image并非ubuntu环境的同构image。我们在下面详细说明。
二、异构的镜像构建
我们的image builder: myrepo/golang-builder:latest是基于golang:latest这个image。 golang base image 有两个模板:Dockerfile-debain.template和Dockerfile-alpine.template。而golang:latest是基于debian模板的,与ubuntu兼容。构建出来的myhttpserver对动态共享链接库的情况如下:
# ldd myhttpserver linux-vdso.so.1 => (0x00007ffd0c355000) libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007ffa8b36f000) libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007ffa8afa5000) /lib64/ld-linux-x86-64.so.2 (0x000055605ea5d000)
debian 系的linux distribution使用了glibc。但alpine则不同, alpine 使用的是 musl libc 的实现,因此当我们运行上面的那个容器时,加载器因找不到myhttpserver依赖的libc.so.6而失败退出。
这种构建环境与运行环境不兼容的情况我这里称之为“异构的镜像构建”。那么如何解决这个问题呢?我们继续看:
1、静态构建
在主流编程语言中,Go的移植性已经是数一数二的了,尤其是Go 1.5之后,Go将runtime中的C代码都用Go重写了,对libc的依赖已经降到最低了,但仍有一些feature提供了两个版本的实现:C实现和Go实现。并且默认情况下,即在CGO_ENABLED=1的情况下,程序和预编译的标准库都采用了C的实现。关于这方面的详细论述请参见我之前写的《也谈Go的可移植性》一文,这里就不赘述了。于是采用了不同libc实现的debian系和alpine系自然存在不兼容的情况。要解决这个问题,我们首先考虑对Go程序进行静态构建,然后将静态构建后的Go应用放入alpine image中。
我们修改一下Dockerfile.build,在编译Go源文件时加上CGO_ENABLED=0:
// github.com/bigwhite/experiments/multi_stage_image_build/heterogeneous/Dockerfile.build FROM golang:latest WORKDIR /go/src COPY httpserver.go . RUN CGO_ENABLED=0 go build -o myhttpserver ./httpserver.go
构建这个builder image:
# docker build -t myrepo/golang-static-builder:latest -f Dockerfile.build . Sending build context to Docker daemon 4.096kB Step 1/4 : FROM golang:latest ---> 1a34fad76b34 Step 2/4 : WORKDIR /go/src ---> 593cd9692019 Removing intermediate container ee005d487ad5 Step 3/4 : COPY httpserver.go . ---> a095eb69e716 Step 4/4 : RUN CGO_ENABLED=0 go build -o myhttpserver ./httpserver.go ---> Running in d9f3b3a6c36c ---> c06fe8dccbad Removing intermediate container d9f3b3a6c36c Successfully built c06fe8dccbad Successfully tagged myrepo/golang-static-builder:latest # docker images REPOSITORY TAG IMAGE ID CREATED SIZE myrepo/golang-static-builder latest c06fe8dccbad 31 seconds ago 739MB
接下来,我们再基于golang-static-builder中已经build完毕的静态连接的myhttpserver来构建我们最终的应用image:
# docker create --name appsource myrepo/golang-static-builder:latest # docker cp appsource:/go/src/myhttpserver ./ # ldd myhttpserver not a dynamic executable # docker rm -f appsource # docker rmi myrepo/golang-static-builder:latest # docker build -t myrepo/myhttpserver-alpine:latest -f Dockerfile.alpine .
运行新image:
# docker run myrepo/myhttpserver-alpine:latest Webserver start -> listen on port:1111
Note: 我们可以用strace来证明静态连接时Go只使用的是Go自己的runtime实现,而并未使用到libc.a中的代码:
# CGO_ENABLED=0 strace -f go build httpserver.go 2>&1 | grep open | grep -o '/.*\.a' > go-static-build-strace-file-open.txt
打开 go-static-build-strace-file-open.txt 文件查看文件内容,你不会找到libc.a这个文件(在Ubuntu下,一般libc.a躺在/usr/lib/x86_64-linux-gnu/下面),这说明go build根本没有尝试去open libc.a文件并获取其中的符号定义。
2、使用alpine golang builder
我们的Go应用运行在alpine based的container中,我们可以使用alpine golang builder来构建我们的应用(无需静态链接)。前面提到过golang有alpine模板:
REPOSITORY TAG IMAGE ID CREATED SIZE golang alpine 9e3f14138abd 7 days ago 269MB
alpine版golang builder的Dockerfile内容如下:
//github.com/bigwhite/experiments/multi_stage_image_build/heterogeneous/Dockerfile.alpine.build FROM golang:alpine WORKDIR /go/src COPY httpserver.go . RUN go build -o myhttpserver ./httpserver.go
后续的操作与前面golang builder的操作并不二致:利用alpine golang builder构建我们的应用,并将其打入alpine image,这里就不赘述了。
三、多阶段镜像构建:提升开发者体验
在Docker 17.05以前,我们都是像上面那样构建镜像的。你会发现即便采用异构image builder模式,我们也要维护两个Dockerfile,并且还要在docker build命令之外执行一些诸如从容器内copy应用程序、清理build container和build image等的操作。Docker社区看到了这个问题,于是实现了 多阶段镜像构建机制 (multi-stage)。
我们先来看一下针对上面例子,multi-stage build所使用Dockerfile:
//github.com/bigwhite/experiments/multi_stage_image_build/multi_stages/Dockerfile FROM golang:alpine as builder WORKDIR /go/src COPY httpserver.go . RUN go build -o myhttpserver ./httpserver.go From alpine:latest WORKDIR /root/ COPY --from=builder /go/src/myhttpserver . RUN chmod +x /root/myhttpserver ENTRYPOINT ["/root/myhttpserver"]
看完这个Dockerfile的内容,你的第一赶脚是不是把之前的两个Dockerfile合并在一块儿了,每个Dockerfile单独作为一个“阶段”!事实也是这样,但这个Docker也多了一些新的语法形式,用于建立各个“阶段”之间的联系。针对这样一个Dockerfile,我们应该知道以下几点:
- 支持Multi-stage build的Dockerfile在以往的多个build阶段之间建立内在连接,让后一个阶段构建可以使用前一个阶段构建的产物,形成一条构建阶段的chain;
- Multi-stages build的最终结果仅产生一个image,避免产生冗余的多个临时images或临时容器对象,这正是我们所需要的:我们只要结果。
我们来使用multi-stage来build一下上述例子:
# docker build -t myrepo/myhttserver-multi-stage:latest . Sending build context to Docker daemon 3.072kB Step 1/9 : FROM golang:alpine as builder ---> 9e3f14138abd Step 2/9 : WORKDIR /go/src ---> Using cache ---> 7a99431d1be6 Step 3/9 : COPY httpserver.go . ---> 43a196658e09 Step 4/9 : RUN go build -o myhttpserver ./httpserver.go ---> Running in 9e7b46f68e88 ---> 90dc73912803 Removing intermediate container 9e7b46f68e88 Step 5/9 : FROM alpine:latest ---> 053cde6e8953 Step 6/9 : WORKDIR /root/ ---> Using cache ---> 30d95027ee6a Step 7/9 : COPY --from=builder /go/src/myhttpserver . ---> f1620b64c1ba Step 8/9 : RUN chmod +x /root/myhttpserver ---> Running in e62809993a22 ---> 6be6c28f5fd6 Removing intermediate container e62809993a22 Step 9/9 : ENTRYPOINT /root/myhttpserver ---> Running in e4000d1dde3d ---> 639cec396c96 Removing intermediate container e4000d1dde3d Successfully built 639cec396c96 Successfully tagged myrepo/myhttserver-multi-stage:latest # docker images REPOSITORY TAG IMAGE ID CREATED SIZE myrepo/myhttserver-multi-stage latest 639cec396c96 About an hour ago 16.3MB
我们来Run一下这个image:
# docker run myrepo/myhttserver-multi-stage:latest Webserver start -> listen on port:1111
四、小结