乐趣区

程序员笔记如何编写优雅的Dockerfile

导读

Kubernetes 要从容器化开始,而容器又需要从 Dockerfile 开始,本文将介绍如何写出一个优雅的 Dockerfile 文件。

文章主要内容包括:

  • Docker 容器
  • Dockerfile
  • 使用多阶构建

感谢公司提供大量机器资源及时间让我们可以实践,感谢在此专题上不断实践的部分项目及人员的支持。

一、Docker 容器

1.1 容器的特点

我们都知道容器就是一个标准的软件单元,它有以下特点:

  • 随处运行:容器可以将代码与配置文件和相关依赖库进行打包,从而确保在任何环境下的运行都是一致的。
  • 高资源利用率:容器提供进程级的隔离,因此可以更加精细地设置 CPU 和内存的使用率,进而更好地利用服务器的计算资源。
  • 快速扩展:每个容器都可作为单独的进程予以运行,并且可以共享底层操作系统的系统资源,这样一来可以加快容器的启动和停止效率。

1.2 Docker 容器

目前市面上的主流容器引擎有 Docker、Rocket/rkt、OpenVZ/Odin 等等,而独霸一方的容器引擎就是使用最多的 Docker 容器引擎。

Docker 容器是与系统其他部分隔离开的一系列进程,运行这些进程所需的所有文件都由另一个镜像提供,从开发到测试再到生产的整个过程中,Linux 容器都具有可移植性和一致性。相对于依赖重复传统测试环境的开发渠道,容器的运行速度要快得多,并且支持在多种主流云平台(PaaS)和本地系统上部署。Docker 容器很好地解决了“开发环境能正常跑,一上线就各种崩”的尴尬。

Docker 容器的特点:

  • 轻量:容器是进程级的资源隔离,而虚拟机是操作系统级的资源隔离,所以 Docker 容器相对于虚拟机来说可以节省更多的资源开销,因为 Docker 容器不再需要 GuestOS 这一层操作系统了。
  • 快速:容器的启动和创建无需启动 GuestOS,可以实现秒级甚至毫秒级的启动。
  • 可移植性:Docker 容器技术是将应用及所依赖的库和运行时的环境技术改造包成容器镜像,可以在不同的平台运行。
  • 自动化:容器生态中的容器编排工作(如:Kubernetes)可帮助我们实现容器的自动化管理。

二、Dockerfile

Dockerfile 是用来描述文件的构成的文本文档,其中包含了用户可以在使用行调用以组合 Image 的所有命令,用户还可以使用 Docker build 实现连续执行多个命令指今行的自动构建。

通过编写 Dockerfile 生磁镜像,可以为开发、测试团队提供基本一致的环境,从而提升开发、测试团队的效率,不用再为环境不统一而发愁,同时运维也能更加方便地管理我们的镜像。

Dockerfile 的语法非常简单,常用的只有 11 个:

2.1 编写优雅地 Dockerfile

编写优雅的 Dockerfile 主要需要注意以下几点:

  • Dockerfile 文件不宜过长,层级越多最终制作出来的镜像也就越大。
  • 构建出来的镜像不要包含不需要的内容,如日志、安装临时文件等。
  • 尽量使用运行时的基础镜像,不需要将构建时的过程也放到运行时的 Dockerfile 里。

只要记住以上三点就能写出不错的 Dockerfile。

为了方便大家了解,我们用两个 Dockerfile 实例进行简单的对比:

FROM ubuntu:16.04
RUN apt-get update
RUN apt-get install -y apt-utils libjpeg-dev \     
python-pip
RUN pip install --upgrade pip
RUN easy_install -U setuptools
RUN apt-get clean
FROM ubuntu:16.04
RUN apt-get update && apt-get install -y apt-utils \
  libjpeg-dev python-pip \
           && pip install --upgrade pip \
      && easy_install -U setuptools \
    && apt-get clean

我们看第一个 Dockerfile,乍一看条理清晰,结构合理,似乎还不错。再看第二个 Dockerfile,紧凑,不易阅读,为什么要这么写?

  • 第一个 Dockerfile 的好处是:当正在执行的过程某一层出错,对其进行修正后再次 Build,前面已经执行完成的层不会再次执行。这样能大大减少下次 Build 的时间,而它的问题就是会因层级变多了而使镜像占用的空间也变大。
  • 第二个 Dockerfile 把所有的组件全部在一层解决,这样做能一定程度上减少镜像的占用空间,但在制作基础镜像的时候若其中某个组编译出错,修正后再次 Build 就相当于重头再来了,前面编译好的组件在一个层里,得全部都重新编译一遍,比较消耗时间。

从下表可以看出两个 Dockerfile 所编译出来的镜像大小:

$ docker images | grep ubuntu      
REPOSITORY      TAG     IMAGE ID    CREATED     SIZE                                                                                                                                   
ubuntu                   16.04       9361ce633ff1  1 days ago 422MB
ubuntu                   16.04-1   3f5b979df1a9  1 days ago  412MB

呃…. 好像并没有特别的效果,但若 Dockerfile 非常长的话可以考虑减少层次,因为 Dockerfile 最高只能有 127 层。

三、使用多阶构建

Docker 在升级到 Docker 17.05 之后就能支持多阶构建了,为了使镜像更加小巧,我们采用多阶构建的方式来打包镜像。在多阶构建出现之前我们通常使用一个 Dockerfile 或多个 Dockerfile 来构建镜像。

3.1 单文件构建

在多阶构建出来之前使用单个文件进行构建,单文件就是将所有的构建过程(包括项目的依赖、编译、测试、打包过程)全部包含在一个 Dockerfile 中之下:

FROM golang:1.11.4-alpine3.8 AS build-env
ENV GO111MODULE=off
ENV GO15VENDOREXPERIMENT=1
ENV BUILDPATH=github.com/lattecake/hello
RUN mkdir -p /go/src/${BUILDPATH}
COPY ./ /go/src/${BUILDPATH}
RUN cd /go/src/${BUILDPATH} && CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go install –v

CMD [/go/bin/hello]

这种的做法会带来一些问题:

  • Dockerfile 文件会特别长,当需要的东西越来越多的时候可维护性指数级将会下降;
  • 镜像层次过多,镜像的体积会逐步增大,部署也会变得越来越慢;
  • 代码存在泄漏风险。

以 Golang 为例,它运行时不依赖任何环境,只需要有一个编译环境,那这个编译环境在实际运行时是没有任务作用的,编译完成后,那些源码和编译器已经没有任务用处了也就没必要留在镜像里。

上表可以看到,单文件构建最终占用了 312MB 的空间。

3.2 多文件构建

在多阶构建出来之前有没有好的解决方案呢?有,比如采用多文件构建或在构建服务器上安装编译器,不过在构建服务器上安装编译器这种方法我们就不推荐了,因为在构建服务器上安装编译器会导致构建服务器变得非常臃肿,需要适配各个语言多个版本、依赖,容易出错,维护成本高。所以我们只介绍多文件构建的方式。

多文件构建,其实就是使用多个 Dockerfile,然后通过脚本将它们进行组合。假设有三个文件分别是:Dockerfile.run、Dockerfile.build、build.sh。

  • Dockerfile.run 就是运行时程序所必须需要的一些组件的 Dockerfile,它包含了最精简的库;
  • Dockerfile.build 只是用来构建,构建完就没用了;
  • build.sh 的功能就是将 Dockerfile.run 和 Dockerfile.build 进行组成,把 Dockerfile.build 构建好的东西拿出来,然后再执行 Dockerfile.run,算是一个调度的角色。

Dockerfile.build

FROM golang:1.11.4-alpine3.8 AS build-env
ENV GO111MODULE=off
ENV GO15VENDOREXPERIMENT=1
ENV BUILDPATH=github.com/lattecake/hello
RUN mkdir -p /go/src/${BUILDPATH}
COPY ./ /go/src/${BUILDPATH}
RUN cd /go/src/${BUILDPATH} && CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go install –v

Dockerfile.run

FROM alpine:latest
RUN apk –no-cache add ca-certificates
WORKDIR /root
ADD hello .
CMD ["./hello"]

Build.sh

#!/bin/sh
docker build -t –rm hello:build . -f Dockerfile.build
docker create –name extract hello:build
docker cp extract:/go/bin/hello ./hello
docker rm -f extract
docker build –no-cache -t –rm hello:run . -f Dockerfile.run
rm -rf ./hello

执行 build.sh 完成项目的构建。

从上表可以看到,多文件构建大大减小了镜像的占用空间,但它有三个文件需要管理,维护成本也更高一些。

3.3 多阶构建

最后我们来看看万众期待的多阶构建。

完成多阶段构建我们只需要在 Dockerfile 中多次使用 FORM 声明,每次 FROM 指令可以使用不同的基础镜像,并且每次 FROM 指令都会开始新的构建,我们可以选择将一个阶段的构建结果复制到另一个阶段,在最终的镜像中只会留下最后一次构建的结果,这样就可以很容易地解决前面提到的问题,并且只需要编写一个 Dockerfile 文件。这里值得注意的是:需要确保 Docker 的版本在 17.05 及以上。下面我们来说说具体操作。

在 Dockerfile 里可以使用 as 来为某一阶段取一个别名”build-env”:

FROM golang:1.11.2-alpine3.8 AS build-env

然后从上一阶段的镜像中复制文件,也可以复制任意镜像中的文件:

COPY –from=build-env /go/bin/hello /usr/bin/hello 

看一个简单的例子:

FROM golang:1.11.4-alpine3.8 AS build-env
 
ENV GO111MODULE=off
ENV GO15VENDOREXPERIMENT=1
ENV GITPATH=github.com/lattecake/hello
RUN mkdir -p /go/src/${GITPATH}
COPY ./ /go/src/${GITPATH}
RUN cd /go/src/${GITPATH} && CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go install -v
 
FROM alpine:latest
ENV apk –no-cache add ca-certificates
COPY --from=build-env /go/bin/hello /root/hello
WORKDIR /root
CMD ["/root/hello"]

执行 docker build -t –rm hello3 . 后再执行 docker images,然后我们来看镜像的大小:

多阶构建给我们带来很多便利,最大的优势是在保证运行镜像足够小的情况下还减轻了 Dockerfile 的维护负担,因此我们极力推荐使用多阶构建来将你的代码打包成 Docker 镜像。

作者:王聪

内容来源:宜信技术学院

退出移动版