进入docker的世界

jiezi

6 年前

最近学习 Machine Learning 发现好多人都用 docker，之前一直听说但是感觉和自己无关。但是现在发现原来 docker 是个这么方便的东西，可以跨平台（不分什么版本的 linux，甚至 mac 和 windows 也行）运行。所以这里开一篇来记录学习感受。
参考：Docker 完全指南参考: Gitbook – Docker — 从入门到实践
不提那些难懂的术语，大白话就是：一个 Docker 就是一个 Linux 的 Live CD 系统，跟 USB 系统一样，有完整的系统文件目录和程序。
我们可以在这个与外界隔离的便携系统里随便读写操作，只是每次进入它时候，都会恢复最开始的样子，像什么事都没发生一样。我们可以像定制 Live CD 或 WinPE 一样，定制这个小系统里面默认装什么软件。一旦定制好了，就是不可更改的，非常稳定。
理解 Docker 的逻辑
一开始发现很乱很难理解，觉得所有人都把它说的太复杂了。直到后来发现，其实它的运行逻辑很简单。实际上，可以把 Docker 看成是给电脑安装 Linux 系统时的 Live CD，或者是给 Windows 用 USB 安装系统时的 WinPE。这样会方便理解一点。
回想下自己在给 PC 或是虚拟机上安装 Linux 系统时，都会有个 Live CD 选项。也是就是你可以什么都不安装，直接进入系统，所有的工具都能用，所有的软件都能安装，所有的配置也可以改。只不过你重启过后，一切修改的地方都恢复原样了。
每篇攻略都会提到这三个基本概念：
镜像 Image
相当于一个系统光盘的 ISO 镜像文件，是只读的。你可以直接进入 image 中各种操作没有障碍，感觉就像进入_Live CD_系统了。只是所有操作都会在退出时消失，下次进 image 时候还是初始的样子。
容器 Container
就像给 ”ISO 文件 ” 加了一层可读写的外衣，所有的变动都会保存在 Container 里，而 image 还是 image，不会变。就像你可以随便换衣服，但是身体不会变。
仓库 Repo
一般指的 Dockerhub，就是一个像 Github 的网站，只不过不是收集代码，而是收集各种 image 镜像。你可以随意上传下载各大厂商或个人制作的镜像。
安装 Docker
Docker 分 CE 和 EE 两个版本，一个社区公开免费，一个商业付费。
参考官方：About Docker CE
Ubuntu 上安装 Docker
参考官方安装步骤：Get Docker CE for Ubuntu
准备工作：
#安装 SSL 相关，让 apt 通过 HTTPS 下载：
sudo apt-get install apt-transport-https ca-certificates curl software-properties-common
# 添加 docker 的 GPG key
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add –
#检查 key 是否相符（9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88）
sudo apt-key fingerprint 0EBFCD88

# 添加 docker 的 apt 下载源
sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable”

# 更新源
sudo apt-get update
安装 docker：
$ sudo apt-get install docker-ce
卸载 Docker：
$ sudo apt-get remove docker docker-engine docker.io
Mac 上安装 Docker
直接下载 app：

树莓派上安装 Docker
树莓派是基于 ARM 架构的，和 PC 不同。所以即使树莓派上能做一些 docker 镜像，也不能在别的 PC 上运行。反过来别的 PC 上的 docker 镜像，也不能在树莓派上运行。如果需要找树莓派专用的镜像，那就在 Dockerhub 上搜索 ARM 或 Rpi 相关就能找到了。有一个叫 Hypriot 的仓库制作了非常多树莓派专用 docker，可以参考下。
树莓派安装 Docker，最难的在于正确的选择源和添加 GPG-key，才能找到版本适合的 docker 并下载。这个过程是非常繁琐且很难有统一方案的。另外：官方的一键安装版本已经失效了。必须手动操作。
参考另一篇笔记：树莓派安装 Docker
运行 Docker
[站外图片上传中 …(image-e81557-1548159126389)]
从 Image 镜像创建一个 Container 容器：
# 新建一个 Container 容器（如果本地有 image 则直接从它创建，如果没有则从网上下载）
# 进入 docke 的 shell -t，即进入虚拟的一个系统，有自己的 /root 文件系统结构

$ docker run -it <repo>:<tag> <CMD>

# 如：
$ docker run -it jekyll/jekyll:latest bash

# 为 container 指定名称（而不是只用 ID 来引用）
$ docker run -it –name <NAME> <image-ID>
查看已有的：
# 查看已有的 images
$ docker images

# 查看已创建的 containers
$ docker container ls -a
运行一个已有的 Container：
# 先启动 container
$ docker container <ID> start

# 运行（挂载）container，挂载后自动进入容器里的 shell
$ docker attach <ID>

# 或者一句话完成 (–attach)
$ docker start -a<ID>
删除已有的：
# 删除 image
$ docker rm <Image-ID>

# 删除 container
$ docker rm <Container-ID>
无需 sudo 执行 docker
为了每次执行 docker 不需要总是输入 sudo，我们需要为 docker 创建一个用户组，并授予权限才行：
# 创建 docker 用户组
sudo groupadd docker

# 把当前用户加入到 docker 用户组
sudo gpasswd -a $USER docker

# 更新当前用户组变动（就不用退出并重新登录了）
newgrp docker
挂载 Host 主机上的文件夹
我们肯定不会满足于 docker 只访问自己的小世界里的文件系统（什么数据都没有），所以有必要让它能访问外界 Host 主机上的一些文件夹。比如我有一个 docker 是作为下载机用的，那么我肯定得让它把下载好的东西存到我的主机上，要不然就白下载了。
参考：Docker 学习 — 挂载本地目录
挂载文件夹是在 docker 运行镜像的命令里就指定的 (利用 - v 参数)：
$ docker run -it -v <HOST-PATH>:<DOCKER-PATH> ubuntu64 /bin/bash

# 或者作为只读挂载 (:ro)
$ docker run -it -v <HOST-PATH>:<DOCKER-PATH>:ro ubuntu64 /bin/bash
注意，挂载的双方都必须是绝对路径。
映射 Docker 里的端口到 Host 主机上的端口
如果 Docker 里运行的是 Web 服务比如 Nginx，里面有一个网站，那你必须得把”虚拟机“里的端口映射到外部才能正常看到网页。
映射是在运行 docker 命令时指定的，比如把里面的 80 端口映射到外面的 8888 端口，命令如下：
$ docker run –name webserver -d -p 80:8888 nginx
然后你在主机上的浏览器访问 http://localhost:8888，就可以看到 nginx 里的网页了。
Docker 镜像保存更改
直接在镜像上改动的内容，会在退出时全部消失。但是我们经常需要把这些变动保存下来。
Docker 保存这些变动的机制就是——生成另一个只读镜像。(-_-!)
虽然正常看来，这不太好吧。但实际上，这很好！Docker 镜像实际上是非常小的，所以生成另一个镜像也没有多费事。而且这种机制保证了每个镜像的不可随便修改的性质，这一点就极大的避免了混乱。
Docker 保存更改有两种方式：

docker commit：就像 git commit 一样，把每次改动作为一个 commit 提交，可以追溯历史

Dockerfile：这是从头 build 构建一个镜像的配置文件，把你想改动的地方（如安装一个程序）写成一句 bash 命令，加到 Dockerfile 这个文件里，它就会按照你的要求执行所有的命令，然后生成一个新的镜像。

Commit 可以追溯历史，但是变动了哪些地方是对外界黑箱的。Dockerfile 确实明明白白写清楚有哪些改变。
所以一般情况下，正式构建一个镜像，都是用 Dockerfile 的。
“docker commit” 将变动过的 Container 保存为镜像
参考：利用 commit 理解镜像构成
docker commit 命令，可以将容器的存储层保存下来成为镜像。换句话说，就是在原有镜像的基础上，再叠加上容器的存储层，并构成新的镜像。以后我们运行这个新镜像的时候，就会拥有原有容器最后的文件变化。
慎用 docker commit:
由于命令的执行，还有很多文件被改动或添加了。这还仅仅是最简单的操作，如果是安装软件包、编译构建，那会有大量的无关内容被添加进来，如果不小心清理，将会导致镜像极为臃肿。此外，使用 docker commit 意味着所有对镜像的操作都是黑箱操作，生成的镜像也被称为黑箱镜像，换句话说，就是除了制作镜像的人知道执行过什么命令、怎么生成的镜像，别人根本无从得知。而且，即使是这个制作镜像的人，过一段时间后也无法记清具体在操作的。虽然 docker diff 或许可以告诉得到一些线索，但是远远不到可以确保生成一致镜像的地步。这种黑箱镜像的维护工作是非常痛苦的。而且，回顾之前提及的镜像所使用的分层存储的概念，除当前层外，之前的每一层都是不会发生改变的，换句话说，任何修改的结果仅仅是在当前层进行标记、添加、修改，而不会改动上一层。如果使用 docker commit 制作镜像，以及后期修改的话，每一次修改都会让镜像更加臃肿一次，所删除的上一层的东西并不会丢失，会一直如影随形的跟着这个镜像，即使根本无法访问到。这会让镜像更加臃肿。