11. Docker镜像详解
11.1. 什么是镜像?
Docker的镜像概念类似于虚拟机里的镜像,是一个只读的模板,一个独立的文件系统,包括运行容器所需的数据,可以用来创建新的容器。镜像是一种轻量级、可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件,它包含运行某个软件所需要的所有内容,包括:代码、运行环境(jdk)和库(jre)、环境变量和配置文件。
例如:一个镜像可以包含一个完整的 linux 操作系统环境,里面仅安装了Mysql或用户需要的其它应用程序。
简单点说:镜像不是单一的文件:而是有多层构成,我们可以通过 docker history 镜像名|id 查看镜像中各层内容及大小,每层都对应着Dockerfifile中的一条指令。Docker镜像默认存在/var/lib/docker/中。
镜像从何而来:
- 从远程仓库下载(例如:DockerHub)
- Docker Hub是由docker公司负责和维护的公共注册中心,包含大量的镜像文件,Docker客户端工具默认从这个公共镜像仓库下载镜像, 远程仓库地址:https://hub.docker.com/
- 从朋友那边拷贝过来
- 自己制作一个镜像 DockerFile
11.2. Docker镜像加载原理
UnionFS(联合文件系统)
UnionFS(联合文件系统): Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem)。Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承, 基于基础镜像(没有父镜像), 可以制作各种具体的应用镜像。
特性: 一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。
Docker镜像加载原理
docker的镜像实际上是由一层一层的文件系统组成,这种层级的文件系统称之为:UnionFS(联合文件系统)。
**bootfs(boot file system)**主要包含bootloader和kernel,bootloader主要是引导加载kernel,Linux刚启动时会加载bootfs文件系统,在Docker镜像的最底层是bootfs。这一层与我们典型的Linux/Unix系统是一样的,包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。
bootfs类似电脑中的引导程序,拿电脑开机来说:从关机状态--->引导程序启动---->进入系统界面;这里面的【引导程序启动】就类似bootfs的作用,启动成功之后,这个程序就没用了,并且这个引导程序是共用的。
rootfs(root file system),在bootfs之上。包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs就是各种不同的操作系统发行版,比如Ubuntu,Centos等等。
平时我们安装虚拟机的CentOS都是好几个G,为什么docker这里才200M?
[root@iZ8vb6lqqya4rvreq9ra6gZ ~]# docker images centos
REPOSITORY TAG IMAGE ID CREATED SIZE
centos latest 5d0da3dc9764 4 months ago 231MB
对于一个精简的OS,rootfs可以很小,只需要包括最基本的命令、工具和程序库就可以了,因为底层直接用Host的kernel,自己只需要提供rootfs就行了。由此可见对于不同的linux发行版,bootfs基本是一致的,rootfs会有差别,因此不同的发行版可以共用bootfs。
11.3. 理解分层
以我们的pull为例,在下载的过程中我们可以看到docker的镜像好像是在一层一层的在下载。
以docker pull redis
为例:
为什么docker镜像要采用这种分层结构呢
最大的一个好处就是共享资源。
比如:有多个镜像都从相同的base镜像构建而来,那么宿主机只需在磁盘上保存一份base镜像,同时内存中也只需加载一份base镜像,就可以为所有容器服务了。而且镜像的每一层都可以被共享。
使用命令docker inspect redis
可以查看镜像的详细信息,如下:
[root@iZ8vb6lqqya4rvreq9ra6gZ ~]# docker inspect redis
[
{
"Id": "sha256:7614ae9453d1d87e740a2056257a6de7135c84037c367e1fffa92ae922784631",
"RepoTags": [
"redis:latest"
],
"RepoDigests": [
"redis@sha256:db485f2e245b5b3329fdc7eff4eb00f913e09d8feb9ca720788059fdc2ed8339"
],
"Parent": "",
"Comment": "",
"Created": "2021-12-21T12:42:49.755107412Z",
"Container": "13d25f53410417c5220c8dfe8bd49f06abdbcd69faa62a9b877de02464bb04a3",
"ContainerConfig": {
"Hostname": "13d25f534104",
"Domainname": "",
"User": "",
"AttachStdin": false,
"AttachStdout": false,
"AttachStderr": false,
"ExposedPorts": {
"6379/tcp": {}
},
"Tty": false,
"OpenStdin": false,
"StdinOnce": false,
"Env": [
"PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin",
"GOSU_VERSION=1.12",
"REDIS_VERSION=6.2.6",
"REDIS_DOWNLOAD_URL=http://download.redis.io/releases/redis-6.2.6.tar.gz",
"REDIS_DOWNLOAD_SHA=5b2b8b7a50111ef395bf1c1d5be11e6e167ac018125055daa8b5c2317ae131ab"
],
"Cmd": [
"/bin/sh",
"-c",
"#(nop) ",
"CMD [\"redis-server\"]"
],
"Image": "sha256:e093f59d716c95cfce82c676f099b960cc700432ab531388fcedf79932fc81ec",
"Volumes": {
"/data": {}
},
"WorkingDir": "/data",
"Entrypoint": [
"docker-entrypoint.sh"
],
"OnBuild": null,
"Labels": {}
},
"DockerVersion": "20.10.7",
"Author": "",
"Config": {
"Hostname": "",
"Domainname": "",
"User": "",
"AttachStdin": false,
"AttachStdout": false,
"AttachStderr": false,
"ExposedPorts": {
"6379/tcp": {}
},
"Tty": false,
"OpenStdin": false,
"StdinOnce": false,
"Env": [
"PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin",
"GOSU_VERSION=1.12",
"REDIS_VERSION=6.2.6",
"REDIS_DOWNLOAD_URL=http://download.redis.io/releases/redis-6.2.6.tar.gz",
"REDIS_DOWNLOAD_SHA=5b2b8b7a50111ef395bf1c1d5be11e6e167ac018125055daa8b5c2317ae131ab"
],
"Cmd": [
"redis-server"
],
"Image": "sha256:e093f59d716c95cfce82c676f099b960cc700432ab531388fcedf79932fc81ec",
"Volumes": {
"/data": {}
},
"WorkingDir": "/data",
"Entrypoint": [
"docker-entrypoint.sh"
],
"OnBuild": null,
"Labels": null
},
"Architecture": "amd64",
"Os": "linux",
"Size": 112682493,
"VirtualSize": 112682493,
"GraphDriver": {
"Data": {
"LowerDir": "/var/lib/docker/overlay2/815105070bcc0e9c15229319c8d5c7c42b9371df25768a12cc02843f8d1a23e8/diff:/var/lib/docker/overlay2/f34043bb40e4d1e2caf18f2503d502002885d920b541496977540999b18e10cc/diff:/var/lib/docker/overlay2/7e4def935a3efe314e3843542e21ea2572a4aa469245489e545991cb8a6edd8f/diff:/var/lib/docker/overlay2/645ea8ca0606f6e67388034c5d20fa5b2dc56f3b173b0747a4349417a4d8732b/diff:/var/lib/docker/overlay2/c75ff0634d0305bed78a35ad87b8bfe978620d599b6bbd8fb82bf2d0bfd9d4bf/diff",
"MergedDir": "/var/lib/docker/overlay2/d492f7092ccdfb11d5585fdc43bc771cad0628f656284960d358ea5abfaa3505/merged",
"UpperDir": "/var/lib/docker/overlay2/d492f7092ccdfb11d5585fdc43bc771cad0628f656284960d358ea5abfaa3505/diff",
"WorkDir": "/var/lib/docker/overlay2/d492f7092ccdfb11d5585fdc43bc771cad0628f656284960d358ea5abfaa3505/work"
},
"Name": "overlay2"
},
"RootFS": {
"Type": "layers",
"Layers": [
"sha256:2edcec3590a4ec7f40cf0743c15d78fb39d8326bc029073b41ef9727da6c851f",
"sha256:9b24afeb7c2f21e50a686ead025823cd2c6e9730c013ca77ad5f115c079b57cb",
"sha256:4b8e2801e0f956a4220c32e2c8b0a590e6f9bd2420ec65453685246b82766ea1",
"sha256:529cdb636f61e95ab91a62a51526a84fd7314d6aab0d414040796150b4522372",
"sha256:9975392591f2777d6bf4d9919ad1b2c9afa12f9a9b4d260f45025ec3cc9b18ed",
"sha256:8e5669d8329116b8444b9bbb1663dda568ede12d3dbcce950199b582f6e94952"
]
},
"Metadata": {
"LastTagTime": "0001-01-01T00:00:00Z"
}
}
]
从上面找到RootFS
里面也有一个Layers
,Layers
就是redis镜像的分层信息。
深入理解:
所有的Docker镜像都起始于一个基础镜像层,当进行修改或增加新的内容时,就会在当前镜像层之上,创建新的镜像层。无论这个镜像有多少层,对内每层的中间镜像都是各自独立的,对外他们又是一个统一的整体。
如下图:假如基于linux创建一个新的惊喜,这就是新惊喜的第一层;如果在该镜像中,添加jdk,就会在基础镜像层之上创建第二个镜像层;如果继续添加一个tomcat,就会创建第三个镜像层。(这只是一个用于演示说明的简单例子)
在添加额外镜像层的同时,镜像始终是保持当前所有镜像的组合,理解这一点非常重要。如下图:第一层镜像、第二层镜像分别包含3个文件,而最外层的(大)镜像包含了来自两个镜像层的6个文件。
下图中展示了一个稍微复杂的三层镜像,在外部看来整个镜像只有6个文件,其实文件7时文件5的一个更新版本。
这种情况下,上层镜像层中的文件覆盖了底层镜像层中的文件。这样就使得文件的更新版本作为一个新的镜像层,添加到镜像当中。
Docker通过存储引擎(新版本采用快照机制)的方式来实现镜像层堆栈,并保证多镜像层对外展示为统一的文件系统。
Linux上可用的存储引擎有AUFS、Overlay2、Device Mapper、Btrfs以及ZFS。顾名思义,每种存储引擎都对应Linux中对应的文件系统或者块设备技术,并且每种存储引擎都有其独特的性能特点。
Docker在windows上仅支持windowsfilter一种存储引擎,该引擎基于NTFS文件系统之上实现了分层和COW。
下图展示了与系统显示相同的三层镜像。所有镜像层 堆叠并合并,对外提供统一的视图。
特点
Docker镜像都是只读的,当容器启动时,一个新的可写层被加载到镜像的顶部。 这一层通常被称作为"容器层",“容器层”之下的都叫"镜像层"。
如下图:
--------------------------EOF--------------------------