刚开始学Docker
的时候因为不知道Docker
跟以前在VirtualBox
里安的虚拟机还有Vargrant
有啥区别,我都是习惯性的把开发环境里用的东西往单个容器里塞。后来看网上的教程还有别人分享的案例多了后,才知道把应用容器化的第一步是:要把应用用到的东西拆解放到多个容器里。慢慢地我发现不少人刚开始学Docker
时候跟我一样都有刚接触时把Docker
当虚拟机来用的问题,比如我特别早以前发过一篇文章《用Docker-Compose搭建Laravel开发环境》里,我用三个分别装着PHP
、MySQL
和Nginx
的容器搭建了一个开发环境。有读者就问了这么一个问题:
不过那会儿我对Docker
的掌握程度也仅限在搭建个开发环境这个级别,很多原理也不太理解所以只是告诉他每个容器里只能有单一的进程,这样更好管理、扩展之类的,希望这个大哥最后找到了正确的学习方法。不过在许多关于Docker
的博客文章和教程里列举的最佳实践里确实都有:"每个容器只运行一个进程"这样的说法。为什么存在此规则?为什么不在单个容器中运行Nginx
,PHP
,Go
或者更多进程?
通过最近的文章《容器和虚拟机到底有啥区别?》我们聊了,容器不像虚拟机那样拥有独立的操作系统,容器只是通过Linux
的Namespaces
、Cgroups
实现了进程级别的隔离。虽然在容器里看不见宿主机上的其他进程,但归根结底它还只是一个运行在宿主机上的进程,所以就不具备操作系统的进程管理能力。
每个容器里只运行一个进程这个说法其实不太准确,因为像Nginx
在启动后主进程会再开启若干个Worker
进程负责请求的处理,Apache
更是会为每个请求创建一个进程。容器的"单进程模型",并不是指容器里只能运行"一个"进程,而是指容器没有管理多个进程的能力。这是因为容器里的主进程(PID=1
的进程)就是应用本身,其他的进程都是这个主进程的子进程。可是,用户编写的应用,并不能够像正常操作系统里的init
进程或者systemd
那样拥有进程管理的功能。比如,你的容器启动命令是执行一个shell
脚本,脚本里依次启动容器里的Nginx
和Web应用
。
比如是下面这个shell
脚本
sudo su -root -c "nginx -s start && /app/go_web_bin"
那么这个容器里主进程是sh
,Nginx
和Web
应用是子进程。可是,当这个 Nginx
进程异常退出的时候,主进程sh
是感知不到的,也就没法对Nginx
进行重启。Docker
只能识别主进程的状态,如果主进程正常,Docker
的状态就是Running
所以在容器里不推荐跑多个进程。
所以更确切的说法是每个容器应该只有一个关注点,只有一个单一的功能。将应用程序解耦到多个容器中,可以更轻松地水平缩扩和重复使用容器。例如,一个Web
应用程序服务可能由三个单独的容器组成,每个容器都有自己的镜像,以松耦合的方式管理Web
应用程序,数据库和Redis
缓存。对于这些相互依赖的容器,则使用Docker
容器网络来保持这些容器的通信。