从业务数据的角度看,容器可以分为两类:

无状态(stateless)容器

无状态是指容器在运行过程中不需要保存数据,每次访问的结果不依赖上一次访问,比如提供静态页面的 web 服务器。

有状态(stateful)容器

有状态是指容器需要保存数据,而且数据会发生变化,访问的结果依赖之前请求的处理结果,最典型的就是数据库服务器。

 

简单来讲,状态(state)就是数据,如果容器需要处理并存储数据,它就是有状态的,反之则无状态。

 

保存数据

 

data volume 可以存储容器的状态,但是 volume 其本质是 Docker 主机本地的目录。

 

隐患:如果 Docker Host 宕机了,数据可能会丢失

解决方法:定期备份数据,但这种方案还是会丢失从上次备份到宕机这段时间的数据。

更好的方案:由专门的 storage provider 提供 volume,Docker 从 provider 那里获取 volume 并挂载到容器。即使 Host 挂了,也可以立刻在其他可用 Host 上启动相同镜像的容器,挂载之前使用的 volume,这样就不会有数据丢失。

 

 

实现跨 Docker 主机管理 data volume

 

假设有两个 Dokcer 主机,Host1 运行了一个 MySQL 容器,为了保护数据,data volume 由 storage provider 提供,如下图所示。

docker无source命令 docker 无状态_Docker

 

当 Host1 发生故障,我们会在 Host2 上启动相同的 MySQL 镜像,并挂载 data volume。

docker无source命令 docker 无状态_Docker_02

 

Docker 是通过 volume driver 实现这个跨主机管理 data volume 方案的

 

任何一个 data volume 都是由 driver 管理的,创建 volume 时如果不特别指定,将使用 local 类型的 driver,即从 Docker Host 的本地目录中分配存储空间。如果要支持跨主机的 volume,则需要使用第三方 driver。

 

目前已经有很多可用的 driver,比如使用 Azure File Storage 的 driver,使用 GlusterFS 的 driver。

完整的列表可参考 https://docs.docker.com/engine/extend/legacy_plugins/#volume-plugins

 

我们这里将选择 Rex-Ray driver,其原因是:

1、Rex-Ray 是开源的,而且社区活跃。

2、支持多种 backend,VirtualBox 的 Virtual Media、Amazon EBS、Ceph RBD、OpenStack Cinder 等。

3、支持多种操作系统,Ubuntu、CentOS、RHEL 和 CoreOS。

4、支持多种容器编排引擎,Docker Swarm、Kubernetes 和 Mesos。

5、Rex-Ray 安装使用方法非常简单。