(一)、概述

Pod是Kubernetes调度的最小单元。一个Pod可以包含一个或多个容器,因此它可以被看作是内部容器的逻辑宿主机。Pod的设计理念是为了支持多个容器在一个Pod中共享网络和文件系统。因此处于一个Pod中的多个容器共享以下资源:

  • PID命名空间:Pod中不同的应用程序可以看到其他应用程序的进程ID。
  • network命名空间:Pod中多个容器处于同一个网络命名空间,因此能够访问的IP和端口范围都是相同的。也可以通过localhost相互访问。
  • IPC命名空间:Pod中的多个容器共享Inner-process Communication命名空间,因此可以通过SystemV IPC或POSIX进行进程间通信。
  • UTS命名空间:Pod中的多个容器共享同一个主机名。
  • Volumes:Pod中各个容器可以共享在Pod中定义分存储卷(Volume)。

Pod、容器与Node(工作主机)之间的关系如下图所示:
pod.png

(二)、Pod的定义

pod一般都是通过yaml文件或json描述pod和它内部容器的运行环境以及期望状态,如下运行一个简单的Nginx应用pod

[root@k8s-master k8s]# cat pod.yml
apiVersion: v1
kind: Pod
metadata:
  name: test-pod1
  labels:
    app: nginx
spec:
  containers:
  - name: test
    image: nginx:latest
    ports:
    - containerPort: 80
[root@k8s-master k8s]# kubectl apply -f pod.yml
pod/test-pod1 created

在实际的生产中,推荐使用deployment、statefulset、job、cronjob、RS等控制器来创建pod,而不是直接的创建。

  • apiVersion: 使用哪个版本的Kubernetes API来创建此对象
  • kind:要创建的对象类型,例如Pod,Deployment等
  • metadata:用于唯一区分对象的元数据,包括:name,UID和namespace
  • labels:是一个个的key/value对,定义这样的label到Pod后,其他控制器对象可以通过这样的label来定位到此Pod,从而对Pod进行管理。(参见Deployment等控制器对象)
  • spec: 其它描述信息,包含Pod中运行的容器,容器中运行的应用等等。不同类型的对象拥有不同的spec定义。详情参见API文档

K8S在每个pod启动时,会自动创建一个镜像为gcr.io/google_containers/pause:version的容器,所有处于该pod中的容器在启动时都会添加 --net=container:pause --ipc=contianer:pause --pid=container:pause 的启动参数,因此pause容器成为pod内共享命名空间的基础,所有容器共享pause容器的IP地址,也被称为pod IP

(三)、pod的生命周期

Pod的生命周期是Replication Controller进行管理的。一个Pod的生命周期过程包括:

  • 通过yaml或json对Pod进行描述
  • apiserver(运行在Master主机)收到创建Pod的请求后,将此Pod对象的定义存储在etcd中
  • scheduler(运行在Master主机)将此Pod分配到Node上运行
  • Pod内所有容器运行结束后此Pod也结束

在整个过程中,pod的状态通常有五种:

  • Pending:Pod定义正确,提交到Master,但其所包含的容器镜像还未完全创建。通常,Master对Pod进行调度需要一些时间,Node进行容器镜像的下载也需要一些时间,启动容器也需要一定时间。(写数据到etcd,调度,pull镜像,启动容器)。
  • Running:Pod已经被分配到某个Node上,并且所有的容器都被创建完毕,至少有一个容器正在运行中,或者有容器正在启动或重启中。
  • Succeeded:Pod中所有的容器都成功运行结束,并且不会被重启。这是Pod的一种最终状态。
  • Failed:Pod中所有的容器都运行结束了,其中至少有一个容器是非正常结束的(exit code不是0)。这也是Pod的一种最终状态。
  • Unknown:无法获得Pod的状态,通常是由于无法和Pod所在的Node进行通信。

3.1、restart policy

定义Pod时,可以指定restartPolicy字段,表明此Pod中的容器在何种条件下会重启。restartPolicy拥有三个候选值:

  • Always:只当容器失败时,由kubelet自动重启该容器
  • OnFailure:当容器终止运行且退出码不为0时,由kubelet自动重启该容器
  • Never:无论容器运行状态如何,kubelet都不会重启该容器。

3.2、通过controller控制器进行管理

由于pod本身不具备容错性,如果有node出现问题,该pod就无法进行恢复,因此需要各种控制器来创建pod并对pod进行管理,比较推荐的是deployment

一般来说,pod不会自己消失,可以通过手动方式销毁或者被控制器干掉,但有中特殊情况,当pod处于succeeded或failed阶段,并且超过一定时间后(master决定),会触发超时过期从而被销毁。
总的来说,K8S中有三种类型的控制器

- Job。通常用于管理一定会结束的Pod。如果希望Pod被Job controller管理,那么*restartPolicy必须指定为OnFailure或Never。
- ReplicationController,ReplicaSet和Deployment。用于管理永远处于运行状态的Pod。如果希望Pod被此类controller管理,那么restartPolicy必须指定为Always。
- DaemonSet。它能够保证你的Pod在每一台Node都运行一个副本。