k8s故障案例：calico无限重启

精选原创

kiroct 2022-09-22 15:53:21 ©著作权

©著作权归作者所有：来自51CTO博客作者kiroct的原创作品，请联系作者获取转载授权，否则将追究法律责任

环境；高可用k8s集群连带N个work node节点。在以下命令的时候

kubectl get pod --all-namespaces -o wide | grep cal

发现pod重启达上百次。且状态是imagepullbackoff 下面使用以下命令可以看到readness、liveness探针失败，容器创建成功

kubectl describe pod -n (空间)  （pod名称）

为了确保pod是否报错，使用以下命令查看日志，发现pod未报错

kubectl logs (pod名) -n (空间)

使用命令导出calico的yaml文件

kubectl get deployment -n (空间)  （名称） -o yaml > /tmp/calico.yaml

查看里面相关的readness和liveness探针，发现里面的timeout超时检测一个是1一个是5；把他们都重新设置成10后，删除原先的pod，重新apply -f这个yaml文件后，pod整成功running

结论：探针健康检查的超时时间过短，导致pod无限重启。且状态是imagepullbackoff

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯