Portainer安装
提示服务器已安装K8S集群,不能进行安装
解决办法:确定该服务器是否有部署过portainer,如没有则注释部署脚本里的该判断语句再执行
安装potainer提示超时
解决办法:可能是网络慢的原因, 重新执行一次
portainer使用报错
1)可能学校防火墙屏蔽了,尝试到内网访问试试
2)多点几次,尝试进入stakc>portainer里面,选择portainer_agent去update
3)如果2步骤不行,则需要执行命令更新agent:
tar -zvcf /opt/portainer_data.tar /opt/portainer_data/
docker service rm portainer_agent
cd /opt/install-portainer
docker stack deploy --compose-file=portainer-agent-stack.yml portainer
docker service update portainer_agent
swarm
注:初始化前,portainer_data 先备份,tar -zvcf /opt/portainer_data.tar /opt/portainer_data/。
1)重新之前流程重新部署portainer,stack暂时不部署
2)在页面上获取swarmId,参考如下
3)复制swarId去替换了原本/opt/portainer_data/portainer.db里面swarId,建议用文本工具全替换,之后刷新页面,再去一个个stack的update
swarm有多个manager
根据情况,在主节点降级另一台
docker node demote id
swarm主节点dowm
服务器重启后主节点down状态,可能异常停机导致文件损坏
1.docker重启后,但是在主节点执行docker node ls发现主节点状态处于Down
2.主节点执行docker swarm leave试图离开集群,报错:Error response from daemon: context deadline exceeded
3.主节点执行docker swarm leave -f,同样失败并返回相同的错误
4.主执行docker node rm 主节点,提示需要leave集群
5.主节点执行docker swarm join企图重新加入集群,但是失败,报错说已经在集群中,需要先执行leave再join
处理方法
先找到swarm的目录,可能在/var/lib/docker/swarm,找不到就 find -name “swarm”
备份然后删掉,最好备份,不是一定要备份
systemctl restart docker
systemctl swarm init
重新部署portainer和更新stack
docker网卡ip不够分
当服务达到128的时候,新服务为new状态
查看docker日志 journalctl -xe 或 journalctl -xe --no-pager -u docker
-----------failed to allocate network IP for task 5wfqj20jyo0s1peg2tq5li1fa network jjnpeia5jbodqfp0e93r5xofq: could not find an available IP
出现以上情况就是ip不够分了
1.找到对应服务,点击进入看看服务使用的哪个网卡,一般会有两张portainer_agent_network和ingress网卡,点击看看是否为ip/24,此配置最多支持分配128个ip
2.删除所有service docker service ls | awk ‘{print "docker service rm "$1}’ | sh
3.删除网卡 docker network rm portainer_agent_network 和 docker network rm ingress ,如果是/24,才需要删除
4.重建网卡,ip段自行设置不要重复,后改为/16
docker network create -d overlay --ingress --subnet=11.15.0.0/16 --opt com.docker.network.mtu=1200 ingress
docker network create -d overlay --subnet=17.19.0.0/16 --opt com.docker.network.mtu=1200 portainer_agent_network
5.修改portainer的运行文件,去掉自建网卡的配置和修改配置,如图
networks:
-agent_network
改为
networks:
- portainer_agent_network
networks:
agent_network:
driver: overlay
attachable: true
改为
networks:
portainer_agent_network:
external: true
6.重新部署 docker stack deploy --compose-file=portainer-agent-stack.yml portainer
7.登录到portainer,进入到stack去update stack
docker0网卡冲突
主节点ifconfig或者route -n查看docker0网卡的ip,看看网段是不是学校内部冲突
systemctl stop docker.service 主节点停止docker服务
主节点修改 vi /etc/docker/daemon.json, 指定ip地址
{
“bip”: “172.18.0.1/24”,
“registry-mirrors”: [“http://****.m.daocloud.io”]
}
ifconfig docker0 down主节点停掉网卡
systemctl start docker.service 重启各种节点的docker
部分节点不能拉去镜像
将私有仓库地址加到各服务器的/etc/docker/daemon.json文件,重启docker
容器服务器磁盘问题
出现portainer 无法访问或异常时,检查下磁盘情况df -h,默认docker装在/var目录下,若出现100%,会引发有很多问题,以下方式可做应急处理,/目录建议至少200G,后续还是需要扩容
1)若尝试进入portainer 的Containers,对里面stop状态容器进行remove
2)若尝试进入portainer 的images ,对里面Unused状态镜像进行remove
3)若尝试进入portainer 的Volumes ,对里面Unused状态卷进行remove
若以上步骤行不通,则需要使用命令操作,依次按照情况执行
docker system df 查看docker磁盘使用情况
docker system prune 清理无使用镜像和容器,以及失效的数据卷和网络。
docker system prune -a 慎用,清理完后无法回滚,深度清理无使用镜像和容器,以及失效的数据卷和网络。
若以上命令步骤行不通,则需要一步步排查占用内存过高的文件,视情况进行处理。
容器平台服务获取ip
容器外服务器(一般主节点)安装nginx对前端进行代理即可。
服务端口开放
基础服务中的config、file、quartz服务不需开发端口,业务系统的后端服务也不开放端口,否则有安全隐患,可被安全扫描出来