Portainer安装

提示服务器已安装K8S集群,不能进行安装

解决办法:确定该服务器是否有部署过portainer,如没有则注释部署脚本里的该判断语句再执行

安装potainer提示超时

解决办法:可能是网络慢的原因, 重新执行一次

portainer使用报错

docker 打不开映射的文件夹 docker portainer打不开_服务器

1)可能学校防火墙屏蔽了,尝试到内网访问试试

2)多点几次,尝试进入stakc>portainer里面,选择portainer_agent去update

docker 打不开映射的文件夹 docker portainer打不开_服务器_02


3)如果2步骤不行,则需要执行命令更新agent:

tar -zvcf /opt/portainer_data.tar /opt/portainer_data/
docker service rm portainer_agent      
cd /opt/install-portainer      
docker stack deploy --compose-file=portainer-agent-stack.yml portainer      
docker service update portainer_agent

swarm

注:初始化前,portainer_data 先备份,tar -zvcf /opt/portainer_data.tar /opt/portainer_data/。

1)重新之前流程重新部署portainer,stack暂时不部署

2)在页面上获取swarmId,参考如下

docker 打不开映射的文件夹 docker portainer打不开_重启_03


3)复制swarId去替换了原本/opt/portainer_data/portainer.db里面swarId,建议用文本工具全替换,之后刷新页面,再去一个个stack的update

swarm有多个manager

根据情况,在主节点降级另一台

docker node demote id

swarm主节点dowm

服务器重启后主节点down状态,可能异常停机导致文件损坏
1.docker重启后,但是在主节点执行docker node ls发现主节点状态处于Down
2.主节点执行docker swarm leave试图离开集群,报错:Error response from daemon: context deadline exceeded
3.主节点执行docker swarm leave -f,同样失败并返回相同的错误
4.主执行docker node rm 主节点,提示需要leave集群
5.主节点执行docker swarm join企图重新加入集群,但是失败,报错说已经在集群中,需要先执行leave再join

处理方法
先找到swarm的目录,可能在/var/lib/docker/swarm,找不到就 find -name “swarm”
备份然后删掉,最好备份,不是一定要备份
systemctl restart docker
systemctl swarm init
重新部署portainer和更新stack

docker网卡ip不够分

当服务达到128的时候,新服务为new状态

查看docker日志 journalctl -xe 或 journalctl -xe --no-pager -u docker

-----------failed to allocate network IP for task 5wfqj20jyo0s1peg2tq5li1fa network jjnpeia5jbodqfp0e93r5xofq: could not find an available IP

出现以上情况就是ip不够分了

1.找到对应服务,点击进入看看服务使用的哪个网卡,一般会有两张portainer_agent_network和ingress网卡,点击看看是否为ip/24,此配置最多支持分配128个ip

2.删除所有service docker service ls | awk ‘{print "docker service rm "$1}’ | sh

3.删除网卡 docker network rm portainer_agent_network 和 docker network rm ingress ,如果是/24,才需要删除

4.重建网卡,ip段自行设置不要重复,后改为/16

docker network create -d overlay --ingress --subnet=11.15.0.0/16 --opt com.docker.network.mtu=1200 ingress

docker network create -d overlay --subnet=17.19.0.0/16 --opt com.docker.network.mtu=1200 portainer_agent_network

5.修改portainer的运行文件,去掉自建网卡的配置和修改配置,如图

docker 打不开映射的文件夹 docker portainer打不开_服务器_04


networks:

-agent_network

改为

networks:

- portainer_agent_network

networks:
agent_network:
driver: overlay
attachable: true
改为
networks:
portainer_agent_network:
external: true
6.重新部署 docker stack deploy --compose-file=portainer-agent-stack.yml portainer
7.登录到portainer,进入到stack去update stack

docker0网卡冲突

主节点ifconfig或者route -n查看docker0网卡的ip,看看网段是不是学校内部冲突
systemctl stop docker.service 主节点停止docker服务
主节点修改 vi /etc/docker/daemon.json, 指定ip地址

{
 “bip”: “172.18.0.1/24”,
 “registry-mirrors”: [“http://****.m.daocloud.io”]
 }


ifconfig docker0 down主节点停掉网卡
systemctl start docker.service 重启各种节点的docker

部分节点不能拉去镜像

将私有仓库地址加到各服务器的/etc/docker/daemon.json文件,重启docker

容器服务器磁盘问题

出现portainer 无法访问或异常时,检查下磁盘情况df -h,默认docker装在/var目录下,若出现100%,会引发有很多问题,以下方式可做应急处理,/目录建议至少200G,后续还是需要扩容

1)若尝试进入portainer 的Containers,对里面stop状态容器进行remove

docker 打不开映射的文件夹 docker portainer打不开_重启_05


2)若尝试进入portainer 的images ,对里面Unused状态镜像进行remove

docker 打不开映射的文件夹 docker portainer打不开_docker_06

3)若尝试进入portainer 的Volumes ,对里面Unused状态卷进行remove

docker 打不开映射的文件夹 docker portainer打不开_docker 打不开映射的文件夹_07


若以上步骤行不通,则需要使用命令操作,依次按照情况执行

docker system df 查看docker磁盘使用情况

docker system prune 清理无使用镜像和容器,以及失效的数据卷和网络。

docker system prune -a 慎用,清理完后无法回滚,深度清理无使用镜像和容器,以及失效的数据卷和网络。

若以上命令步骤行不通,则需要一步步排查占用内存过高的文件,视情况进行处理。

容器平台服务获取ip

容器外服务器(一般主节点)安装nginx对前端进行代理即可。

服务端口开放

基础服务中的config、file、quartz服务不需开发端口,业务系统的后端服务也不开放端口,否则有安全隐患,可被安全扫描出来