当前我监控1000+的服务器,动作有近200个,监控方式有短信、邮件与语音报警电话,如果动作配置有问题或者某个动作被关闭,就会导致某些报警无法触发,不能及时收到报警通知并处理。而且zabbix配置用户权限的时候,如果给某些用户部门管理员的话,他就可以自己修改动作,比如关闭,然后业务出现问题无法报警,虽然可以从zabbix审计里查看(我测试了,很多情况下用户自己关闭动作,审计是看不到的),但扯皮是浪
目前我这里使用docker做caas平台,主要是解决:1、运维沙箱环境测试;2、研发半自动化代码部署与回滚;3、集群化应用与auto scale。目前这3点都实现,但在第2点与第3点联系的时候有个问题。在第2里,研发测试成功的代码会被打包为一个p_w_picpaths,放入私有库,然后第3部集群更新的时候,会选择这个成功版本的镜像,但在更新中,由于每个节点都需要从私有库里获取镜像,这样节点越多更新
Copyright © 2005-2023 51CTO.COM 版权所有 京ICP证060544号