由于证书的时效限制,因证书过期忘记更换出现的故障屡见不鲜,而且影响都比较严重,用户量越大,灾难性越强。既然大家都知道证书的破坏力,那么为什么过期问题还是接二连三的出现呢?分析看,一来证书是一个正常时期少有人关注的东西,只有过期了才知道他的破坏力,容易忽视轻敌;二来在互联网企业,随着业务线的增长,证书可能成百上千,再加上最初的使用没有做好规划,在这个背景下,叠加业务调整、人员流动,证书一多管理上的漏
随着行业的发展,运维职能在发生微妙的变化,现在谈大厂SRE的方向,其实我觉得更像是技术运营,通过运营的方式技术的手段牵头协同各部门来保证产品的SLA(服务质量),控制产品的成本,提高管理的效率,从传统运维转身至SRE,SRE慢慢从后台部门走向前台,从成本部门走向生产力部门,从系统稳定性走向用户稳定性,未来甚至会参与到前端经营,SRE是有数据技术能力的。作为技术运营来说,最重要的是拿到产品运行的各种
自动化体系在一个技术团队中尤其重要,他代表着效率和未来。在运维团队,我认为SRE自动化的终极目标就是建立一套DevOps体系,能够把所有的运维场景承载下来并全部自动化,全链路的提升SRE的工作效率、解放人力,为此在团队里我提出了自动化的北极星:能自动化的全部自动化。解放人力不是把自己干掉,我认为自动化的本质是改变了运维团队的工作结构,比如原来需要铺在一线人肉处理的事情改为自动化,鼓励SRE多用工具
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号