主题:腾讯云CES自动化运维架构及最佳实践
大纲:
1. 如何看待“运维”在公司的定位和未来的发展方向
2. 做好自动化运维架构需要关注哪些方面
3. 运维岗位必备技能
4. 提效处理故障方面的建议
5. 腾讯云CES方面的运维架构有哪些独到之处
听说3306π要搞事情了
是啊,马上要搞3306π深圳站了
啊,是吗?哪天啊,在哪里办,怎么报名?
12月19日,就在深圳南山区海岸城,点文末的原文链接或者扫描二维码就可以报名了,一起来吹吹牛逼。
嘉宾自我介绍
李明 高级运维工程师 曾先后在携程、华为云等公司从事多年MySQL DBA的工作,目前在腾讯负责腾讯云Elasticsearch,CTSDB产品的运维工作。对于ES、CTSDB在日志分析、大数据搜索、时序分析等场景的使用有丰富的实践经验。
01
李老师,很多人都在谈脱离传统运维模式,更好的帮助业务前行。您是如何看待“运维”在公司的定位和未来的发展方向呢?
运维作为一个比较传统的岗位,在当前大量中小企业都拥抱上云或自动化程度越来越高的背景下,其工作的定位的却是受到了一些影响,以前需要专业运维来部署的一些环境,现在并不是那么需要了,但这并不意味着运维岗位的生存将受到很大的影响。
只是对运维人员提出了更高的要求,一方面需要运维人员对所服务的产品本身的特性,要相对开发人员有更深的认识,从而指导其更开发出更专业的产品;另一方面要快速需要新兴技术,例如熟练掌握云产品的运维手段。
02请问李老师,做好自动化运维架构,我们都需要关注哪些方面呢?
一个好的自动化运维架构,应该是在完成自动化工作的同时,要具备低耦合性,低失败率,高效率等特点。局部功能的失效,不能波及面过大;每个环节的成功率要保持在一个很高的水平,减少人工干预的耗时;面向用户时,要整体且简易,能让运维同学快速上手,且快速安全的完成任务。
03李老师,您看待运维岗位,哪些技能是必备的呢?
需要熟练具备所运维的数据库产品的理论知识、操作系统及数据库运维技能以及一定的开发能力。
04很多企业为了提升故障处理效率,更关注发现故障后的触发流程部分,李老师在提效处理故障方面有什么建议吗?
故障发生后的复盘分析,并找到触发问题的根因加以规避是必须的,但我认为低的故障率,应该在产品设计的前期,就应该尽量规避,否则到了后期,往往修复的代价很大,且不彻底。
05请问李老师,腾讯云CES方面的运维架构有哪些独到之处呢?
1)整个架构在设计之初,就尽量考虑了,后期多机型,多地域的适配问题,所以很多环节都是配置化,减少后期多样化的需求带来的工作量。
2)每个组件低耦合,避免单个组件的升级影响较大。
3)整个架构所使用的技术,都是当前的主流技术,且架构简单,适合新人快速学习上手。