欢迎关注原创公众号:
最近运维团队内部出现过一些运维事件,这些事件大多有个特点就是技术要求并不高,操作实现也并不复杂。但是因为各种原因没有及时采取处理导致最后造成出现较大的影响和对公司和团队形象造成不少的损失。进行事件复盘的时候,我们初步归结为意识不足导致低级错误触发重大影响。
那什么是运维意识,运维意识包括哪些方面以及如何提高运维意识呢?在网上查询了一下资料,个人能力有限并没有找到好的文章,这里结合我自己的个人经验做一下总结,写一下个人看法,希望能够为读者提供些许帮助。
首先是辩证唯物主义对意识的定义:人的头脑对于客观物质世界的反映,是感觉、思维等各种心理过程的总和。
吧啦吧啦,从哲学,生物学以及心理学等上对于意识的定义和解释,我都不会,需要的同学移步百度,谷歌和大学课堂。我这里只是分析人的头脑对于运维工作的反映,其实就是如何从意识层面更好的改进我们的运维工作,降低团队的工作失误,提高效率。
1 运维意识概况
对于运维意识,大概总结了8点:
1 严谨。运维工作直接操作生产环境,每一个错误都有可能导致生产宕机,业务不可用,为公司带来损失,严谨的工作太多和运维意识必不可少。
2 安全意识。做运维,安全不可丢。因为安全意识不到位引发的数据泄露、服务器受病毒攻击等都会为公司带来损失,时刻谨记安全,保障系统和数据不丢失,不泄露,不篡改,不宕机。
3 全局意识。运维面对的工作内容较多,涵盖服务器、网络、存储、系统、数据库等,所运维的系统又有系统之间依赖,系统使用者部门之间、公司之间的依赖等,全局的意识可以让我们在运维工作中不因点失面,保障损失最低。
4 时间意识。不管是开发还是测试还是运维,时间意识一定不能缺失。时间意识淡薄往往意味着执行力底下,工作拖延,意味着风险继续留存。
5 创新意识和危机意识。通过创新提高工作效率提升自己的核心竞争力,同时保留危机意识,不断学习避免被创新所淘汰。
6 团队意识。日益复杂的架构和不断的问题,个人英雄注意很难应对一个公司的全部需求,团队意识必不可少。
7 工作管理。科学的工作管理可以促进工作按时高效完成。
8 自我评价。阶段性的自我评价有益于个人的总结和进步。
以上8点不分先后,是我自己运维工作这几年对运维意识的一些想法和总结,接下来结合实际情况,进行展开并提供一定的方法来提高团队和个人的意识。
2 运维意识详述
1 严谨的运维意识
严谨的运维意识体现在运维工作的方方面面。严谨的运维应该是基于运维操作手册和标准化操作流程以及风险预估和回退方案。
- 1 生产操作前
(1)编写操作STEP;
(2)确定影响范围;
(3)模仿生产搭建测试环境,多维度测试step及细化影响;
(4)全方位思考可能出现的问题和意外;
(5)编写问题和意外应对方案;
(6)编写回退方案;
(7)编写验证STEP;
(8)记录操作时间;
- 2 生产操作中
(1)按照操作STEP复制黏贴,尽量避免手动输入命令;
(2)出现方案内的问题和意外,按照预案处理;
(3)出现方案外的问题和意外,非常明确的可以直接处理,模糊不确定的,停止操作,进行回退;
(4)不管是回退还是正常操作完毕,必须按照验证STEP进行验证;
(5)记录操作时间
严谨应该是运维工程师所具备的第一意识。因为运维所接触的都直接与生产发生关系,每一步操作的准确与否直接影响系统的正常,严谨必不可缺。
完善的运维规范和运维流程可以帮助运维人员提高严谨的运维意识,保障少出错甚至不出错。
2 安全意识
安全意识可以保障公司数据财产不丢失,不篡改,也可以保障系统不受影响保证可用。敏锐的安全意识可以迅速识别安全风险,并行快速做出响应对策。尤其在当前IT大环境下,病毒、漏洞、渗透等攻击手段日益增多和日趋多样,安全意识不到位带来安全风险将直接为公司带来损失。
个人觉得安全意识的培养还是应该从安全培训做起。定期不间断的安全培训可以提高IT成员的安全意识,另外就是懂规章制度和流程方面进行宣贯,保障安全干系人能够知道安全风险响应流程,安全事件汇报流程等,以此来强化全员的安全意识。
3 全局意识
运维所面临的是IT工作的方方面面,存储、服务器、操作系统、网络、应用、数据库等等,不同的系统之间依赖交织,不同的设备之间上行下行,相互关联,运维所面临的不只是一张网,更像是一个蜂巢。在这样的情况下如果没有全局运维意识,极有可能因为一个点的故障或是变动影响到一个面或是一个整体的可用性。
如何增强运维全局意识,个人人为还是得从管理角度来培养。让运维工程师承担一些运维项目或是一组运维项目,在独立管理运维项目和运维对象集合的时候,经常会跟部门内部或是部门之间沟通交流,会逐渐养成全局的意识。另外一点,建议由运维部门共同完成所有运维对象包括系统系统之间,接口系统之间以及硬件设备时间的依赖管理,形成系统依赖关系图或关系链。这样在面对运维事件进行处理的时候,可以直接查阅该关系链,避免关联影响。
4 时间意识
运维项目或是运维工作一般具有以下特点:一般都比较紧急,处理时间一般要求越短越好,间歇性的一个问题紧接着或同时多个问题。我们日常工作的常态也是一天之中同时处理多个运维项目和紧急插队的运维工作。时间意识淡薄,时间管理不到位往往带来的是工作延期,运维项目延期。
如何加强时间意识,这个可能真的跟个人性格、工作经验等有关系。不过还是建议进行专业的时间管理培训,这样有助于提升自身的时间意识。另外项目化管理运维工作,有开始,有结束,定期跟踪进展,从时间上把控运维工作。尤其运维管理者不只是要做好自己的时间管理还有做好团队的时间管理,保障运维工作有序、有计划的进行。
5 创新意识和危机意识
随着运维自动化、智能化、私有云等新技术的日益普及,传统运维的套路越来越难以生存,不及时学习新技术,使用创新的工作方法和技术来提高日常工作效率,失业是迟早的事情。常怀危机意识,既包括技术革新带来的职业危机,也包括各种运维事故、安全风险带来的宕机危机,不断学习,通过新技术、新思路革新传统运维,不断创新,才能让自己处于金字塔的顶端。
如何提高创新意识?个人感觉还是应该保持持续不断的学习,做IT这一行,要想不被淘汰,学习必不可免。关注前沿技术,大公司的技术方案以及积极参与各种沙龙、峰会与同行相互交流学习,并且勇于尝试于日常工作中,降低日常工作的重复度,提高效率。危机意识的培养更多还是要基于自身职业规划和对系统或运维对象的深刻认识。好的职业规划可以促使自己主动学习新的只是来淘汰或是优化已有知识,懂得越多,越感到自己不知道的越多,当感觉自己把自己淘汰的时候,其实你也已经站在金字塔顶端淘汰了大部分碌碌无为者。对系统和运维对象的深刻认识可以知道运维故障带来的损失,进而增强对工作的危机意识,促使自己更加严谨仔细的工作。
心怀危机,拥抱风险,不断学习和创新,总会让自己拥有立足之地。
6 团队意识
团队意识,是团队成员中必不可少的。日益复杂的运维环境需要团队成员间相互配合、互补互进。
怎么增强团队意识呢?我们一般的做法是聚餐,相信很多公司都这样,不得不说这真的是一个不错的方式,尼古拉斯.赵四说过,世界上没有什么事儿是一顿烧烤不能解决的。如果有,那就两顿。除了聚餐、旅游,技术讨论、技术分享也都是很好的方式。甚至极端点的共同背锅更能体现兄弟情谊。
严肃来讲,作为运维管理者尤其要重视团队建设,这直接关系到团队凝聚力和战斗力。科学合理,实施有效的团队建设必不可少。
7 工作管理
严格来讲,工作管理不是因为意识,但是这里分享一些个人认为好的工作方式和方法,希望能够在日常运维工作起到帮助。
首先工作明确自己承担的工作项目、范围、优先级、时间节点。其次要分析完成工作需要的外在条件,提前协调好。
工作要主动汇报,及时汇报。汇报进度和问题,让同事和领导知道你的目前进度和目前面临的问题。
再有一点就是执行力。加强执行力,减少工作拖延。
8 阶段性自我评价
对于自身发展要有目标,有计划,并且定期进行自我评价所学所得,以及与目标的差距。反省自身的缺点进行不断改进。