运维工作直接关系到应用系统运行的是否正常稳定,但运维工作纷繁复杂,正规化、系统化工作推进起来相对比较困难。为改变这种现状,应在工作中总结经验,并制定运维规则,只有这样才能提高运维水平,保障应用系统正常稳定运行。

笔者通过自己的运维经验,总结出以下必须遵守的基本运维规则,可以大大减少缺乏经验的运维人员因为自身操作失误导致系统出故障的可能性,同时有助于加强运维人员对于运维工作的全面理解。

1工作职责

运维工作职责包括:协助完成IT系统基础架构的设计规划;负责系统硬件架构的实施部署工作;负责Windows、Linux以及Unix服务器系统的日常运维工作;负责数据库的日常运维;承担机房的运维工作;负责备份系统的日常维护。

1.1系统稳定

运维的主要工作是保证系统的可用性和稳定性。应用上线后,运维工作才刚开始,具体工作包括:升级上线版本工作、服务监控、应用状态统计、日常服务状态巡检、突发故障处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化、随着应用增减进行应用架构的伸缩、安全、运维开发工作。 

1.2彰显能力 

通过提供运维技术支持,让客户认可公司业务能力和服务水平,有助于提升公司形象。运维人员经常要和客户打交道,客户时不时就有一些问题反馈到运维人员手中。如果运维人员能够快速、准确地解决问题,在客户心中就会留下好印象,有助于提升个人在客户心目中的威信。同时对你的公司也会赞赏,提升公司在客户心目中的形象,达到实现双赢的局面。 

1.3二次销售 

下意识对客户进行二次销售的销售意识是每个运维人员应培养的。在运维过程中,应向客户渗透公司其他产品,推动后续合作。如果只是解决客户反馈的问题,只能说明你是一个合格的运维人员,想要进一步提升自己,学会二次销售是运维人员必不可少的技能。通过二次销售,推动客户与公司的合作,进而提高自己在公司的能力和地位。 

2运维必备 

运维工作对于很多企业来说都很重要,一些基础知识命令自不必说,那是一定要掌握的技能,比技术更重要的就是运维时容易让新手忽略的一些经验,下面将运维工作的注意事项总结如下。 

2.1预案先行 

运维是一门经验学科、是一门试错学科。运维过程中经常遇到意想不到的难题。因此变更前,一定要在相同或者相似运行环境下进行测试,通过后才能在正式环境下执行变更。同时应准备好变更失败的回退预案,比如:做好系统备份、数据库备份、配置备份,固化变更前的运行现场,让变更有回头补救的机会。 

2.2勿忘备份 

不管是硬件还是软件总有意外崩溃的时候,这时候就需要备份。备份的学问很大、按照不同的维度可以分:冷备和热备、实时和非实时、物理和逻辑、全备增量备。有了备份就可以高枕无忧了吗?当然还是不够的,还需要验证备份的有效性。 

2.3谨慎操作 

避免在生产环境下直接进行运维操作,这是避免应用系统发生故障的一条铁规,也是开发人员、运维人员容易忽视的。要坚决杜绝直接在生产环境做开发、测试和bug修复,这些操作只能在开发和测试环境做,否则一旦出事,将造成无法挽回的后果。 

2.4多人运维 

运维人员要保持AB角色,至少配备两名人员,防止系统故障时候找不到人。并且全部运维工作必须有操作文档,两个人互相协调工作,24小时待命,这是普通运维部门一般要求。如果是集团型大的网络架构,会配备自己的数据中心机房,会统筹安排专人进行运维。 

2.5监控手段 

运维人员赖于生存的两大工具是报警和监控。报警可以让运维人员及时知道系统出现了哪些异常、以便及时跟进、把故障扼杀于摇篮中。监控可以让运维人员了解系统的历史性能信息,做到信息追溯,早做优化。报警和监控运维人员推进工作的两大板斧,它们相辅相成,互相促进。 

2.6自动化技术 

运维工作中有很多琐碎、重复的事情,当服务器数量较少,项目数量也较少,靠纯手工操作还可以应对。但随着时间的推移,项目数量会增加,如果运维工作按照之前方式进行,很难满足需求,既浪费运维人员的时间,很容易因为人员疏忽,出现错误。总体考虑时。我们必须对琐碎的、重复的事情进行自动化处理,提高工作效率。 

3综合技能 

运维人员掌握技术之后,还需要从不同方面提升自己的综合能力,要清楚不是技术水平提高了,就能出色完美地完成工作。还要保持良好、积极的心态,主动向领导汇报工作进度,懂得资源搭配与协调等,这些都是一个合格的运维人员必须掌握的技能。 

3.1积极心态 

工作或者说做任何事情,积极的心态很重要。没有积极的心态,做什么事情都会提不起精神,总感觉忙忙碌碌的,却又感觉自己什么事情也没做,甚至出现怠工现象。工作心中永远也别想着是给别人打工,心情好了多干点,不好了少干点,这样的话吃亏的是自己,而不是老板。 

3.2工作汇报 

针对工作情况,要向公司领导及客户做好相应的汇报,不然对方不清楚你做了哪些工作,甚至有时候会产生误解:这人经常忙,可是见不到成果,同时,出了问题,也会怀疑你的能力。对领导做如实汇报,工作汇报的时候,尽量要有理有据,同时也要勇敢承担责任,不要撒谎、抹黑他人,这种做法可能带来暂时的效果,但是往往经不起时间的验证。 

3.3运维分配 

合理地分配资源,根据成员能力,分配适合的项目运维工作。当运维工作需要多人完成时,协调好人员资源,共同推进运维工作。做到每个人一个主运维项目,一个副运维项目,每个运维人员负责的项目相互交错。 

4写在最后 

在企业看来,运维工作的作用其实就帮企业节省成本。在团队分工上来看,运维工作可以帮助程序人员将主要精力用于编码和解决问题,而不必花费大量精力在环境部署及发布上。运维人员还可以通过监控、测试,向开发人员反馈以暴露程序问题。 

4.1工作感想 

想必大部分人对于运维的理解是片面的,尤其是新同事,从学校或者培训班中走出来,应聘的都是开发岗位,会认为只有写代码才会提高技术能力。在我接触到运维工作之后,逐步理解了写代码只是众多技术的一种,运维也包含很多可以学习的技术,比如编写脚本,本质上也包含定义变量、if判断、for循环,这也需要代码逻辑。再比如测试工作,不要以为鼠标点点就叫测试,编写自动化脚本,才是测试技术的核心。而且运维工作中需要服务器、集群架构知识,对于培养全局能力有很大帮助。 

4.2不足之处 

回顾之前的工作,我在思想上、学习上、工作上取得了新的进步。但我也认识到自己的不足之处: 

1.缺乏主导权:客户提出问题后,没有自主思考,而是跟着客户的想法走,无形之中加大自己的工作难度和工作量; 

2.对项目没有清晰的认知:接手项目后,对项目具体内容不清晰,对接系统、服务、流程个数等信息不了解; 

3.缺乏知识传递的意识:大多时间都是客户反馈问题,我们帮他们处理问题,我们成为了客户的力工; 

4.没有养成二次销售的意识:没有在运维过程中,向客户推荐公司的其他产品。没有下意识推动后续合作。 

4.3工作目标 

随着后续项目越来越多,新工作内容的展开,可以预料运维的工作将更加繁重,要求也更高,需掌握的知识更多。为此,需要我们更加勤奋地工作,刻苦学习,努力提高文化素质和各种工作技能,作出应有的贡献。 

在今后的工作中,我会努力学习专业知识,掌握更多的运维技能,为将来的工作打好坚实的基础。领导交办的每一项工作,分清轻重缓急,科学安排时间,按时、按质、按量完成任务。积极响应公司加强管理的号召,遵守公司的规章制度,做好本职工作。