【摘要】由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的摩尔定律,当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。这一定律揭示了信息技术进步的速度。从286开始一路“奔腾”,短短的二三十年间,这个行业已经带领万物飞上了“云端”。现在这个定律已经越来越难维持了。这种飞速的发展让IT人从一入行开始,就注定了前路变化莫测,IT人的路该何去何从,是否真的要摸黑前行呢?这里,结合我的一些经历和和大家分享一下我对这个行业中系统运维岗位的看法。

【作者】潘延晟,运维工程师,系统架构师,曾任吉林通钢自动化信息技术有限责任公司信息科副总工程师。有19年的系统集成与信息化运维经验,参与建设并维护钢铁行业大型信息化网络,专注于钢铁行业信息化网络建设与规划。曾获“存储架构之美”软件定义存储解决方案擂台赛优秀方案。擅长领域:系统运维,网络安全,数据安全,系统架构设计,网络架构设计。

 

 

在信息化发展的初期,企业在信息化建设中主要以购买硬件为主和基础网络建设为主。人们对信息化能干什么还不够了解,只知道一台台的交换机和服务器是实实在在摆在那里的。

这个阶段,服务器基本采用竖井式的架构,交换机和路由器是网络的主力,信息化建设往往缺少长远规划。因为架构本身设计缺陷和设备性能等因素影响,常常出现系统宕机和网络堵塞等问题,也因此开始出现了运维岗位。但从运维岗位出现开始,就面临了一个尴尬的境界:“系统不出问题时,运维好像没什么用。系统总是出问题时,运维好像也没起什么用”。

到了第二阶段,信息化以应用系统建设为主。经过一个阶段的信息化发展建设,大多数企业认识到了信息化为企业带来的价值,并把主要的资源投入到应用系统建设以及相关的应用服务上。企业逐渐接受外部咨询服务,引入外部力量帮助进行数字化,信息化转型。信息化的建设推动了软件行业的发展,软件行业受到了应有的尊重。企业开始看到了智能化的信息系统带来的实际好处,对各种业务应用系统的依赖也越来越多,舍得在信息化系统上花钱,对原本看得见摸得着的硬件设备,反而开始不舍得投入了。信息化发展的重心从原本的硬件开始又转向了软件,而忽略了设备的老化、架构的不合理、业务不断扩展遇到的各种软硬件瓶颈,忽略了底层服务器,网络安全,中间件以及数据库的基础维护,也忽略了运维岗位的重要性,觉得系统一旦运行就如同机械一样稳定可靠。

经过上述两个阶段,企业开始意识到信息系统整体的重要性,开始进入重视IT治理的全面建设阶段。在基础设施和应用系统建设基础上,全面关注信息化整体规划,更多关注信息化对企业发展的战略支持,把IT作为企业核心竞争力的一个重要组成部分,关注企业信息化建设的组织、流程和人力资源等,开始把信息化建设作为企业内部一个重要发展方向看待,而不仅仅是一个项目或者一个阶段的事情。走到这个阶段,很多企业已经开始建立了自己行业的信息化系统,如制造行业的ERP、MES,医疗行业的HIS、LIS,办公用的OA、HR、MAIL等。同时企业的管理者也开始担心这些企业核心的业务系统一旦出现问题时该如何应对。事实上,这个阶段,硬件故障,网络安全,系统安全,数据安全等各种问题已经成为信息系统的最大威胁。每一次网络安全事故都可能造成巨大的经济损失,甚至影响到国家安全。为了保障信息化系统的可靠运行,越来越多的设备,越来越多的技术开始涌进了数据中心并且不断完善和优化。虚拟化、容器、微服务、软件定义、超融合、分布式架构、双活、两地三中心等技术和架构应运而生。信息化系统的功能越来越强大,结构越来越复杂,可是这么多的设备,这么复杂的架构谁来管控?成了很多企业面临的问题。

信息化的发展让原本在幕后的运维开始走到了台前,成为操控和维护庞大的智能化系统的主要岗位,运维岗位开始承担更多重要的工作,但实际的情况却不容乐观。

现阶段的信息化运维几乎贯穿了整个信息系统的生命周期,对于运维岗位,企业提出了更多的要求。可是现在能完全满足企业需求的运维人员数量却远远低于市场的需求。人们可能会有疑问,几乎每所大学里都有计算机技术相关专业,再加上社会上的IT培训机构的输出人才加在一起IT人才还会短缺吗?其实IT行业技术人才短缺是一个不容置疑的事实。由于传统学历教育培养出来的大学生缺乏实战经验和项目经验,往往在教学上很难有质量保证,导致了每年新培养出的IT技术人才并不能百分百的完全被企业接受,这样整个IT行业的人才困境就更加严峻。也正是由于IT互联网”飞”一样的发展速度,才让每年新增的技术人才缺口在百万之巨。每年培养出来的人才可以说是杯水车薪。

虽然当下阶段,运维岗位从幕后走到了台前,各个企业开始考虑运维问题,但信息化运维却仍然面临很多的问题

(1)IT运维工作琐碎繁杂,重视程度差。

很多单位由于人员少,分工不明确,运维人员几乎承担了从终端到上层业务之间的所有工作,每个IT运维人就像“救火员一样忙碌”。即便如此,业务人员还是经常抱怨“找不到人”、“解决问题太慢”等等。IT运维人员的工作很难得到业务部门的认可,工作也难以量化。运维或信息部门作为服务部门,在信息系统的战略规划项目立项等工作中话语权较弱,对于现有系统中的问题只能建议,无法决策,往往是项目建设完成之后才介入系统的管理和维护,等发现问题为时已晚。

(2)IT系统复杂,维护难度高,风险压力大。

随着信息化的不断投入,硬件设施、软件系统不断增加,IT运维的复杂性也在不断增加,导致IT运维成本居高不下,却难以见到实际性的收益。对业务连续性要求较高的单位,系统一旦宕机损失是巨大的,运维部门往往要扛着巨大的压力。有的单位由于缺乏科学的资产管理,运维部门很难准确了解公司到底有多少IT资产,公司是否需要购置新机也缺少数据支撑。在年底审计时全团队奋战多日才能完成单位的IT资产清查工作。更多的时候,运维部门成了其他部门眼中的只会花钱的部门。

(3)技术人员难培养,流动性大。

对于企业来说,如此庞大、复杂、重要的系统容不得半点不确定的因素。每一个已经开始运行的生产系统都不会允许新人随意的去操作和测试。运维人员很难在实际的生产环境来获得技术经验。好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内出现波动。

(4)服务商难管理,技术水平参差不齐,服务不及时,问题不能及时解决。

IT运维服务外包也同样存在一定风险,关键在于对于IT运维服务外包供应商的技术水平和服务管理不到位。由于IT运维具有相当强的专业性,很多时候甲方无法独立判断IT运维服务外包供应商的技术水平和服务能力,造成了虽然购买了服务,却没有收到预想的效果。

(5)企业对于自身信息化了解不足,盲目的跟风上云逃避运维问题。

随着云计算的发展与普及,越来越多的企业选择了业务上云,看似解决了运维问题。但是实际情况却并非那么完美,无论选择IaaS,PaaS还是SaaS,企业都要对自己使用的系统有足够的了解。云服务提供商只能保证你所租用的服务正常运行,却不能代替你来管理自己的业务,不能百分百保证在非正常状态下面临的勒索病毒,木马入侵,SQL注入等安全问题,因为误操作造成的数据丢失,因为资源不足造成的业务宕机等等问题。简单的说,当你对你自己在用的系统一无所知时,放在云上和放在本地数据中心都存在着同样的风险。

运维岗位今天所面临的尴尬局面,不是短时间内产生的,但恰恰是这些问题带来的挑战,才让IT运维岗位充满了机遇。

面对机遇和挑战,作为一个运维人,如何才胜任现代化的运维岗位呢,我觉得应该具备以下的技能。

1. 弱电基础。IT运维首先就要从机房环境开始,空调、消防、UPS、门禁监控以及其他的辅助系统都是运维人员需要留意的部分,温度、湿度、电力供应、防火隐患等往往会给机房的设备造成重大的灾难。

2. 网络基础知识。无论是你软件运维、系统运维、还是网络运维,互联网基础知识都是必不可少的。现在几乎所有的应用系统软件都依赖于网络,而所有应用业务正常运行的基本条件就是网络畅通。所以无论ISO 7层模型、IP地址计算、Vlan原理、路由协议这些基础知识有多么的枯燥,都是一个合格的运维人不可缺少的基本技能。

3. 服务器硬件基础知识。网络提供了应用系统运行的线路,服务器提供了应用系统运行的环境,应用系统运行时,CPU、内存、存储、甚至系统供电都会对庞大的系统产生影响。

4. 操作系统知识。掌握主流的操作系统,熟悉操作系统的基本工作原理、基本操作以及操作各个系统之间的区别。

5. 存储及存储架构知识。了解目前主流的存储类型、架构、以及基本的特点,除了CPU和内存这些性能参数,存储IO性能也是影响系统运行的重要因素。

6. 中间件及数据库知识。了解主流的中间件和数据库产品,工作过程以及技术特点,当应用业务发生问题时候,这些知识可以帮助我们判断应该是找程序开发还是数据库管理员。

7. 简单的脚本开发。,信息化系统变得越来越复杂和庞大,为了简化运维,编写基本的运维脚本也是运维岗位必备的技能之一。。

8. 了解所处行业特点。很多行业诸如医疗、制造、金融、教育等,都有着鲜明的行业特点,由于这些行业特点,所产生的信息化系统也有着各自的独特性,对各种资源的需求也不尽相同,忽略了行业特点,往往会让信息化的建设和运维产生很大的偏差。

9. 安全知识。如今信息化系统面临的最大风险,除了设备故障以外,便是来自各方面的安全风险了。病毒、木马、DDOS攻击、垃圾邮件、数据泄露等等安全问题对企业核心的信息化系统带来的危害越来越大。

10. 数据备份和容灾。当企业开始适应信息化,并且实现所有业务的信息化之后,生产数据就成了企业的生命线。人为恶意操作、勒索病毒、设备损坏、黑客入侵等等问题造成的数据丢失和损坏往往会给一个现代化的公司造成致命的打击。

11. 学习新知识的能力。虽然技术在不断发展和创新创新,但技术的发展总是遵循着基本的需求规律,变得速度更快、运行更稳定、操作更简便。只有不断的去学习新的知识,对比传统技术发生了哪些变化,了解技术变迁的路线,才能让自己的知识体系更加全面和宏观。

现代的信息化运维已经不再是简单的安装操作系统,插拔网线。而是对整个信息化系统的全面维护,是衔接业务公司与IT系统交流的桥梁,是企业信息化管理的一部分,是集多IT工种与一身的综合性岗位。运维岗位看似枯燥,辛苦,又经常背锅,但却是一个难得的锻炼机会。作为一个可以接触到信息化的全流程,全周期的岗位,运维人员应该能够从一个全面的角度看到业务系统工作的流程,结合企业特点可以发现整个网络,系统,应用以及安全防护中的痛点在哪里,能够站在管理角度俯瞰整个信息化系统,知道现问题在哪里,知道将来企业的信息化要怎样规划。

随着信息化整合度越来越高,对运维的需求不会仅仅停留在技术层面,要求也会越来越高,那么作为一个合格的运维,你准备好了吗。