随着科技发展,信息技术也在发生着变化,医院的信息系统如HIS、LIS、CIS、RIS、PACS,NIS、EMR、DRGS等信息系统也越来越多,基础设施也随之越来越复杂,医院的临床业务科室对信息系统的依赖也越来越强。
信息系统的高可用性、稳定性以及整个信息系统的安全性,已经成为医院领导、信息科负责人以及每一位信息科的工程师必须要考虑和解决的首要问题。面对日益庞大的医院信息系统,为保证医院信息系统能7×24小时不间断的高效运行,信息科在日常运维中面临着错综复杂的问题,建立一套智慧型的医院IT运维服务管理系统(简称ITSM)已经非常迫切。
医疗业在信息技术发展的驱动下,相继实施了数据大集中工程,纷纷建立了集约化、集成化的大型医疗数据中心,逐步形成了以全国数据中心为核心、省域数据中心为支撑、覆盖所有基层网点的IT运维新格局。
随着近些年数据集中和资源整合,该医院信息系统的技术体系复杂度和运维风险不断叠加,IT运维如何应对数据大集中后运行规模庞大、管理层级繁多、技术应用复杂的新形势,如何加强信息系统维护和操作、基础设施设备运维、IT运行风险防控、应急处置和灾备建设、业务服务连续性、运维队伍建设等统筹管理,已成为国内一知名医院高管和运维人员必须要解决的问题。
运维目标
该医院希望通过引进全程精细化管理项目方案,可以获得以下重大效益:
解决以往维护工作以“被动式服务”为主的状况
精准量化评估IT部门工作的绩效
解决信息运维故障繁杂、故障处理质量难以跟踪
中统一管理,IT系统全面、多样化的灵活管理,使
IT维护人员实现轻松管理
实现对多品牌、多平台、多类型IT设备及业务资源
的集中统一管理,IT系统全面、多样化的灵活管
理,使IT维护人员实现轻松管理
具有灵活的、清晰的、高效报警策略,报警阈值和
级别可灵活设置,便于故障的准确定位
对设备进行精确告警,出现故障能够快速定位
在出现告警时,告警消息秒级发送,通过多种方式
迅速通知相关人员,保证对故障的快速定位与恢
复,避免造成损失的扩大
通过自动巡检、定时报表、运维流程管控等功能,
可极大的减轻运维人员的工作负担
减轻运维人员的工作压力,展现信息中心绩效成绩
解决方案
针对该医院目前故障处理效率低下、技术人员短缺、出现故障无法快速定位的问题。豪越科技为该医院提出了部署IT智能运维平台的解决方案。该平台可实现对基础设施监控、应用监控、攻击监控和日志管理的监控管理以及数据汇聚、处理、展现、通知的运维管理系统,并内置了运维服务流程系统。
通过该系统可以采集IT环境运行状态指标,通过静态和动态阈值设置实现故障智能预警,让管理员提早发现问题,避免故障发生。故障发生时,智能运维平台可及时报警,并实现故障精准定位,让管理员第一时间得知故障发生,并缩短故障排查时间。同时在机房拓扑图上,对该设备的真实位置进行展示。
IT智能运维平台具体将达到如下目标:
01
强化主动监控,实现集中管理
以IT资源可用性监控为主线,构建统一集成的IT资源、应用服务及网络安全的监控数据采集平台,能够将各类服务器、网络设备实现统一管理,主动、及时地发现问题并及时发送告警信息。构建集中、统一的监控大屏,全年365天7*24小时实时展示各项资源和应用系统的整体运行情况,通过智能化运维使原来错综复杂的运维管理工作变的简单和轻松,真正实现职责分明、安全高效、稳定可靠、智能管控的目标。
02
精准定位故障,快速恢复系统运行
具备高效、灵活的告警系统,可设置告警阀值,告警条件、告警级别、告警信息接收人、告警方式等。提供灵活、自动化的事件处理能力。当故障产生时,可进行故障的快速定位,分析并给出故障原因,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。
03
故障预警功能
对被监控主机及应用运行数据进行统计与分析,判断可能出现的潜在故障并提醒运维人员,以降低故障率和系统风险。
04
实时ITSM工单系统
各科室通过工作台实时提交遇到的问题,服务台根据实际情况分配对应的工程师去排除问题,有效避免了出现故障无法第一时间通知相应的工程师的问题。
05
运维大数据功能
智能运维平台自动收集响应时间、服务质量、网络状态、网络流量、性能指标、负载情况、故障频率及处理海量运行数据,进行数据关联、挖掘与分析,全面展示数据中心的运行状态、性能情况,为系统升级、改造、运营优化及规模扩展提供科学依据。
06
统计分析和决策支持
通过提供各类报表、实时了解全网IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调整业务系统对资源的使用。
07
兼容性强
支持多品牌硬件管理,可对不同时期、不同品牌、不同型号的新老设备进行统一管理,并能自动识别设备型号及配置。
08
定制化的服务监控能力
运维系统可对IAAS、PAAS、SAAS不同层级的服务进行实时监控与管理,并可根据业务需求灵活修改或新增监控对象,满足用户个性化需求。
09
定制报警通知
可根据设备特性自定义告警阀值;根据故障级别、业务划分用户权限管理需求,定制报警形式和设置系统管理人员,使相关责任人第一时间知晓机房运行信息。
10
构建知识管理,实现运维经验共享
知识库管理可将 IT 人员日常维护工作的经验或解决方法积累下来,成为有参考价值的知识共享给整个IT 服务组织,有效提高整体支持人员技能素质,提高服务支持效率,降低单点故障率和人员流动所造成的知识风险。
11
优异的监控性能和扩展性
运维平台具有大规模及超大规模监控能力及高效处理机制,并具有良好的易用性和升级扩容能力。
用户收益
通过实施HYDO监控系统项目,该医院获得了以下收益:
提升 IT 服务水平
通过实现IT 系统、业务过程和关键业务指标的监控,及时发现业务异常和问题,改变传统被动的故障处理方式,最终实现主动的IT 运维服务。
为各业务科室提供了IT部门的首次报备平台
确保临床科室通过服务台可以把问题转交到技术人员并合理的安排,解决了前面存在的问题出现故障需要打N个电话才能联系到人,也解决了科室人员忙的很忙、闲的很闲的问题。
服务台对所有临床科室的故障请求进行记录并跟
踪后续处理过程,直到问题解决。
提升IT资源管理水平
通过IT运维管理系统,实现多个厂家的网络设备、服务器的统一管理。通过建设全面的监控管理平台,将目前各个业务系统中的各种硬件、软件、业务应用纳入到监控平台中来。消除管理对象之间的差别,消除数据采集手段的差别,消除管理软件的差别,对各种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。
提高 IT 投资效益
实现IT 服务成本可计量、故障可定位,合理引导业务需求,减少资源浪费,在提升关键需求支撑水平的同时降低无效IT投资;持续提升IT系统能力,降低建设及维护成本,提高沧州中西结合医院的总体IT 投资效率。