随着云计算、大数据、人工智能等技术快速发展,越来越多的企业和组织加速数字化、智慧化转型,并不断扩大其数据中心计算、存储和网络设备的规模。据IDC统计,目前全球有600个超大规模的数据中心,每个都拥有超过5000台服务器,预计到2025年,超大规模数据中心数量将超过890个。

数据中心规模持续、快速地增长创造了巨大的市场机遇,但随着IT设备的数量不断增加,IT环境和运维环境的复杂性与日俱增,任何的错误都可能导致数据中心系统故障,甚至业务中断,对用户造成巨大影响。

■■ 浪潮信息全新升级物理基础设施管理平台ISPIM,面向互联网、金融、通信等行业的云边数据中心,提供服务器、存储、网络设备的全生命周期统一智能化管理,让数据中心设备运行全程无忧,保障用户业务的稳定运行。


数据中心360°智能运维无忧 浪潮信息全新ISPIM平台_数据中心

IT设备繁多,数据中心运维面临效率与稳定性等多重挑战

传统数据中心运维人员要进行大量的设备上架、系统更新、运维等一系列的工作。随着数据中心的规模化发展,服务器数量爆发式增长,设备种类多,各类故障发生的不确定性大,而且随着数据中心设备的增加,原来粗放的能耗运维管理也需要更加精细化的管理。

首先是设备种类多,统一管理难度大。比如浪潮信息某跨国IT客户,在美国加州、马来西亚拥有多个数据中心,其中的服务器供应商、机型、配置多种多样,运维人员工作量大且容易出错。因此如何对多地数据中心,数万台甚至数百万台的异构设备进行跨地域、统一管理和监控面临很大的挑战。

其次是存在的各类故障让数据中心稳定性面临不确定性。目前数据中心的故障率为1%~5%,故障出现概率虽然较低,但仍有可能对数据中心稳定性造成严重的影响。如果不能有效进行故障精准定位、快速预警以及更进一步的处理,会增加服务器非计划停机时间,对用户造成重大影响。

同时还有数据中心能耗成本居高不下的问题。随着数据中心设备规模不断增长,能耗成本越来越高,能耗管理也成为了IT设备全生命周期管理的一部分。但传统服务器运维模式无法单独对服务器的功耗进行实时的监控和统计,只能通过供电设备对整个机房(包含空调、照明、服务器等)耗电进行统计,能耗管理粒度粗。


数据中心360°智能运维无忧 浪潮信息全新ISPIM平台_服务器_02

浪潮信息ISPIM,数据中心设备的360°智能管家

面对数据中心的全新运维挑战,浪潮信息研发了一套完整的服务器全生命周期运维方案ISPIM,帮助企业用户统一管理服务器、存储、网络等设备,提高运维效率、降低运维成本,保障数据中心稳定的运行。

针对用户多地数据中心设备种类多,统一管理难度大的问题,ISPIM通过统一接口,协议,能够纳管多达400种机型,设备数量最多可达10万台,是目前最大的数据中心服务器运维平台。在自动化运维管理方面,ISPIM平台资产快捷清查功能支持设备快速盘点、自动录入系统、3D全景巡查、统一报表等。在某客户数据中心系统BMC、BIOS升级、软件部署更新等工作中,通过浪潮信息ISPIM平台,帮助客户将3500台设备的部署周期从原来预计的几十天,缩短至7天,运维效率提升450%以上,实现固件/OS/软件快速更新,保障数据中心稳定的运行。同时ISPIM提供丰富的北向API接口,为客户后续业务应用拓展提供更多灵活选择。

数据中心360°智能运维无忧 浪潮信息全新ISPIM平台_数据中心_03

注:以客户数据中心容量3500台设备为例

除了大规模数据中心运维需求,针对小规模部署场景,运维人员无需设置单独的集群管理软件,通过浪潮信息ISPIM SaaS版本将服务器系统运维工作上云,也可享受浪潮信息服务器运维专家的360°服务,实现数据中心服务器的远程托管。同时运维人员还可通过手机APP对服务器进行带外管理和监控,自动完成服务器的快速健康体检,并输出检测报告。

随着数据中心IT基础设施需求的快速增长,IT环境和部署环境愈加复杂,潜在的各类故障让数据中心稳定性面临不确定性。而故障运维管理从最初的脚本运维、工具运维到平台运维演进至今,已接近人力极限,亟需更加智能化和人性化的运维工具。浪潮信息ISPIM平台的智能实时预警功能覆盖数万种服务器宕机案例,穷尽服务器CPU、硬盘、内存、故障案例,可对非宕机类故障进行实时预警降低服务器高负荷运行下突然失效的风险。

同时,开机过程中ISPIM会进行故障实时检测与隔离,CPU、存储等各子模块进行自检检测,若有问题会及时隔离,运行阶段会对内存进行实时的巡检检测,主板、电源也会设置故障智能诊断,故障日志分析、故障预警等前沿技术,包括了浪潮信息ISBMC、InService、AIOPS等故障处理能力。此外,ISPIM的故障诊断定位精度领先,精准度达到95%,远高于业界50%的平均标准,让数据中心故障运维效率提升80%。

数据中心360°智能运维无忧 浪潮信息全新ISPIM平台_服务器_04

针对数据中心设备能耗优化,浪潮信息ISPIM设计了数据中心能耗实时监测,可以实时采集服务器在运行时耗费的电能,并根据数据中心温度、湿度、气流等因素综合调整优化,可以动态管理单机和数据中心的功耗,进一步优化、均衡服务器运行负载,提升整体业务运行的可靠性,节省约15%~20%的能耗。

目前,浪潮信息ISPIM凭借着这些优势,在海内外收获了广泛的认可,为全球互联网、金融、通信、IT、教科研等用户的数据中心,提供全程无忧的运维服务,保障数据中心业务稳定地运行。