Intel DCM案例分享:
中国石油化工股份有限公司石油物探技术研究院(以下简称“物探院”)是中国石化石油物探高新技术和核心技术研发中心,其主要职责和任务是承担国家及中国石化石油地球物理勘探方面的基础性、前瞻性和重大项目攻关与核心技术研发,为中国石化可持续发展提供资源保证。物探院数据中心的能耗管理变得日益急迫,能耗成本成为数据中心IT部门的核心成本来源,同时也是最令IT部门担忧的问题。因此物探院希望找到能够帮助数据中心降低能耗的有效办法。
基于物探院的业务需求,Intel为客户部署了英特尔数据中心管理平台。英特尔数据中心管理平台(Intel Data Center Manager,IntelDCM)是一款对数据中心服务器功耗和温度进行监控、管理和优化的软件技术产品。通过部署英特尔数据中心管理平台,可以帮助物探院对其数据中心服务器的能耗情况进行有效管理。
在部署了英特尔数据中心管理平台后,在不影响业务性能的情况下有效降低了数据中心能耗,十分出色的解决了物探院的数据中心所面临的问题。英特尔数据中心管理平台在物探院的成功部署,在如何建设环保节能型数据中心方面进行了有益的尝试,通过部署英特尔数据中心管理平台,物探院的能耗降低了近10%,同时管理效率得到有效提升。物探院信息中心副主任王永波表示:“通过利用英特尔数据中心管理平台,我们物探院数据中心的能耗有大幅降低,同时又保证了工作效率和安全性。这既符合了我们建设绿色机房的需求,也降低了我们的日常成本。”
Intel数据中心管理解决方案是如何帮助物探院有效管理数据中心的呢?
虽然现代数据中心通过严格的温控措施,安全措施来保证服务器的安全有序运行,同时也令各种节能环保措施的集中应用变得可能。然而,如何兼顾低能耗和服务器的高效率、高安全性工作是值得数据中心运维人员予以平衡的问题,同时这也会直接关系到一个数据中心的总体拥有成本(TCO)。物探院找了一个解决方案来以降低其数据中心的TCO,它们选择了英特尔数据中心管理解决方案并最终部署在它们的数据中心。英特尔数据中心管理平台可以在不影响服务器系统运行的情况下,以带外方式对服务器的整体功耗进行实时监测与管理,并通过对历史数据进行分析,针对实际环境和服务器运行
Intel数据中心管理解决方案是如何实现数据中心节省能耗的呢?
数据中心虽然部署着成千上万的服务器,但并非每一台服务器都在全负荷地工作。高级能源分析师埃里克伍兹(Eric Woods)曾经这样表示:“服务器虽然使用了60%的功率,而处于事实上的无所事事中(Servers use 60 percent of their maximum power,while doing nothing at all)”。在物探院的数据中心,同样有着相同的问题,物探院信息中心副主任王永波表示,当数据中心的工作量在较低时,该服务器的约40%至50%没有任何工作负荷,可以被暂时关闭。
针对这一情况,英特尔数据中心管理平台提出了简单却高明的策略:英特尔数据中心管理平台可以自动监测到物探院数据中心内每一台服务器的实时功耗和进风口温度,并对这些数据进行记录并存入数据库,持续得到一段时间(如一个月)的数据后,英特尔数据中心管理平台就可以针对这些功耗数据进行分析,并执行相关策略。例如:当运行英特尔数据中心管理平台一个月后,通过功耗数据分析发现,物探院一部分机器在夜晚都处于空闲状态,其中40%至50%的服务器没有有效的应用负载运行。那么管理员可以通过英特尔数据中心管理平台定相应的策略,将可以休眠的服务器执行休眠或关机,并在第二天早晨实际应用上来以前重新唤醒或开机。另外,与任务调度系统将结合,利用英特尔数据中心管理平台智能策略开关机功能,在有高性能计算业务运行前将因闲置而关机的服务器开机,而在计算业务结束后将处于空闲状态的服务器休眠关机,可以在不影响业务的情况下,大大节省数据中心能耗,以1千台服务器节点为例,如果平均20%的服务器处于空闲或低负载状态,空闲功耗90W,假定PUE为1.8,电费为0.9元/度,则利用英特尔数据中心管理平台行策略开关机管理,1千台服务器1年可节省的电力费用为26万元人民币。
英特尔数据中心管理平台工作界面
众所周知,空调温控设施在保持数据中心适宜工作温度的同时也带来巨大的通风制冷消耗。一般而言,服务器的适宜工作温度为18至27摄氏度,而物探院数据中心之前的机房温度一般为20摄氏度,这提供了一个可能,提高数据中心的运行温度来减少能源消耗。当然,这也不是一件简单地工作,需要谨慎处理,以避免引发热点,导致数据中心设备和服务的停机和损害。物探院用英特尔数据中心管理平台来采集温度数据,可以实时获取每一台服务器的进风口环境温度,这相当于在每一台服务器上都增加了一个天然的智能温度计。这些温度信息汇总到管理界面,数据中心的管理员就可以合理的设置空调制冷系统,避免了过度制冷所造成的资源浪费,同时防止了制冷不足而可能出现的热点。利用英特尔数据中心管理平台,物探院发现数据中心服务器进风口之间有5℃的温差。温差较大会导致数据中心产生热点并降低操作的可靠性。通过在冷空气出口增加空气温度来减少进风口温差可以帮助消除热点,同时,其还有助于提高数据中心的冷却效率。研究分析及数据统计表明:物探院数据中心的空调出风口温度每提升4摄氏度,预计可以节省32%的制冷机功耗。
机房服务器温度分布及分析
除了能耗方面的管理,英特尔数据中心管理平台还具备一系列紧急情况的处理机制来保障数据中心的安全运行。例如,在发生暴雨等突发情况时,数据中心正常电力可能会中断,只能启用UPS紧急供电模式,或者机房制冷系统故障等突发状况,数据中心管理人员不得不进行备份、关机等操作,业务运行也很大可能会中断。通过启用英特尔数据中心管理平台紧急策略,可以将低优先级的服务器节点自动关机,中优先级的服务器节点自动启用最小功耗策略,而高优先级的服务器维持正常运行,并维持较长时间。在未来,英特尔还将与物探院继续合作,采用更多的新技术,使其数据中心的管理水平获得更大的提高。
结论:英特尔数据中心管理平台(DCM)是一款在数据中心能效管理及降低总拥有成本方面卓有成效的管理工具。
在南京物探院的部署中, DCM通过对数据中心服务器进行监控,对数据中心机房温度进行自动调节,并构建了一个统一的管理平台,有效的对服务器能耗进行了管理。南京物探院可以跨平台通过带外方式对数据中心服务器进行远程管理。
利用DCM进行策略开关机管理,物探院每1千台服务器1年可节省的电力费用可达26万元人民币。
利用DCM对数据中心机房进行温度调节,物探院预计可以节省32%的制冷机功耗。
更多数据中心管理产品信息敬请登录:
http://www.intel.cn/content/www/cn/zh/software/data-center-overview.html
或者发送邮件至dcmsales@intel.com与我们联系。