此博文的原作者是 Dell 热能工程师 Dominick Lovicott。
Dell PowerEdge 服务器部署在多种��境中,每种环境都有其独特的需求。一些客户的数据中心对于气流和/或能耗较为敏感,而另一些客户用于部署服务器的办公室环境则要求风扇噪音较低。因此,PowerEdge 服务器的设计采用先进的热控制,以尽量降低风扇速度,同时保持可靠性和性能。
热控制是限定风扇速度、温度警告和部件节流的智能功能,以保持安全的部件温度。良好的热控制设计非常重要,因为它决定了系统的风扇功率、气流消耗以及音量水平。Dell 工程师投入了大量心血,优化每种产品的热控制,同时还努力在产品组合中实现一致的感受,从而使我们的客户了解对 PowerEdge 服务器的期望。
PowerEdge 热控制是固件代码的一部分,位于集成的 Dell 远程访问控制器 (iDRAC) 中,并通过与系统硬件的通信确定适当的风扇速度。下图显示了 iDRAC 和供电设备 (PSU) 热控制架构如何与各系统部件通信,以确定并保持系统的热健康状况。
对 iDRAC 和 PSU 热控制的输入用于确定风扇速度和节流水平。以下章节说明了为什么及如何使用输入:
系统目录
PowerEdge 热控制软件在每次启动时收集硬件目录,为该配置提供最佳的冷却。该目录包括 HDD、PCI、处理器、内存、PSU 等的大小、数量和类型。这意味着风扇速度将根据客户所订购的配置进行定制。
温度监控
热控制按照有规律的间隔对环境、主板、处理器、内存、芯片组和 PSU 的温度执行轮询,以了解系统的热状态。一系列复杂的方程式和逻辑可了解部件温度的轨迹和历史,从而预测性地响应实时变化。由此,风扇速度能以客户的实际负载和环境为基础。
事件
热控制的算法不仅可监控部件温度的健康状况,还可监控风扇。对于提供冷却冗余的服务器,热控制算法可在发生风扇故障时提高风扇速度,从而保持温度一致性。
热控制经过严格的设计开发过程,可确保算法稳定并满足所有的系统要求。以下是该过程主要部分的示例:
模拟
我们采用计算软件模拟热控制算法,在应用于系统之前对算法施加“压力”。我们的团队采用这种模拟,以确保软件的稳定和稳健,我们也得以高效地测试各种想法。
调节
每台 Dell 服务器都经过热特性分析,以调节热控制设置。这种定性和调节针对不同类型的负载、系统目录和环境执行。我们还开展了瞬变测试,以确保系统热状况在利用率峰值等情况下保持稳定。
验证
定性和调节完成后,每个系统都要在真实数据中心环境的负载下经历严格的验证测试,并由多个测试团队进行重复检查。
戴尔服务器热设计团队不断提高 PowerEdge 的热控制能力,并致力于为我们的客户提供有助于解决其问题的解决方案。
如须了解有关 Dell PowerEdge 热控制的更多详情,请参阅以下白皮书:
http://www.dell.com/downloads/global/products/pedge/en/server-poweredge-11g-thermal-design-en.pdf
http://www.dell.com/downloads/global/products/pedge/en/pedge_mseries_thermal_design.pdf
更多精彩文章请关注: