紧跟能效发展步伐
Summary: 业内网站、文章和白皮书多年来一直警告着“数据洪流”的到来。新的存储技术通常是重点,但同样重要的是处理这一海量新数据的能力。
Symptoms
十多年来,IT 商店一直在努力应对计算环境中数据的巨大增长。 业内网站、文章和白皮书多年来一直警告着“数据洪流”的到来。新的存储技术通常是重点,但同样重要的是处理这一海量新数据的能力。
机器学习和 AI 将在这一领域发挥重要作用。相应地,市场对更强处理能力的追求也日趋激烈,这不仅推动了 CPU 性能的持续提升,更促进了近期加速器技术(GPU、FPGA)的应用激增,正是这些技术为计算密集型 AI 应用提供了所需的超高速并行处理能力。
这些先进的 AI 技术以及其他不断增长的计算需求,需要一种新的电源架构来高效地提供更强的处理能力。虽然这种重新设计的机会带来了诸多好处,但这并不是一个简单的问题。
电源问题
对更高处理能力的追求也带来了与电力传输相关的关键系统设计问题。 当今的处理器的制造几何结构更精细(小于 10 纳米),可实现更快的电源切换,从而减少了延迟并降低了时延,这进而需要更低的电压(低于 1 伏特 (V))来驱动处理。 根据欧姆定律 (P=V*I),如果功率 (P) 增加且电压 (V) 较低,则电流 (I) 必须增加。这就带来了一个问题,因为向处理器芯片或“封装”输送更高的电流需要使用更多的插槽针脚来承载更大的电流,而这些针脚原本可用于提供更强大的系统功能(即,I/O、系统管理)。例如,片上芯片 (SoC) 的设计将更多功能集成到芯片本身,因此问题就变成了:如何在不牺牲潜在功能的情况下更高效地供电。这一点很重要,因为在大规模应用中,即使是微小的效率提升也会产生显著影响;对于十万台服务器来说,哪怕每台服务器只降低一瓦的功耗,在这些服务器的整个生命周期内便可节省数十万美元。
更高的电压解决方案
当今业界广泛接受的解决方案之一是为服务器提供更高的电压(例如,48 V)。在 2016 年的开放式计算项目(“OCP”)峰会上,Google 宣布了一项倡议,旨在推动将 48 伏服务器和配电基础设施作为数据中心的标准配置。此模式涉及对电力传输架构的多项变更(如下所述),可带来以下优势:
- 处理器功率更高(不减少插槽和接头引脚和尺寸)
- 功率转换中的能量损失更少(转换更少、更高效)
- 主板布局设计更简洁(电源层和走线区域更少)
- 更小的线缆、连接器和母线
- 更低的配电损耗
- 与 12V 机架相比,功率限制更高
选择 48V 是因为它不需要特殊的安全边界。超过 60V 的任何电压均被视为“高电压”,需要额外的安全隔离。在使用欧姆定律时,48V 电压可将电流降低四倍,但仍会留下安全余量。
48V 服务器曾一度由英特尔在 20 世纪 90 年代后期推广,但由于当时稳压器密度和功率转换效率有限,以及组件成本较高,最终被 12V 服务器的设计所取代。
功率传输
要了解 48V 电源模式的优势,首先需要了解当前的供电方式。目前,电力公司通常提供 220V 至 240V 的交流电 (AC),然后由系统的电源装置 (PSU) 将其转换为 12V。该电压在位于系统主板上的稳压器中再次进行转换,从 12V 变为 1.7V(我们以英特尔的实施方案为例)。这根 1.7V 的供电轨所提供的电压大约是 CPU 最终所需电压的两倍,其目的在于降低主板输送的电流,以便使用更少的引脚向处理器基板供电。但是,这些电力必须在芯片和基板上再次进行转换,才能获得处理器所需的亚一伏电压水平。
图 1:当今的 12 伏供电模式
配电损耗效率低下
在每个转换阶段,一定程度的功率/能量都会丢失。据估算,尽管当前的电源装置 (PSU) 和板载稳压器 (VR) 的效率早已超过 90%,但传统数据中心(从公用设施到处理器再到冷却系统)的总体电源效率通常在 85% 左右。 此外,这部分损失的能源会转化为热量,导致数据中心需要消耗更多的能源(和成本)来冷却这些高性能系统。提高能效(消除能源损耗)最终使数据中心能够节省冷却成本。效率提高一个百分点也会带来巨大的财务和环境收益。
电流传输损耗是电流平方的函数(功率 = I2R)。 因此,减少流经特定电阻 (R) 的电流 (I) 会影响损耗量。 可以通过增加电压来降低电流(欧姆定律),因此这进一步激发了人们对 48V 电源模式的兴趣。
新的供电方法
当前,对高功率处理器实现高效供电仍是动态发展的领域,各方正在积极探索多种解决方法。两种此类方法及其优点如下所述。
提供更高效率的一种方法是将 48 伏电压直接输送到处理器封装基板,然后在基板上转换为低于 1 伏电压。这种方法消除了一个转换阶段(提高效率),并允许向基板输送低电流(提高引脚可用性)。 然而,由于封装基板上的可用空间极其有限,将 48V 电压转换为亚一伏的电源转换器必须具有高功率密度和薄型化的特点,因此实施此技术仍然很复杂且成本高昂。
图 2:48 伏直达基板的供电模式
另一种方法是将 48 伏电压传输到主板。 此时,稳压器会将其转换为亚一伏电压(例如 0.85 V),然后将其直接输送给处理器。 这种方法还省去了一次转换(从而提高了效率),但必须向基板输送更高的电流,因此无法减少供电针脚的数量。这种方法更常见,因为它比直接交付模式更简单,成本更低。
图 3:48 伏到主板供电模式
其他优势
迁移到 48V 型号也可以获得一些其他优势。对于完全集成的机架级解决方案,因为 48V 母线所承载的电流仅为 12V 母线的四分之一,因此如果使用相同规格的母线进行机架配电,或许可以节省 16 倍 (I2) 的电力传输损耗。 这意味着,在设计实践中所采用的线缆(或母线)可以更细(规格更高),因为它们承载的电流更小。
由于组件(连接器、电容器、线缆和母线)尺寸减小,因此可以节省空间和成本,而空间的释放也为系统设计师带来了更多的设计选择。
在机架层面上,这些优势被成倍放大。48V 机架内配电模式(类似于 12V 机架级配电)使得部署分布式直流 (DC) UPS 成为可能,并且不再需要笨重的设施级交流电 (AC) UPS,后者不仅体积庞大,还缺乏灵活性、难以维护。 与之形成鲜明对比的是,分布式直流不间断电源(DC UPS)结合现代锂基电池技术,更加紧凑、轻便且易于维护。 它还具有一个额外的优势,即支持“按需付费”功能,也就是说,在需要额外容量时动态添加容量。
目前 12 伏标准仍占据主导地位
尽管市场对 48V 供电的能效颇感兴趣,但如今的 12V 服务器主板已存在了 20 多年。十二伏基础架构是一种高度普及的产品,不仅在全球拥有庞大的应用规模,其供应链也得到了优化。因此,向更高电压的转换并不会在整个基础架构中全面普及。例如,硬盘仍将采用 12V 供电,才能充分利用当今存储市场中各种成熟的产品选项,因此在可预见的未来,主流服务器的设计将继续采用 12V 电源。但是,随着对处理能力的永无止境的渴求,我们可以预见,采用更高电压供电的模块和主板将将得到更广泛的应用,这已经在 AI 和机器学习领域得到了体现。
必须明确的是,适用于主流主板或处理器封装应用(即高功率密度、高效率且成本优化)的 48V 稳压器解决方案仍较为有限。 作为功率管理半导体供应商的领导者,他们与功率转换行业紧密合作,致力于开发更可行的解决方案,预计未来几年将取得显著进展。 处理器和封装技术的进步有望开启一个新时代:具有高电压转换比的末级转换可以在处理器硅片和/或其封装基板上完成,从而实现对这些核心部件的高压直接供电。
结论
提高能效是数据中心面临的最大挑战之一。通常情况下,追求更高的效率意味着节约能源和相关的运营成本,从而降低总拥有成本 (TCO)。因此,随着功耗需求的不断攀升,将能效提升到极致就变得尤为重要。
Dell EMC 与广泛的客户开展合作,帮助解决一些最复杂和有趣的机器学习问题。Extreme Scale Infrastructure (ESI) 团队致力于紧跟最新的电源技术,并在适用的地方加以应用,从而帮助客户高效地满足他们对处理能力持续增长的需求。
有关 Dell EMC Extreme Scale Infrastructure 在电源技术方面作用的更多信息,请联系 ESI@dell.com。
Cause
N/A
Resolution
N/A