重新思考AI时代的电力输送
日期:2025-09-12
随着人工智能(AI)和高性能计算的不断激增,数据中心的物理基础设施正在努力跟上。
作者:Empower Semiconductor产品营销高级经理Mukund Krishna
每一代加速器,无论是GPU、AI引擎还是XPU,都比上一代消耗更多的功率,突破了工程师设计的服务器架构支持的极限。事实上,如今对生成模型的单个推理请求消耗的能量是传统网络搜索的十倍。将其乘以每天数十亿次查询,其能源影响将变得不可忽视。
与此同时,计算需求的激增与无法有效地向处理器提供高电流、低电压电源的问题相冲突。虽然芯片制造商继续缩小几何形状并增加晶体管密度,但功率传输架构在很大程度上保持不变。其结果是,芯片的能力和基础设施可以支持的能力之间的脱节越来越大。在电力输送的终点阶段,这一点很明显,在那里,电流可以超过数千安培,进入数毫米的硅。
为了释放人工智能的真正力量,该行业需要从根本上重新考虑电力输送。本文探讨了传统横向功率输送(LPD)的局限性,以及为什么一种重新构想的方法,即真正的垂直功率输送(VPD),可能是答案。
横向功率传输的极限
在传统系统中,安装在印刷电路板(PCB)上的DC/DC转换器将12V轨转换为处理器所需的亚1V电平。这些转换器通常距离芯片几厘米远,电源横向布线在整个电路板上。几十年来,LPD一直是数据中心服务器内转换和分配电源的默认架构。虽然这种范式迄今为止一直有效,但在现代计算需求的重压下,它现在开始崩溃。这个问题源于物理学。随着电源电压的降低和电流需求的增加,即使是短迹线长度的I2R损耗也变得无法忍受。横向布线引入了寄生电阻和电感,共同侵蚀了功率效率和节流性能。配电系统(PCB)中的功率损失超过系统功率预算的10%,破坏了高效稳压器的性能,并加剧了热挑战。
.png)
图1:LPD将电流从电路板边缘移动到中心
更糟糕的是,传统转换器本身体积庞大。它们缓慢的开关速度需要大型磁性元件和大量去耦电容器,这通常会消耗处理器下方有价值的空间。工程师必须围绕散热器等热约束将这些组件隔开,这会进一步增加到负载的距离并降低瞬态响应。虽然大量的电容器可以支持快速的负载阶跃以限制电压的立即下降,但由于稳压器与这些电容器的缓慢和距离,它们的恢复速度要慢几个数量级。
其结果是效率低下。较差的电压调节会导致更高的电压裕度,这意味着为了确保运行需要消耗更多的能量。在0.75V下运行的xPU的电压裕度降低50毫伏,可以节省10%以上的动态功耗。缓慢的恢复瞬态响应迫使xPU限制性能或进入恢复周期。总的来说,LPD不再是高通量、高功耗AI工作负载的可行途径。
48V转换与多级转换
为了应对日益增长的能源需求和传输损耗,数据中心已经经历了从机架内的12V母线到48V母线的深刻转变,以将电力分配给各个机架单元。原理很简单:更高的电压需要更少的电流来提供相同的功率,这反过来又减少了电阻损耗,缩小了电力输送基础设施的尺寸。电缆、连接器和母线变得更小、更冷,这简化了系统级设计,降低了总体拥有成本。然而,这种转变带来了新的架构复杂性。虽然现在的供电电压为48V,但处理核心仍需要低于1V的输入。虽然在单步中将48V直接转换为核心电压并非不可能,但考虑到极端的占空比(Vout/Vin)比,这种转换会导致系统庞大。
因此,系统现在需要两阶段转换。首先,将48V转换为中间电压(通常为12V),然后将12V降压至负载电压的终点。
为了优化“last一英寸”的功率传输,继续坚持两级方法是可行的,因为较低的输入电压第二级可以提供更高密度、更薄和更高带宽的解决方案。
在第二阶段,转换到0.7V或更低的电压,是大多数性能、空间和热挑战现在集中的地方。
AI架构中的密度问题
另一个挑战是,现代AI工作负载不断升级的计算需求反过来又加剧了围绕电力输送的物理限制。在大型xPU封装上,很大一部分引脚被分配给高速通信和I/O,即使总电流需求激增至数千安培,也只留下相对较小的区域用于供电。其结果是电流密度急剧增加:必须通过更少的引脚和更小的电路板空间输送更多的电流,这大大提高了效率、热管理和电压调节的风险。
这一挑战在许多下一代人工智能系统架构中得到了放大,这些架构在紧密排列的网格或拼接排列中部署了多个xPU,其中拼接之间的高速互连是系统性能的瓶颈。为了保持信号完整性并减少延迟,这些互连必须保持短而畅通。但这对功率输送施加了严格的限制,稳压器必须在不侵占横向PCB空间的情况下输送高电流,无论是在靠近散热器的顶侧还是在靠近互连布线的底侧。
在这些环境中,消耗宝贵占地面积或高度的传统电源模块不再可行。相反,功率传输系统必须适应计算平面的物理结构,符合严格的空间约束,同时保持带宽、响应时间和效率。
真正的垂直电力输送是答案
为了解决横向电力输送日益低效的问题,系统架构师越来越多地探索VPD作为下一个架构转变。VPD不是从远处的转换器通过PCB布线电源,而是通过板堆叠将电流直接输送到硅中,从而减少电阻损耗,更大限度地减少寄生效应,并显著提高瞬态响应。VPD背后的价值在于,更短的距离意味着更少的损失。但在实践中意识到这一点要复杂得多。一个真正的垂直架构必须将电源传输解决方案压缩到与处理器本身相同的占地面积,更好是相同的垂直空间。这意味着消除了传统功率级所特有的笨重的磁性元件、电容器和横向布线路径。
.png)
图2:垂直电源传输将电流通过电路板堆栈直接传输到硅中
然而,目前许多所谓的“垂直”解决方案都达不到这一标准。有些只是将现有的横向转换器倒置并安装在板的下侧。其他人将转换器移近负载,但保留了大量去耦电容器,这些电容器消耗了宝贵的空间并限制了放置灵活性。这些设计可能会提供渐进式的改进,但它们无法解决将纳秒响应的大电流直接输送到亚1V轨而不降低密度的根本问题。
真正的VPD需要重新思考架构。它必须足够紧凑,可以放在处理器下面,足够快,可以消除电容器组,并且具有足够的可扩展性,可以支持AI类工作负载不断增长的需求。如果没有这三个,该系统仍然受到相同的约束,只是重新排列成略有不同的形式。
实现真正垂直电力输送的关键
任何可行的VPD解决方案都必须解决三个相互关联的挑战:带宽、效率和机械集成。消除电容器组,带宽和密度挑战
传统设计的一个决定性特征是它们依赖于大量去耦电容器来管理高频瞬态。这些电容器在处理器下方消耗了大量面积,与真正的垂直电源不兼容。它们还会降低功率输送溶液的溶液密度。为了去除它们,稳压器必须表现出明显更高的带宽。大多数传统稳压器在500-800kHz范围内运行,这对于亚微秒级的电流阶跃反应太慢了。对于真正的VPD,控制回路必须切换到多兆赫范围,使稳压器能够直接吸收快速瞬变,而不依赖于外部电容储能。消除电容器组也是匹配xPU所需电流密度的重要一步。大多数现代xPU封装中都有大量的嵌入式电容器,代表了封装PDN阻抗。如果稳压器能够以超过封装PDN交叉频率的带宽来缩小差距,则可以消除95%以上的PCB电容器,从而将有功功率传输解决方案实现为真正的垂直功率。
保持大规模效率
除了需要高速调节和密度外,真正的垂直电力输送还需要高效的稳压器。具体来说,任何在处理器附近运行的第二级稳压器都必须达到基准效率,通常高于90%,以避免热量积聚,抵消通过48V中间母线分布获得的系统级增益。当电流需求超过1000安培时,这一点变得尤为重要,因为即使是微小的效率损失也会导致大量的热量和浪费的电力。机械和热约束
将电源传输重新定位到PCB背面会带来严格的封装限制。解决方案必须符合OCP OAM和PCIe等尺寸规定的标准化厚度包络。这意味着包括功率级、磁性元件和任何热接口在内的总高度必须保持在2-4mm以内。同时,这些薄型调压器仍必须散发大量热量,因此需要双侧冷却选项或集成低阻抗热路径来保持可靠性。采用FinFast技术的Crescendo平台
新的Crescendo平台提供了真正的VPD,解决了之前提到的所有挑战。这个新平台不是对传统架构进行改造,而是通过将所有基本元素压缩到一个密集、低轮廓的尺寸中,重新定义了功率级本身,该尺寸旨在直接在处理器下方运行。Crescendo平台基于Empower的FinFastTM技术,采用6毫米x 7毫米的集成磁性元件的高频IVR,封装薄至1.25毫米。重要的是,这种集成消除了对大型外部电感器和去耦电容器的需求,从而创造了垂直交付所需的物理和电气条件。通过安装在PCB背面,该解决方案通过通孔将电流垂直传输到处理器芯片,缩短了路径,加强了电压调节,并显著提高了瞬态响应。
.png)
图3:Crescendo平台实现了向处理器的真正垂直功率传输
性能提升显著。与传统转换器相比,瞬态响应提高了20倍,通过模块并联,峰值电流输送可扩展到3000安培以上。该架构还支持高达5倍的功率密度,并使系统级功耗节省高达20%。同时,处理器下电容器组的移除释放了电路板空间并减少了热拥塞,使系统设计人员可以提高计算密度或简化电路板布局。
重要的是,这个新平台是使用常见的代工工艺、组件和封装来实现的。对于负责向高密度处理器提供千瓦级功率的系统架构师来说,该平台为人工智能和高性能计算基础设施中紧迫的功率瓶颈提供了一种实用、即时和经过性能验证的解决方案。
.png)
图4:Crescendo平台在PCB底部实现(xPU下)
结论
尽管计算性能一直受到晶体管数量或核心频率的限制,但如今它受到功率传输的限制。随着人工智能加速器的能力越来越强,它们也需要在越来越低的电压下,在越来越狭窄的机械外壳内,提供前所未有的功率。该行业已经通过更高电压的机架配电、中间总线架构和新的封装策略做出了回应,但这些只是到此为止。能量与硅相遇的后面阶段仍然是重要、不宽容的。VPD是应对这一挑战的有前景的解决方案。但随着这一术语的流行,清晰度变得更加重要。简单地将现有的慢速电源模块重新用于电路板的背面并不构成VPD。相反,VPD必须真正缩小功率传输回路,以实现快速响应、密集封装,并去除长期受放置和性能限制的笨重无源器件。Crescendo平台是满足这一标准的少数技术之一。
www.empowersemi.com
推荐行业新闻更多