人工智能的未来:重新定义数据中心内外的功率流

日期:2025-09-12
人工智能的兴起和数据中心的挑战
 
作者:英飞凌科技股份公司数据中心全球应用经理Carl Smith
 
OpenAI首席执行官Sam Altman的一条推文[1]表明,在与ChatGPT的聊天中保持礼貌会使公司损失数千万美元,因为处理“请”和“谢谢”等不必要的单词需要额外的计算负荷。虽然这在互联网上引发了一系列的意见,但它直接将注意力集中在全球数据中心,特别是提供人工智能计算服务的数据中心所需的持续快速增长的电力需求上。
随着人工智能(AI)加速其在各个行业的影响力,支持这一转型的基础设施面临着前所未有的需求。这一演变的核心是数据中心,其中处理器和服务器机架的功耗达到了新的高度。
随着人工智能的兴起,多位专家预测了托管这些人工智能服务器的数据中心对电力的巨大需求。例如,根据麦肯锡的一篇文章[2],到2030年,数据中心可能消耗全球能源需求的约7%(每年约130吉瓦),高于2022年的约2%。
服务器机架架构的演变
随着电力的增加,责任也随之增加,但随着电力需求的增加,对配电架构的需求也随之增加。在人工智能爆发之前,单个机架的功耗约为60kW,而如今机架的功耗为100-20kW是常态,是上一代的两倍。然而,随着人工智能模型每天都在发展,这种翻倍可能每18个月就会发生一次,类似于摩尔定律,下一代机架的额定功率为600kW,到本十年末将达到1兆瓦/机架。


图1:服务器机架功耗不断增加
 
现代人工智能数据中心正在努力应对不断升级的功耗。传统架构将电力输送、备用电源和IT有效载荷集成在单个机架内,在满足高性能计算需求方面面临挑战。如果服务器机架功耗超过250 kW,则此设置会达到其物理限制。这些功率水平要求架构发生变化,转向高压直流,这将取代完善的48 V生态系统,如图2所示。


图2:向高压直流输电架构过渡的三个关键阶段
 
在当今的数据中心中,IT负载、电源和备用电源都安装在服务器机架内,这种配置通常适用于高达250kW的服务器功耗。目前,电力输送依赖于单相交流电,功率逐渐增加。
从2027年开始,当机架每机架超过250kW,每机架高达500kW以上时,我们预计将转向专用旁路连接(sidecar)机架,用于电力输送和备用电源,与IT有效载荷机架分开并靠近。在这种情况下,电力输送将从单相交流电过渡到三相交流电。这种中间架构在可扩展性方面已经显示出显著的优势,并将代表数据中心架构朝着更彻底的变革迈出的一步。
从2029年及以后,我们预计数据中心将发展成为一个完全集中的高压直流配电架构,使用固态变压器和固态断路器,实现整个设施的高效配电。
英飞凌是电源解决方案的领导者,处于这一转型的前沿,与行业生态系统参与者合作开发支持这些进步的创新架构。
 
我们的电网到核心方法,满足今天和明天的需求
20多年来,英飞凌一直被公认为数据中心先进半导体的领导者,是从电网到处理器核心的可靠电源解决方案的一站式服务商,可满足当今人工智能平台的挑战性要求,并不断创新以满足未来下一代人工智能平台需求。
英飞凌是一家全系统供应商,为每个功能块提供解决方案,利用硅(Si)、碳化硅(SiC)和氮化镓(GaN)的组合,在数据中心内外的每个转换步骤中更大限度地提高功率密度和效率,无论是固态变压器、固态断路器、储能系统(ESS)、电源单元(PSU)、电池备份单元(BBU)、中间总线转换器(IBC)还是稳压器模块。
除了为当前场景提供强大的解决方案外,我们还与行业领导者合作,提出配电的下一步——设施级架构。在Computex 2025上宣布[3],这种未来的GW级数据中心架构具有集中式发电设置,使用更少的功率转换级进行实际应用。


图3:Computex 2025上提出的拟议设施级GW级电力架构

为了支持这种架构变化,英飞凌已经为高压直流架构提供了解决方案,例如高压中间母线转换器(IBC)设计,以及更高功率的单相和三相PSU。我们也在不断创新,以提高稳压器模块的功率密度,使其更接近处理器,以实现真正的垂直功率传输。
英飞凌在行业中的领导地位源于其对三种主要半导体技术的掌握:Si、SiC和GaN。从历史上看,英飞凌的硅产品,如CoolMOS™系列,长期以来一直是高压和高功率密度设计的效率和热性能标准。现在,随着CoolSiC™ 适用于更高电压的设计,CoolGaN™可用于需要更高开关频率甚至更高功率密度的解决方案,英飞凌能够提供一种独特的混合方法,充分发挥每种技术的优势。这使设计人员能够满足人工智能数据中心的各种需求,同时提供一流的功率密度、效率和总拥有成本(TCO)。
 
提高功率转换链每一步的效率
如前所述,存在物理限制,这些限制成为在组件级别提取更大效率的障碍。因此,为了提高系统级效率,有必要减少功率传输网络(PDN)损耗。据估计,GPU中每消耗1000 W的功率,PDN损耗中大约会浪费100 W的功率。因此,数据中心需要专注于创新整个电力输送路径,同时优化热管理。从交流电网向计算核心分配电力时不可避免的电力损失表现为热量,这反过来又需要从系统中提取能量。换句话说,除了减少PDN损失外,还需要优先考虑减少功率转换每个级的冷却需求。即使是第一级0.5-1%的简单改进,再加上第二级4-5%的增加,也会导致系统级效率的大幅提高,从而大大节省TCO。


4:当今数据中心能效的潜在改进领域
 
为了实现这一目标,我们确定了几个可以很容易地进行上述改进的领域,以实现整体效率的提高。重要的杠杆是在模拟和混合信号电路中正确使用半导体器件,是Si、SiC和GaN的混合物,以确保高功率密度。英飞凌的宽带隙(WBG)器件具有先进的封装,可实现更佳的热管理,这得益于芯片嵌入、顶侧冷却(TSC)模块和集成磁性器件等功能,可减少BOM。
接下来,系统架构本身需要用GaN技术特别有助于的新型转换器拓扑进行更新。这些新拓扑与垂直功率输送流相结合,可以形成模块化和可扩展的架构,这在快速和持续扩展的时代至关重要。硬件本身是不够的,能够智能控制用于热插拔、eFuse和各种负载点设备的新时代数字控制器的软件在保障数据中心不间断运行方面同样重要。


图5:提高人工智能数据中心能效的杠杆

与客户密切合作使我们了解到,解决方案不仅与产品有关,还与产品本身的性能和可用性有关。英飞凌不仅是创新的先驱,也是制造弹性灵活性的先驱。从2010年制造世界上第一块300毫米硅功率晶片开始,英飞凌就不断壮大,到2024年创造了世界上第一个300毫米氮化镓功率晶片。
为了跟上人工智能技术飞速发展的步伐,英飞凌与生态系统合作伙伴密切合作,实现更高水平的垂直整合,在2025年1月至4月的4个月内将芯片嵌入能力提高了80%。这帮助我们建立了良好的业绩记录,样品的交付周期缩短了35%,并在5个月内(截至2025年4月)交付了约1亿个功率级器件。
总之,该行业必须继续在功率半导体技术和系统设计方面进行创新,以技术、环境和经济上可行的方式实现人工智能能力的可持续增长。英飞凌的创新解决方案处于领先地位,迈向更节能、更可持续的人工智能世界的旅程正在进行中。
 
更多信息请访问:Infineon.com/datacenter
 
参考文献:
[1] https://x.com/sama/status/1912646035979239430
[2] https://www.mckinsey.com/industries/semiconductors/our-insights/generative-ai-the-next-s-curve-for-the-semiconductor-industry
[3] https://www.computextaipei.com.tw/en/index.html
 

订阅我们的通讯!

电子邮件地址