GPU供(gōng)电(diàn):从(cóng)“心(xīn)脏(zàng)”到“能量引擎”的进化史
如果把GPU比作AI算力的“大脑”,那供电系统就是驱动这颗大脑运转的“心脏”。2025年的今天,当全球AI算力需求以每6个月翻10倍的速度狂飙时,GPU的功耗问题早已不是简单的“耗电多”这么简单——英伟达H100芯片的热设计功耗(TDP)高达700瓦,相当于同时点亮7台家用空调;而下一代Blackwell架构的B200 GPU,功耗更是一举(jǔ)突(tū)破(pò)1000瓦(wǎ)大(dà)关。更(gèng)夸(kuā)张(zhāng)的(de)是(shì),微(wēi)软(ruǎn)在(zài)德(dé)州(zhōu)阿(ā)比(bǐ)林(lín)规(guī)划(huà)的(de)AI数(shù)据(jù)中(zhōng)心,单🉑电子日电力需求就达到4.5吉瓦,相当于五座核电站的发电量。这些数据背后,藏着GPU供电系统从“简单供电”到“精密能量管理”的惊天变革。
供电架构革命:从12V到48V的“降压术”
传统PC供电采用12V架构,但当GPU电流需求突破1000安培时,12V系统的弊端暴露无遗:根据焦耳定律(P=I²R),在50微欧的线路电阻下,1000安培电流会产生50瓦的热量损耗,相当于额外浪费一台游戏主机的功耗。为此,谷歌在2025年率先提出48V供电架构,英伟达随后将其引入数据中心——通过将电压提升至48V,电流需求可降至四分之一,线路损耗直接降低16倍。这种“高压低流”的设计,让H100芯片的供电效率从85%提升至92%,每年可为单个数据中心节省数百万美元电费。
但48V架构并非完美无缺。英伟达在APEC 2025会议上透露,其H100芯🍀电子片的电源网络(PDN)电阻仍达50微欧,在1000安培电流下会产生50瓦损耗。更棘手的是电流密度问题:H100的芯片面积为814平方毫米,要实现1安培/平方毫米的电流密度目标,供电线路必须像毛细血管一样精密。为此,英伟达正在测试“横向通量电感”技术,通过将电感高度压缩至2毫米以下,为垂直供电方案腾出空间——这种设计能让电源模块高度低于连接器,但散热问题仍需解决。另一种思路是将第二级电压降至3.3V或1.8V,通过分立式模块实现2400瓦/立方英寸的功率密度,但成本和可靠性仍是挑战。
多相DrMOS:供电系统的“超级战队”
如果说48V架构解决了“大电流传输”问题,那么多相DrMOS(集成式功率级模块)则攻克了“精准供电”的难题。以英伟达H100为(wèi)例(lì),其(qí)供(gōng)电(diàn)系(xì)统采用“两级降压”设🥝计:第一级将48V降至12V,第二级通过多相DrMOS将12V进一步降至GPU所需的0.8V-1.2V。这种设计的关键在于“多相并联”——每相电路包含电容、电感、MOSFET和PWM控制器,通过交错工作实现电流叠加。例如,16相供电系统可提供16倍于单相的电流能力,同时将纹波电压控制在1%以内,确保GPU核心电压稳定如磐石。
DrMOS的“超能力”源于其集成化设计。传统供电系统需要分离式MOSFET、驱动芯片和散热片,而DrMOS将上桥和下桥MOSFET、驱动电路甚至部分保护功能集成在单(dān)一(yī)芯(xīn)片(piàn)中(zhōng),体(tǐ)积(jī)缩(suō)小(xiǎo)60%的(de)同(tóng)时(shí),转(zhuǎn)换(huàn)效(xiào)率(lǜ)提(tí)升(shēng)至(zhì)95%以(yǐ)上(shàng)。以(yǐ)杰(jié)华(huá)特(tè)推(tuī)出(chū)的(de)90A DrMOS为(wèi)例(lì),其(qí)可(kě)支(zhī)持(chí)8相(xiāng)供(gōng)电(diàn)系(xì)统(tǒng)输(shū)出(chū)720安(ān)培(péi)电(diàn)流(liú),完(wán)美(měi)匹(pǐ)配(pèi)H100的(de)需(xū)求(qiú)。更(gèng)关键的(de)是(shì),DrMOS的(de)动(dòng)态(tài)响应速度比分离式方案快3倍,能在GPU负载突增时(如从待机切换到游戏场景)瞬间调整电压,避免因供电不足导致的性能下降或系统崩溃。
供电危机:AI算力的“阿喀琉斯之踵”
尽管技术不断突破,但GPU供电仍面临“三座大山”:首先是电力短缺。国际能源署预测,🎭到2025年AI行业耗电量将达1000太瓦时,相当于日本全国一年的用电量。微软、谷歌等科技巨头被迫自建核电站,例如微软重启三哩岛核电站为AI项目供电,谷歌计划在2025年前建造7座小型模块化反应堆(SMR)。其次是散热挑战。H100芯片的功率密度高达8.6瓦/平方毫米,接近硅基材料的物理极限,供电模块的散热设计直接决定GPU能否稳定运行。最后是成本压力。高端DrMOS单价超过10美元,16相供电系统仅芯片成本就超160美元,加上电感、电容和PCB布线费用,供电系统占GPU总成本的30%以上。
在这场供电革命中,中国厂商正扮演关键角色。杰华特已实现30A-90A DrMOS及6/8/12/16相多相控制器的量产,产品进入华为、阿里巴巴等企业的AI服务器供应链;晶丰明源的16相多相控制器已适配多家GPU客户,160A DrMOS正在测试中。更值得关注的是“东数西算”战略——中国将AI数据中心布局在内蒙古、宁夏等可再生能源富集区,利用风电、光伏的清洁电力降低供电成本。这种“算力+能源”的协同模式,或许能为全球AI产业提供破局样本。
未来展望:供电系统的“终极形态”
展望2025年,GPU供电系统将呈现三大趋势:一是“垂直供电”技术成熟,通过将电源模块直接集成在GPU芯片封装内,进一步缩短供电路径、降低损耗;二是“智能供电管理”普及,AI算法实时监测GPU负载,动态调整供电相位和电压,实现“按需供电”;三是“新材料革命”,氮化镓(GaN)和碳化硅(SiC)功率器件将取代传统硅基MOSFET,使供电效率突破98%大关。而在这场变革中,谁能掌握供电核心技术,谁就能在AI算力竞赛中占据先机——毕竟,再强大的GPU,没有稳定的电力供应,也不过是块昂贵的“硅砖”罢了。
需要的帮助
非常重视自身产品及用户体验,欢迎广大用户向我们提出相关产品及业务系统的意见和反馈,以帮助我们提升产品性能及用户体验。
- 高性能GPU/模拟接口设计平台
