今日科普|海光GPU集成新突破_长沙集成电路设计有限公司

关于公司新闻

搜索

今日科普|海光GPU集成新突破

{news_date} 来源：

从“能用”到“好用”：海光GPU的国产化逆袭

2025年的国产算力战场，海光GPU正以“黑马”姿态杀出重围。当全球AI算力需求爆发式增长，国产GPU厂商却长期面临“生态适配难”“性能瓶颈”等痛点时，海光DCU系列凭借“全精度计算+生态兼容”双引擎，在科研、金融、工业等领域掀起了一场“国产化替代”风暴。最新数据显示，海光DCU在2025年中国加速芯片市场占有率已突破18%，尤其在训练场景中，其性能反超某国际品牌同价位产品45%，价格却低近50%。这背后，是海光对GPU架构的🔒深度优化，以及对“训推一体化”场景的精准卡位。

海光GPU集成新突破

全精度计算：打破AI算力的“精度壁垒”

传统GPU的“精度焦虑”曾是国产算力的致命短板——要么专注高精度训练，放弃推理效率；要么牺牲精度换速度，难以满足科研级需求。海光DCU的突破在于，它成为国内首款支持全精度浮点（FP64/FP32/FP16）和整型（INT8/INT4）计算的加速卡，覆盖了从气候模拟到金融风控的全场景需求。以苏州实验室2025年10月发表在《Advanced Materials》的论文为例，其基于海光C86平台完成的金属有机框架材料（MOF）筛选研究，需处理超百万级分子构象的高精度模拟，传统GPU因精度不足需多次迭代，而海光DCU凭借FP🔰电子官网64算力，将计算时间从72小时压缩至18小时，效率提升300%。这种“精度自由”，让国产GPU首次在科研领域与国际巨头正面交锋。

更值得关注的是，海光通过“动态精度切换”技术，让同一芯片在不同场景下自动调整计算模式。例如，在AI训练阶段使用FP32保证模型收敛性，推理阶段切换至INT8提升吞吐量，这种“一卡多用”的设计，直接降低了企业部署成本。据测算，采用海光DCU的智算中心，整体T🆗电子官网CO（总拥有成本）比进口方案降低35%，这在预算敏感的政企市场极具吸引力。

生态兼容：从“单点突破”到“全链协同”

“生态壁垒”曾是国产GPU的最大掣肘——开发者需重写代码、模型需重新训练，迁移成本高昂。海光的破局之道，是打造“类CUDA”环境，通过DTK工具链和模型仓库，实现与PyTorch、TensorFlow等主流框架的无感迁移。2025年9月，DeepSeek开源大模型发布当日，海光DCU即完成适配，训练效率与某国际品牌GPU持平，而推理延迟降低22%。这种“当日适配”能力，源于海光对CUDA生态的深度解构：其软件栈覆盖超2025个算子，对标CUDA的算子覆盖度超过99%，开发者无需修改代码即可直接运行现有模型。

生态的开放，更体现在产业链的协同创新。2025年9月，海光正式开放HSL系统互联总线协议，联合浪潮、联想等OEM厂商推出“CPU+多GPU”超节点架构。这一设计解决了传统PCIe总线在多卡通信时的延迟瓶颈——在华夏银行的金融OCR识别系统中，采用HSL总线的海光集群，将千张图片的批量处理时间从12分钟缩短至3分钟，推理吞吐量提升300%。更关键的是，HSL协议的开放吸引了昆仑芯、寒武纪等国产GPU厂商加入，形成了“CPU+多GPU”的混合算力生态，打破了单一厂商的封闭体系。正如海光生态负责人所言：“我们不做‘孤岛’，而是要建‘算力高速公路’。”

安全可信：为关键领域筑牢“数字防线”

在金融、能源等关键领域，算力安全已成为国家战略。海光DCU的独特优势，在于将安全能力“内置”到芯片底层。其集成的密码协处理器（CCP）和安全处理器（PSP），支持国密算法SM2/SM3/SM4，加密性能比软件方案提升10倍，且无需额外购置加密卡。2025年，海光C86-4G处理器通过国家密码管理局商用密码检测中心认证，符合《GM/T 0008安全芯片密码检测准则》第一级要求，成为国内首款获此认证的GPU产品。在华夏银行的反欺诈系统中，海光DCU的实时加密能力，将交易数据泄露风险降低90%，同时将加密开销从15%压缩至3%，实现了“安全与性能”的平衡。

这种“安全基因”，也延伸至供应链层面。海光通过Chiplet技术将CPU与DCU封装在同一个基板上，减少了数据在板级传输中的暴露风险。2025年，海光更推出“可信计算2.0”方案，在芯片启动时即进行动态度量保护，防止恶意代码注入。这种“从芯片到系统的全链路安全”，让海光GPU在政务、军工等敏感领域获得广泛认可——据统计，2025年海光在信创市场的占有率已达42%，成为国产算力的“安全标杆”。

未来展望：国产GPU的“黄金时代”

站在2025年的节点回望，海光GPU的崛起绝非偶然。它抓住了两个关键机遇：一是AI算力需求从“训练主导”转向“训推并重”，海光的“全精度+训推一体”设计恰好契合这一趋势；二是国产化替代从“可用”向“好用”升级，海光通过生态兼容和安全创新，解决了企业的“迁移焦虑”。正如中国工程院院士李国杰所言：“国产GPU的竞争，最终是生态的竞争。”海光的选择，是用开放打破封闭，用兼容替🈸代重构，用安全赢得信任。

展望未来，随着HSL生态的完善和Chiplet技术的成熟，海光有望在2025年推出支持128卡互联的超级节点，算力密度对标国际顶尖水平。而其“CPU+GPU+Switch”的全栈布局，更可能重塑国产算力格局——当算力不再受制于“卡脖子”技术，当生态不再被单一厂商垄断，中国数字经济的底座，或将真正迎来“自主可控”的黄金时代。

上一篇：今日科普|荣耀20 GPU电路故障

下一篇：中国产GPU电路新突破