从(cóng)实(shí)验(yàn)室(shì)到(dào)算(suàn)力(lì)战(zhàn)场(chǎng):沐(mù)曦(xī)GPU的(de)国(guó)产(chǎn)化(huà)突(tū)围(wéi)
当(dāng)全球(qiú)AI算(suàn)力(lì)需(xū)求(qiú)因(yīn)大(dà)模(mó)型(xíng)爆(bào)发(fā)而(ér)激(jī)增(zēng)时(shí),国(guó)产(chǎn)GPU正(zhèng)经(jīng)历(lì)一(yī)场(chǎng)“生(shēng)死(sǐ)时速”。2025年8月,DeepSeek-V3满血版在沐曦曦云C500 GPU上成功运行的消息引爆科技圈——这个参数量达671B的国产大模型,性能超越GPT-4o和Claude-3.5-S🌽电子onnet,却选择在国产芯片上完成全链路适配。这背后,是沐曦GPU从AMD技术团队孵化,到构建自主IP架构,再到实现千卡集群商用的七年技术长征。
数据显示,2025年中国数据中心加速芯片市场中,出货(huò)量(liàng)超(chāo)万(wàn)张(zhāng)的(de)GPU厂(chǎng)商(shāng)仅(jǐn)有(yǒu)英(yīng)伟(wěi)达(dá)、沐(mù)曦(xī)和(hé)天(tiān)数(shù)智(zhì)芯(xīn)三(sān)家(jiā)。而(ér)沐(mù)曦(xī)的(de)曦(xī)云(yún)C500系(xì)列(liè)单(dān)卡(kǎ)算(suàn)力(lì)已(yǐ)超(chāo)越(yuè)英(yīng)伟(wěi)达(dá)H20,在(zài)FP16/BF16精(jīng)度(dù)下(xià)达(dá)到(dào)H100的(de)85%性(xìng)能(néng)。这(zhè)种(zhǒng)突(tū)破(pò)并(bìng)非(fēi)偶(ǒu)然(rán):其(qí)核(hé)心(xīn)团(tuán)队(duì)平(píng)均(jūn)拥(yōng)有14年GPU设计经验,创始人陈维良曾主导AMD 15款高性能GPU流片,这种“技术基因”让沐曦在成立四年内完成三代产品迭代。
技术突围:全栈自研的“三重门”
沐曦的技术路线可用“IP自主化、架构通用化、生态兼容化”概括。其自主研发的MXMACA软件栈被比作“AI领域的Android系统”,支持单机16卡百任务毫秒级响应。在硬件层面,曦云C600系列采用7nm制程,集成HBM3高带宽内存,支持MetaXLink超节点扩展技术,可构建万卡级集群——这项技术已在2025年世界人工智能大会上展示128B MoE大模型的全量预训练。
但技术突破背后是惊人的投入:2025-2025年,沐曦研发费用累计达24.66亿元,占营收比例高达282.11%。这种“烧钱”模式在国产GPU厂商中普遍存在——寒武纪同期研发费用占比达121.24%,海光信息为45.21%。正如拉文大学DBA课堂上学员指出的:“半导体产业容不得一丝错漏,每天1000个决策若99.9%正确,一年后正确率仅69.4%。”沐曦通过全链条自研(从IP架构到数据库)将决策错误率控制在0.1%以下,这或许是其能实现千卡集群稳定运行的关键。
生态博弈:从“替代”到“引领”的跨越
国产GPU的终极战场在生态。沐曦的选择是“双轨制”:一方面兼容CUDA生态,降低用户迁移成本;另一方面构建MXMACA开源社区,与清华、复旦等高校共建联合💿电子实验室。这种策略已见成效——其医疗领域“镜观大模型”依托国产算力实现医院端侧部署,覆盖超百万例内镜影像,计划三年内接入300家医疗机构。
但生态建设仍是长期战役🎈。英伟达CUDA开发者超600万,加速库超900个,而沐曦MXMACA的开发者社区刚突破10万。不过,地缘政治正改变游戏规则:2025年4月美国曾无限期禁止H20芯片对华出口,虽然后来解禁,但国内金融、政务等关键领域已明确要求算力国产化率超70%。这种政策红利下,沐曦在2025年上半年斩获多个国家级智算中心订单,曦云C500系列出货量同比增长300%。
商业化困局:亏损33亿背后的生存逻辑
尽管技术突破不断,沐曦的财务数据仍显严峻:2025-2025年一季度累计亏损32.9亿元,现金流持续为负。这种“技术越强、亏损越大”的现象在半导体行业普遍存在——寒武纪同期亏损超50亿元,海光信息靠CPU业务才实现盈利。沐曦的困境源于三重压力:一是HBM、晶圆等关键原材料依赖进口,2025年一季度存货中HBM占比达63.73%;二是生态适配周期长,单个客户技术验证需6-12个月;三是互联网大厂仍优先采购英伟达芯片,国产GPU在训🈶练场景渗透率不足5%。
但转机正在出现。沐曦在回复上交所问询时透露,其曦云C600系列将于2025年量产,采用国产供应链后成本可降低40%。同时,公司正通过“技术+资本+产业”模式破局:与中奥通宇、启赋资本等DBA学员企业合作,加速向金融、医疗、机器人等场景渗透。这种跨界合作模式,或许能复制华为海思在5G芯片领域的成功路径。
未来之战:万卡集群与AI基础设施革命
站在2025年的节点,沐曦正面临两个关键选择:是继续在通用GPU领域与英伟达硬刚,还是转向ASIC等专用芯片?从其产品路线图看,沐曦选择“全都要”——在巩固训推一体芯片优势的同时,加速曦彩G系列图形渲染芯片研发,并布局低空经济、元宇宙等新兴场景。
这场战役的胜负手可能在于算力网络构建。沐曦已覆盖国家人工智能公共算力平台、运营商智算中心等核心节点,区域横跨北京、上海、香港等地。而其提出的“算力即服务”模式,正与阿里云、腾讯云等巨头形成差异化竞争。正如DBA课堂上学员建议的:“国产GPU需要从卖芯片转向卖算力,这才是生态建设的终极形态。”
当我们在2025年回顾沐曦的七年历程,会发现这不仅是家企业的成长史,更是中国半导体产业从“跟跑”到“并跑”的缩影。从AMD技术团队到国产供应链闭环,从千卡集群到万卡预演,沐曦的革新之路证明:在算力即生产力的时代,技术自主与生态开放缺一不可。而这场突围战的最终答案,或许就藏在陈维良那句“每天1000个决策”的坚持里——半导体产业没有奇迹,只有日复一日的精准执行。
需要的帮助
非常重视自身产品及用户体验,欢迎广大用户向我们提出相关产品及业务系统的意见和反馈,以帮助我们提升产品性能及用户体验。
- 高性能GPU/模拟接口设计平台
