从“卡脖子”到“自主芯”:沐曦GPU的破局之路
在2025年的科技圈,最火的话题莫过于“国产GPU能否打破英伟达垄断”。当OpenAI与英伟达、AMD签下千亿美元算力大单时,中国科技界既感受到压力,也看到了机遇——沐曦集成电路(上海)股份有限公司(以下简称“沐曦”)正以“全栈自研”的硬核实力,成为这场算力革命中的关键玩家。这家成立仅5🏀平台年的企业,已推出覆盖AI推理、训练、图形渲染的全栈GPU产品线,累计销量突破25,000颗,更在2025年南京扬子江集成电路创新发展推介会上,发布了全国产通用GPU“曦云C600”,标志着国产高性能GPU实现历史性突破。
技术突破:从“跟跑”到“领跑”的三大杀手锏
沐曦的崛起,离不开三大核心技术突破。首先是**全栈自研的GPU IP**。不同于部分国产芯片依赖国外架构授权,沐曦从指令集到微架构、从SoC设计到高速互连技术,均实现自主掌控。截至2025年3月,其已拥有255项境内授权专利(其中发明专利245项),更被认定为国家级专精特新“小巨人”企业。例如,其曦思N100 AI推理加速卡,单卡INT8算力达160TOPS,FP16算力80TFLOPS,虽仅为英伟达A100的1/4,但通过优化显存管理和分布式策🆘略,在千卡集群训练中实现92%以上的线性扩展效率,精度误差控制在0.5%以内,完全满足大模型训练需求。
其次是**生态兼容性**。沐曦深知“芯片易造,生态难建”的痛点,其自主研发的MXMACA软件栈兼容超6000个国际主流应用,适配PyTorch、TensorFlow等AI框架,甚至支持Megatron、FSDP等前沿后端。这种“开箱即用”的特性,大幅降低了客户迁移成本。例如,在2025年上海创智学院发布的siiRL 2.0强化学习框架中,沐曦超节点集群无需额外适配,即可实现从64卡到1024卡的稳定扩展,推动强化学习迈入“千卡级”时代。
最后是**工艺与能效比**。沐曦首款7nm工艺的曦云C500系列,集成FP32算力15TFLOPS,能效比比英伟达A100提升20%,尤其在大规模并行计算任务中,电能利用效率🈳优势显著。这一突破,让沐曦在数据中心、科学计算等高能耗场景中更具竞争力。
应用落地:从实验室到千行百业的“最后一公里”
技术再强,最终要落地才能创造价值。沐曦的“1+6+X”战略(以自研GPU为底座,赋能金融、医疗、能源等六大行业,推动X个新兴场景落地)已初见成效。在金融领域,其与招商银行合作,为金融监管、数字客服等业务提供底层集群能力,支撑千亿参数大模型训练;在医疗领域,携手中山医院发布的“镜观大模型”,整合超百万例内镜影像,通过国产AI芯片实现医院端侧安全部署,既能为患者提供一对一报告解读,又能作为医生“手术智囊伙伴”,通过眼动和语音交互实时分析病灶,节省医生50%以上文书时间。该系统计划未来三年接入全国300家医疗机构,培训2,000名基层医生,推动医疗资源均衡化。
更值得关注的是,沐曦已成功实现千卡级GPU集群大规模商用,并正在推进万卡级集群部署。其算力网络覆盖北京、上海、杭州、长沙等地的国家人工智能公共算力平台、运营商智算平台和商业化智算中心,为“东数西算”工程提供底层支撑。例如,在南京浦口经开区,沐曦依托300余家(jiā)集成(chéng)电(diàn)路上(shàng)下(xià)游(yóu)企(qǐ)业(yè)形(xíng)成(chéng)的(de)全产(chǎn)业(yè)链(liàn)生(shēng)态(tài),将(jiāng)所(suǒ)有(yǒu)产(chǎn)品(pǐn)均(jūn)注(zhù)入(rù)“南(nán)京(jīng)基(jī)因(yīn)”,从(cóng)曦(xī)思(sī)N系(xì)列(liè)到(dào)曦(xī)云(yún)C系(xì)列(liè),再(zài)到(dào)即(jí)将(jiāng)推(tuī)出(chū)的(de)曦(xī)彩(cǎi)G系(xì)列(liè)图(tú)形(xíng)渲(xuàn)染(rǎn)GPU,均(jūn)实(shí)现(xiàn)从(cóng)设(shè)计(jì)到(dào)封(fēng)测(cè)的(de)全流(liú)程(chéng)国(guó)产(chǎn)化(huà)。
未(wèi)来(lái)展(zhǎn)望(wàng):国(guó)产(chǎn)GPU的(de)“星(xīng)辰(chén)大(dà)海(hǎi)”
尽(jǐn)管(guǎn)沐(mù)曦(xī)已(yǐ)跻(jī)身(shēn)“国(guó)产(chǎn)GPU四(sì)小(xiǎo)龙(lóng)”,但(dàn)前(qián)路并(bìng)非(fēi)坦(tǎn)途(tú)。全球(qiú)GPU市(shì)场(chǎng)规(guī)模(mó)预(yù)计(jì)2025年(nián)达(dá)400亿(yì)美(měi)元(yuán),年(nián)均(jūn)增(zēng)长(zhǎng)率(lǜ)超(chāo)10🌲平台%,但(dàn)英(yīng)伟(wěi)达(dá)、AMD仍(réng)占(zhàn)据(jù)80%以(yǐ)上(shàng)份(fèn)额(é)。沐(mù)曦(xī)的(de)破(pò)局(jú)之(zhī)道(dào),在(zài)于(yú)“技(jì)术(shù)+生(shēng)态(tài)+政(zhèng)策(cè)”的(de)三(sān)重(zhòng)驱(qū)动(dòng):技(jì)术(shù)上(shàng),持(chí)续(xù)迭(dié)代(dài)7nm以(yǐ)下(xià)先(xiān)进(jìn)工(gōng)艺(yì),探(tàn)索(suǒ)Chiplet(芯(xīn)粒(lì))技(jì)术(shù)提(tí)升(shēng)晶(jīng)体(tǐ)管(guǎn)密(mì)度(dù);生(shēng)态(tài)上(shàng),深(shēn)化(huà)与(yǔ)国(guó)产(chǎn)操(cāo)作(zuò)系(xì)统(tǒng)、整(zhěng)机(jī)服(fú)务(wu)器(qì)的(de)适(shì)配(pèi),打(dǎ)造(zào)“纯(chún)血(xuè)”国(guó)产(chǎn)算(suàn)力(lì)底(dǐ)座(zuò);政(zhèng)策(cè)上(shàng),借(jiè)助(zhù)国(guó)家(jiā)“东(dōng)数(shù)西(xi)算(suàn)”工(gōng)程(chéng)和(hé)“十(shí)四(sì)五(wǔ)”智(zhì)能(néng)制(zhì)造(zào)发(fā)展(zhǎn)规(guī)划(huà),拓(tà)展(zhǎn)工(gōng)业(yè)互(hù)联(lián)网(wǎng)、自(zì)动(dòng)驾(jià)驶(shǐ)等(děng)新(xīn)兴(xìng)场(chǎng)景(jǐng)。
作(zuò)为(wèi)科(kē)技(jì)观(guān)察(chá)者(zhě),我(wǒ)认(rèn)为(wèi)沐(mù)曦(xī)的(de)案(àn)例(lì)揭(jiē)示(shì)了(le)一(yī)个(gè)真(zhēn)理(lǐ):在(zài)高(gāo)端(duān)芯(xīn)片(piàn)领(lǐng)域,“买(mǎi)不(bù)来(lái)、等(děng)不(bù)来(lái)、要(yào)不(bù)来(lái)”,唯(wéi)有(yǒu)自(zì)主创(chuàng)新(xīn)才(cái)是(shì)正(zhèng)道(dào)。从(cóng)曦(xī)思(sī)N100的(de)安(ān)防(fáng)落(luò)地(de),到(dào)曦(xī)云(yún)C600的(de)大(dà)模(mó)型(xíng)训(xun)练(liàn),再(zài)到(dào)曦(xī)彩(cǎi)G系(xì)列(liè)的(de)游(yóu)戏(xì)渲(xuàn)染(rǎn),沐(mù)曦(xī)正(zhèng)用(yòng)一(yī)款(kuǎn)款(kuǎn)产(chǎn)品(pǐn)证(zhèng)明(míng):国(guó)产(chǎn)GPU不(bù)仅(jǐn)能(néng)“可(kě)用(yòng)”,更(gèng)能(néng)“好(hǎo)用(yòng)”。未(wèi)来(lái),随(suí)着(zhe)其(qí)IPO进(jìn)程(chéng)推(tuī)进(jìn)(2025年(nián)6月(yuè)已(yǐ)获(huò)上(shàng)交(jiāo)所(suǒ)受(shòu)理(lǐ)),更(gèng)多(duō)资(zī)本(běn)的(de)注(zhù)入(rù)将(jiāng)加(jiā)速(sù)技(jì)术(shù)迭(dié)代(dài),或(huò)许(xǔ)不(bù)久(jiǔ)的(de)将(jiāng)来(lái),我(wǒ)们(men)就(jiù)能(néng)看(kàn)到(dào)搭(dā)载(zài)沐(mù)曦(xī)GPU的(de)国(guó)产(chǎn)游(yóu)戏(xì)主机(jī)、工(gōng)作(zuò)站(zhàn),甚(shén)至(zhì)超(chāo)级(jí)计(jì)算(suàn)机(jī),真(zhēn)正(zhèng)让(ràng)“中(zhōng)国(guó)芯(xīn)”成(chéng)为(wèi)推(tuī)动(dòng)社(shè)会(huì)进(jìn)步(bù)的(de)“可(kě)持(chí)续(xù)动(dòng)力(lì)”。
需要的帮助
非常重视自身产品及用户体验,欢迎广大用户向我们提出相关产品及业务系统的意见和反馈,以帮助我们提升产品性能及用户体验。
- 高性能GPU/模拟接口设计平台
