制图:黄亚岚(元宝AI、豆包AI生成)

2025年,沉淀已久的国产AI芯片迎来关键性转折。在DeepSeek助力下,AI算力需求引爆,国产替代被按下“加速键”。寒武纪股价狂飙,屡次登上科创板“股王”之位。国产替代年底迎来资本“盛宴”——摩尔线程和沐曦股份先后顶着“国产GPU第一股”和“第二股”的光环登陆科创板,壁仞科技和天数智芯也在港交所接连传出好消息,将在2026年年初正式赴港上市。几乎同期,市场传出英伟达H200被批准对华出售的消息,业内探讨这是否会挤压国产AI芯片市场空间。今年国产AI芯片行业的发展将去往何处?

  趋势1

  DeepSeek引爆国产替代 国产芯片在推理赛道有机会

2025年,国产AI芯片赛道可谓是热闹非凡。2025年年初,DeepSeek横空出世,随其“破圈”而来的是AI应用侧的大爆发,AI在口口相传间真正走入了寻常百姓家,这也意味着算力需求逐步从训练转向推理。之后,华为打“头阵”,一众国产AI芯片厂商宣布支持DeepSeek并快速部署,国产算力热情被“点燃”。

2025年8月,DeepSeek又发布了新一代模型DeepSeekV3.1,并在公众号留言中强调,“UE8M0FP8是针对即将发布的下一代国产芯片设计的。”业内分析认为,“UE8M0 FP8”格式能够深度适配国产芯片,通过算法创新来弥补硬件短板,更好地发挥国产芯片的性能。这也再次引爆了投资者对国产芯片厂商的热情。接着,因思元590及未来可能发布的690系列芯片均原生支持FP8计算,寒武纪应声大涨,股价一度超过“股王”贵州茅台,单月涨幅高达100%。

其中,国产AI芯片在推理侧的机遇明显。业内观点认为,随着开源大模型的成熟与普及,AI模型预训练环节已形成相对稳定的市场格局,而终端应用落地催生的推理算力需求,AI推理芯片行业正进入爆发式增长阶段。数据显示,2024年中国AI推理芯片相关产品及服务市场规模增长至1626亿元,预计2025年这一规模将增长至3106亿元。南都记者了解到,国内聚焦推理的厂商以华为、寒武纪和沐曦股份为代表。

龚明德则分析称,国内在DeepSeek效应推动下,带动AI供应商朝不同应用领域发展,其估计各厂商重点在积极拓展CSP(Cloud Service Provider,云服务提供商)ChatBOT应用服务,并寻求与自身互联网业务(如团购)整合,或边缘AI推理应用(如自动驾驶)服务发展。整体而言,国内以各应用领域的边缘AI推理较具发展潜力。

值得一提的是,推理侧的机遇从英伟达吸纳其“挑战者”Groq的动作中也能窥见一斑。去年12月,海外AI芯片初创公司Groq宣布已与英伟达就其推理技术达成非独家许可协议,共同推进授权技术的升级与规模化应用。据了解,在主流大语言模型运行中,Groq研发的LPU推理速度可达英伟达H100的5至18倍。

随着性能要求较低的推理需求给国产芯片带来机遇,有关国产替代的呼声也在2025年达到高点。壁仞科技在上市公告中提到,国内企业在中国智能计算芯片市场中的份额,预计将从2024年的约20%增加至2029年的约60%。天数智芯也表示,国内通用GPU市场国产化率从2022年的2%提升至2024年的3.6%,并预计2029年通用GPU国产化率将超50%,国产替代率将持续提升。

趋势2

  国产AI芯片厂商集体冲击上市 市占率仍有待突破

今年也是国产算力软硬件从单点突破走向全面推广的关键之年。而在政策红利和市场需求的双重助推下,国产AI芯片厂商集体在一级市场迎来了阶段性“丰收”。

去年12月,摩尔线程率先冲线成为“国产GPU第一股”,上市首日高开468.78%,报650元/股,开盘市值超3000亿元,沐曦股份紧随其后也成功登陆科创板,上市首日股价高开568.83%,报700元/股,市值超2800亿元,二者以114.28元和104.66元的发行价,成为去年科创板发行价最高的两只新股。不过,热炒过后资本市场已在年底趋于冷静,双方股价均维持在每股600元上下。

同样意图冲击科创板的还有聚焦ASIC架构的厂商燧原科技,其在去年11月重新进行上市辅导备案,辅导机构由此前的中金公司变更为中信证券,今年开年,燧原科技上市辅导完成。另外,GPU厂商瀚博半导体也赶着2025年的“尾巴”宣布完成上市辅导。

港股亦好消息不断,壁仞科技及天数智芯均在年底发布消息称,将于2026年开年敲开港交所“大门”。另外,百度旗下AI芯片公司昆仑芯也以保密形式申请在港交所上市,这意味着如若各家进展顺利,2026年的资本市场还将继续注入“新鲜血液”,迎来百花齐放的局面。

不过,国内市场中国产芯片厂商的市占率还不高,除海外巨头英伟达和AMD外,国内市场基本以华为占据大头,其他创业公司市占率仅在1%左右,市场高度集中的现状未有明显改观。Bernstein Research数据显示,以销售金额口径计,2024年,中国AI加速器市场中,英伟达的市占率约为66%,华为海思约为23%,AMD约为5%,而寒武纪、摩尔线程、沐曦股份则均约为1%。

天数智芯也在上市公告中披露,按收入来看,其2024年在中国通用GPU中市场份额为0.3%,壁仞科技则在上市公告中介绍称,据灼识咨询资料,其将在2025年预期占约0.2%的市场份额。

但值得一提的是,Bernstein Research最新报告预测,2026年,英伟达在中国AI芯片市场的份额将显著萎缩至8%,而华为将占据50%的份额,AMD预计以12%的份额列第二,寒武纪或将排第三。

除市占率不高外,从业绩披露数据来看,国产AI芯片厂商大多未实现盈利,2022年至2025年前三季度,摩尔线程净亏损分别为18.94亿元、17.03亿元、16.18亿元及7.24亿元,沐曦股份净亏损分别为7.77亿元、8.71亿元、14.09亿元及3.46亿元。2022年至2025年上半年,壁仞科技净亏损分别为14.74亿元、17.44亿元、15.38亿元及16.01亿元,天数智芯净亏损分别为5.54亿元、8.17亿元、8.92亿元及6.09亿元。而作为“老大哥”的寒武纪也在2024年第四季度才开始实现盈利,去年前三季度盈利16.05亿元。

收入集中在前五大客户也是硬伤。南都记者梳理这几家GPU厂商的上市披露信息发现,其前五大客户贡献收入占比均较高,其中,摩尔线程自2022年起这一占比便维持在89%以上高居不下,2024年,占比甚至高至98.16%。沐曦股份来自前五大客户贡献收入也基本在七成以上,去年一季度达到88.35%。

壁仞科技自2023年开始营收后,前五大客户收入也维持在九成以上。另外,天数智芯去年上半年来这一占比有所下滑,降至38.6%,而其2022年至2024年间占比也均在70%以上。值得一提的是,各家前五大客户不算稳定,上市公告显示,其每年贡献收入最多的客户名称均不尽相同。    

趋势3

  英伟达“反击战”开启 去年年末H200获批对华出售

国产AI芯片风生水起,反观英伟达,去年其在中国市场的日子并不好过,但这也给国产芯片替代提供了些许机会。先是在DeepSeek的一波冲击之下股价出现下跌,而后在去年4月,英伟达披露称,其专为中国市场设计的AI芯片H20被美国列入了限制出口名单。禁令一出,英伟达市值蒸发1600亿美元,直到三个月后的7月才获批恢复出口。

紧接着,英伟达又被爆出存在芯片安全问题,国家互联网信息办公室在2025年7月31日约谈了英伟达,要求其就对华销售的H20算力芯片漏洞后门安全风险问题进行说明并提交相关证明材料。

英伟达于2025年8月5日、8月10日、8月11日连续三次发表声明,强调“网络安全对公司至关重要,H20芯片不存在后门,不会让任何人通过远程方式访问或控制芯片”。9月,在美国城堡证券举办的活动上,英伟达创始人兼CEO黄仁勋一度泄气表示,英伟达在中国的市场份额从95%降到0%,目前英伟达100%离开了中国市场。

直到12月,特朗普突然批准英伟达向中国出售H200人工智能芯片。据悉,如若H200不被阉割,其性能将达到H20的6倍以上,不过,较英伟达最新的Blackwell芯片仍存差距。而对于此次“放行”,国内市场中的声音有两种,一种观点认为从生意角度出发,中国作为全球最大的半导体市场是美国无法割舍的,另外一种则强调美国试图通过倾销性能相对落后但具竞争力的芯片,来维持中国对其形成的技术依赖,延缓中国国产替代进程。

对此,分析机构TrendForce集邦咨询表示,H200效能较H20大幅提升,对终端客户具有吸引力,若2026年能顺利销售,预期中国CSP、OEM皆有望积极采购。集邦咨询还指出,H200算力表现、存储器规格虽不及Blackwell系列芯片,但优于H20。中国本土AI芯片供应商或CSP的自研ASIC技术发展尚面临压力,因此,H200仍受青睐。不过,南都记者注意到,国内目前还未批准H200的采购订单。

英伟达所带来的压力还来自其根基深厚的CUDA生态,这点将长期存在。此前在2025年GTC大会演讲中,黄仁勋曾表示,“我们的护城河不是芯片,而是数百万开发者写下的代码惯性”。据公开数据显示,英伟达目前已经在全球拥有500多万的CUDA生态开发者,而国产AI芯片厂商软件生态距离成熟还存在一定距离。

迁移成本则是最大障碍。据了解,从CUDA迁移到国产平台,需要进行代码重写、模型调优及性能验证,要投入较高的成本。壁仞科技就在上市公告中坦言,在智能计算解决方案行业中,部分主要市场参与者凭借其长期的资源投入及多年的运营经验,已成功建立其自身产品的生态系统,特点是培养出用户习惯以及形成了完备的依托其产品的大量软件应用网络,这导致潜在客户转而使用其产品及解决方案的成本较高,这一主要市场参与者便包括英伟达。

基于此,部分芯片厂商选择了兼容CUDA生态,以降低其客户迁移到国产平台的成本。比如,摩尔线程自主研发的MUSA统一系统架构宣称开发者无需重写全部代码,沐曦股份自研的MXMACA软件栈能在API层面对CUDA实现较高程度兼容。也有例外,华为轮值董事长徐直军在去年9月的全联接大会2025上,就强调过华为不兼容CUDA的原因,他提到,“我们投这么多钱兼容CUDA生态,而且CUDA现在也不能随便用,都是过去的版本。如果哪天CUDA生态兼容不了怎么办?从长远来考虑的话,要把生态构建起来。”    

趋势4

  先进制程受限问题仍存在 超节点成未来突破口之一

国产AI芯片还存在先进制程受限的问题。业内分析认为,7nm以下制程难产直接影响算力密度和能效比。据悉,当前国产GPU厂商主流采用7nm或14nm制程,英伟达则已经进入4nm时代。比如,华为昇腾910C采用7nm工艺,而英伟达Blackwell则采用4nm工艺。值得一提的是,2025年1月,美国方面还采取了阻止台积电、三星等晶圆代工厂所生产的14nm或16nm及以下先进制程的芯片流入中国大陆的措施。

面对地缘风险,国内有GPU厂商选择了切换国产供应链。沐曦股份在此前上市公告中坦言,在中美科技博弈持续升级的背景下,因美国政府相关政策影响,其目前在先进制程晶圆代工和HBM供应等方面受到不利限制,由于集成电路领域专业化分工的产业结构及较高的技术门槛,其中部分供应商的产品或服务具有稀缺性和独占性,较难在短时间内形成同质量的国产替代。而为应对外部不确定性,沐曦股份也规划其曦云C600等后续产品都将采用国产供应链。

此外,去年也有诸多厂商试图通过“超节点”的形式,绕开制程受限下,单芯片性能不足的问题。4月,华为率先发布了基于昇腾910C构建的Cloud Matrix384,Semi Analysis发布的报告中,将华为Cloud Matrix 384和英伟达GNVL72进行了比较,结论提到,华为拥有五倍数量的昇腾芯片,抵消了其单个芯片仅为英伟达Blackwell芯片性能三分之一的差距。黄仁勋在接受媒体采访时也表示,华为昇腾Cloud Matrix 384超节点,部分性能甚至超过英伟达产品。值得一提的是,9月,华为又在全联接大会2025上发布了Atlas 950和Atlas 960超节点。

华为“打头阵”下,在去年7月的世界人工智能大会上,曦智科技联合壁仞科技、中兴通讯推出了全球首个分布式光互连光交换GPU超节点解决方案——光跃Light SphereX。去年9月,阿里巴巴在云栖大会上亮出了磐久128超节点。

而后,在去年11月,百度也宣布将不断加大在超节点上的建设,并公布了其天池256和512超节点,二者将分别在2026年上半年和下半年上市。据悉,512超节点最高支持512卡极速互联,单节点便可完成万亿参数模型训练。

  ●展望

  国产AI芯片机会点在哪?

总的来看,2025年,是国产AI芯片加速替代和寻求破局的关键一年,而站在“肩膀”上展望2026年,国产AI芯片的机会点又在何处?业内分析认为,受国内智算中心加速建设以及互联网公司AI需求催化,智算芯片市场需求有望再上新台阶,预计2026年国内AI芯片规模将突破3000亿元,国产芯片有望提升份额。当前,国产芯片在硬件参数上与海外芯片差距日益缩减,软件生态、互联技术有望随产业发展而不断壮大。

龚明德则告诉南都记者,“预期在相关策略积极推动本土AI芯片自主化下,2026年由本土领先业者带动下,高阶AI芯片占比有机会往占50%目标迈进。预计未来国内市场分为两大方向:一方面是CSP业者自研ASIC;另一方面则为本土供应商(如华为、寒武纪、沐曦或摩尔等)。预期在本土上游供应商(如晶圆、封装或HBM)供应较有限的情况下,相对低阶规格的AI推理芯片将成较大发展机会。”

出品:南都政商数据新闻部 

策划/统筹:甄芹 田爱丽 

采写:南都记者 朱可轩