
过去两年,谈起AI芯片,大家总是盯着训练集群、峰值算力这些硬指标。但进入2025年,一个更贴近实际业务的问题逐渐清晰,当大模型走出实验室进入千行百业,决定商业化成败的关键不再是训练跑得多快,而是推理跑得多省、多稳、能否持续交付。
这个转变不是突凯云官网然发生的。随着DeepSeek、通义千问等国产开源大模型的崛起,推理阶段的持续运营成本与实时响应速度被显著放大。算力需求从峰值训练延伸到长期推理,产业重心也随之从训练向推理迁移。
云天励飞董事长陈宁回忆起2014年回国创业时的情景。那时AI还处在视觉识别阶段,主流模型以CNN等小规模网络为主,行业更关注把算法在真实场景跑通,国内几乎没有专门的推理芯片。
2020年之后,Transformer架构兴起,AIGC成为主流,大模型加速崛起。百模大战带动训练算力需求率先爆发,行业一度把焦点集中在规模化集群与极限性能的竞赛上。但当大模型走出实验室进入千行百业,越来越多业务开始把推理阶段的持续运营成本与实时响应速度放到更核心的位置。
2025年之所以成为一个集中爆发的节点,更像是多股力量的叠加结果。一方面,大模型走出实验室进入千行百业,推理阶段的持续运营成本与实时响应需求被显著放大。另一方面,政策红利、资本推动叠加国产开源大模型生态活跃等因素,使企业融资与产品推进节奏明显加快。
这些行业发展变化与国产AI芯片企业在2025年前后集中显化的节奏相互叠加。寒武纪在2025年下半年股价大幅波动,盘中一度赶超贵州茅台。2025年底,摩尔线程率先在科创板上市成为国产GPU第一股,沐曦股份随后登陆科创板;延续到2026年,壁仞科技于1月2日在港上市,天数智芯紧随其后于1月8日登陆港股。
面对推理芯片这一关键赛道,一批本土企业正在加速突围。华为昇腾系列芯片采用专用集成电路设计,基于自研的达芬奇架构,专为高效执行AI神经网络计算任务而优化。
2025年9月华为全联接大会上,华为宣布未来3年将开发和规划Ascend950系列、Ascend960系列、Ascend970系列,AI芯片将以几乎一年一代、算力翻倍的速度持续演进。
寒武纪推出了思元590芯片,这款基于7纳米工艺打造的国产AI芯片,推理算力达512 TOPS,并全面兼容国内几乎所有主流大模型。天数智芯则围绕训推组合的通用GPU路线推进产品体系,其公开资料显示已发布面向推理的通用GPU产品,并强调对主流深度学习框架与多精度推理计算的支持。
云天励飞则提出了全新的GPNPU架构,强调面向人工智能推理的设计,并结合封装与存储等系统级手段缓解带宽瓶颈,试图走出一条差异化技术路径。在推理成为产业主战场的当下,竞争焦点正在从单点算力指标扩展到软硬协同、成本结构、交付与运维的综合能力。
进入2026年,推理需求的上行更明显地与两条产业线索交织在一起,一条是应用形态从对话走向行动,另一条是推理系统从同构堆卡走向工程化拆分。
在CES2026上,英伟达CEO黄仁勋多次强调智能体与物理AI的到来,核心指向是AI从生成内容进一步延伸到理解、规划与执行,落到机器人、自动驾驶、工业系统等更贴近现实世界的场景中。
根据灼识咨询报告,中国A凯云官网I推理芯片相关产品及服务行业市场规模从2020年的113亿元增长至2024年的1626亿元,复合年增长率达94.9%,预计2024年至2029年将以53.4%的复合年增长率增长,2029年将达到13830亿元。
在国内,推理侧的机会同样更具确定性。一方面,中国AI推理芯片赛道目前并未形成一家独大的格局,不同技术路线仍在并行推进。另一方面,中国作为应用大国,政策层面对AI规模化普及给出了明确目标。
从比拼单点算力的军备赛,到围绕推理效率、工程交付与生态协同的体系化较量,国产AI芯片的竞争已进入下半场。随着推理需求持续放大且进一步细分,市场也将为更多务实路线年的角逐已然开始。返回搜狐,查看更多