产品咨询:19113907060
联系我们
产品咨询
资讯内容banner 咨询banner-移动

2025-2028年预测:推理算力占比将达73%,智算卡迎来千亿级增量市场

作者:万物纵横
发布时间:2025-11-05 08:42
阅读量:

根据行业研究与市场预测,2025-2028年人工智能算力市场将经历结构性变革,推理算力占比预计从 2024 年的 65% 跃升至 2028 年的 73%,智算卡(AI 加速卡)市场将迎来千亿级增量。这一趋势由技术迭代、应用落地和政策驱动共同塑造,具体可从以下维度展开分析:


2025-2028年预测:推理算力占比将达73%,智算卡迎来千亿级增量市场(图1)


一、推理算力占比跃升的核心逻辑


AI 应用规模化落地的必然结果


随着大模型从训练转向实际部署,推理成为消耗算力的主要环节。例如,2025 年字节跳动火山引擎日均 Token 调用量达 16.4 万亿,较 2024 年增长 137 倍;Google 的 AI 搜索 Token 月均调用量从 9.7 万亿激增至 480 万亿。这种爆发式增长源于智能客服、内容生成、自动驾驶等场景对实时响应的需求。预计到 2026 年,国内推理任务 Token 处理量将达 400-500 万亿,需 330 万 - 350 万张推理卡支持。


训练与推理的算力需求分化


训练侧需求增速放缓,而推理侧因模型数量扩张和用户交互频率提升持续高增。2025 年训练与推理算力比例约为 1:1,2027 年可能降至 1:8 甚至 1:10。这一变化反映出 AI 产业从 “模型研发” 向 “价值兑现” 的重心转移。


算法优化与硬件适配的双重推动


模型蒸馏、量化等技术降低推理对算力的门槛,同时专用推理芯片(如寒武纪思元 590、燧原科技邃思系列)通过架构优化提升能效比。例如,寒武纪 MLU590 采用 Chiplet 技术,算力密度提升 2.3 倍,推动推理任务从云端向边缘渗透。


2025-2028年预测:推理算力占比将达73%,智算卡迎来千亿级增量市场(图2)


二、智算卡市场的千亿级增量空间


市场规模与增长动力


全球视角:2024 年全球 AI 加速卡市场规模为 628 亿美元,预计 2031 年将达 1.2 万亿美元,年复合增长率 53.6%。


中国市场:2023 年国内算力芯片规模 110 亿美元,2025 年预计增至 380 亿美元,2027 年达 710 亿美元。其中,推理卡市场占比从 2023 年的 42% 提升至 2025 年的 50%,2028 年或超 70%。


增量来源:智算中心建设(2025-2028 年市场规模 CAGR 29%)、边缘计算需求(工业互联网、智慧城市)及国产替代加速是核心驱动力。


国产替代的关键窗口期


2023 年国产算力芯片自给率仅 17%,2025 年预计提升至 42%,2027 年达 55%。寒武纪、华为昇腾等厂商在推理卡领域已实现突破:


寒武纪思元 590 的 FP16 算力达 300TFLOPS,虽低于英伟达 GB200,但在国内领先;


华为昇腾 910B 在政务云市场市占率达 32%,并通过适配飞桨平台构建生态。


预计 2026 年国产推理卡出货量将超 200 万张,占国内需求的 2/3。


2025-2028年预测:推理算力占比将达73%,智算卡迎来千亿级增量市场(图3)


技术路线与竞争格局


GPU 主导训练,专用芯片抢占推理:英伟达 H100、A100 仍统治训练市场,但寒武纪、燧原科技等通过 ASIC/FPGA 在推理领域形成差异化竞争。


异构计算成主流:CPU+GPU+NPU 的组合方案在数据中心占比超 70%,例如浪潮信息通过 PD 分离策略优化推理资源调度,降低延迟并提升吞吐量。


能效比与液冷技术:主流推理卡能效比目标从 2022 年的 15TFLOPS/W 提升至 2025 年的 25TFLOPS/W,液冷散热方案渗透率将超 40% 以应对高密度算力需求。


三、挑战与未来趋势


核心挑战


供应链与产能瓶颈:先进制程受限背景下,Chiplet、存算一体等技术成为破局关键。例如,壁仞科技 BR100 采用 7nm Chiplet 实现 1024TOPS 算力。


软件生态与兼容性:国产芯片需适配主流框架(如 PyTorch、TensorFlow),百度飞桨、华为昇思等平台通过开发者社区建设加速生态融合。


成本与性价比:国产推理卡价格较英伟达低 30%-50%,但性能仍有差距,需通过规模化量产和算法优化缩小鸿沟。


2025-2028年预测:推理算力占比将达73%,智算卡迎来千亿级增量市场(图4)


未来趋势


边缘与端侧推理崛起:2025 年边缘 AI 芯片市场规模预计达 42 亿元,自动驾驶、智能家居等场景推动低功耗芯片需求。


超算集群与算力网络:中国移动计划 2025 年建成 3 个超万卡智算中心,训 / 推算力配比达 1:10,国家算力枢纽节点通过液冷、AI 调度技术提升资源利用率。


政策与资本双轮驱动:国家集成电路产业基金三期 40% 资金定向投入 AI 芯片,地方政府(如深圳)设立 200 亿元产业基金支持研发。


四、结论


2025-2028 年,推理算力占比 73% 的预测不仅是技术演进的必然,更是 AI 产业商业化成熟的标志。智算卡市场将在国产替代、异构计算和应用扩张的推动下,形成千亿级增量空间。企业需聚焦 “算法 - 硬件 - 生态” 协同创新,同时关注边缘算力、绿色节能等细分领域,方能在这场算力革命中占据先机。

- END -
分享:
留言 留言 试用申请
电话咨询 电话咨询 电话联系
19113907060
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *