根据行业研究与市场预测,2025-2028年人工智能算力市场将经历结构性变革,推理算力占比预计从 2024 年的 65% 跃升至 2028 年的 73%,智算卡(AI 加速卡)市场将迎来千亿级增量。这一趋势由技术迭代、应用落地和政策驱动共同塑造,具体可从以下维度展开分析:

一、推理算力占比跃升的核心逻辑
AI 应用规模化落地的必然结果
随着大模型从训练转向实际部署,推理成为消耗算力的主要环节。例如,2025 年字节跳动火山引擎日均 Token 调用量达 16.4 万亿,较 2024 年增长 137 倍;Google 的 AI 搜索 Token 月均调用量从 9.7 万亿激增至 480 万亿。这种爆发式增长源于智能客服、内容生成、自动驾驶等场景对实时响应的需求。预计到 2026 年,国内推理任务 Token 处理量将达 400-500 万亿,需 330 万 - 350 万张推理卡支持。
训练与推理的算力需求分化
训练侧需求增速放缓,而推理侧因模型数量扩张和用户交互频率提升持续高增。2025 年训练与推理算力比例约为 1:1,2027 年可能降至 1:8 甚至 1:10。这一变化反映出 AI 产业从 “模型研发” 向 “价值兑现” 的重心转移。
算法优化与硬件适配的双重推动
模型蒸馏、量化等技术降低推理对算力的门槛,同时专用推理芯片(如寒武纪思元 590、燧原科技邃思系列)通过架构优化提升能效比。例如,寒武纪 MLU590 采用 Chiplet 技术,算力密度提升 2.3 倍,推动推理任务从云端向边缘渗透。

二、智算卡市场的千亿级增量空间
市场规模与增长动力
全球视角:2024 年全球 AI 加速卡市场规模为 628 亿美元,预计 2031 年将达 1.2 万亿美元,年复合增长率 53.6%。
中国市场:2023 年国内算力芯片规模 110 亿美元,2025 年预计增至 380 亿美元,2027 年达 710 亿美元。其中,推理卡市场占比从 2023 年的 42% 提升至 2025 年的 50%,2028 年或超 70%。
增量来源:智算中心建设(2025-2028 年市场规模 CAGR 29%)、边缘计算需求(工业互联网、智慧城市)及国产替代加速是核心驱动力。
国产替代的关键窗口期
2023 年国产算力芯片自给率仅 17%,2025 年预计提升至 42%,2027 年达 55%。寒武纪、华为昇腾等厂商在推理卡领域已实现突破:
寒武纪思元 590 的 FP16 算力达 300TFLOPS,虽低于英伟达 GB200,但在国内领先;
华为昇腾 910B 在政务云市场市占率达 32%,并通过适配飞桨平台构建生态。
预计 2026 年国产推理卡出货量将超 200 万张,占国内需求的 2/3。

技术路线与竞争格局
GPU 主导训练,专用芯片抢占推理:英伟达 H100、A100 仍统治训练市场,但寒武纪、燧原科技等通过 ASIC/FPGA 在推理领域形成差异化竞争。
异构计算成主流:CPU+GPU+NPU 的组合方案在数据中心占比超 70%,例如浪潮信息通过 PD 分离策略优化推理资源调度,降低延迟并提升吞吐量。
能效比与液冷技术:主流推理卡能效比目标从 2022 年的 15TFLOPS/W 提升至 2025 年的 25TFLOPS/W,液冷散热方案渗透率将超 40% 以应对高密度算力需求。
三、挑战与未来趋势
核心挑战
供应链与产能瓶颈:先进制程受限背景下,Chiplet、存算一体等技术成为破局关键。例如,壁仞科技 BR100 采用 7nm Chiplet 实现 1024TOPS 算力。
软件生态与兼容性:国产芯片需适配主流框架(如 PyTorch、TensorFlow),百度飞桨、华为昇思等平台通过开发者社区建设加速生态融合。
成本与性价比:国产推理卡价格较英伟达低 30%-50%,但性能仍有差距,需通过规模化量产和算法优化缩小鸿沟。

未来趋势
边缘与端侧推理崛起:2025 年边缘 AI 芯片市场规模预计达 42 亿元,自动驾驶、智能家居等场景推动低功耗芯片需求。
超算集群与算力网络:中国移动计划 2025 年建成 3 个超万卡智算中心,训 / 推算力配比达 1:10,国家算力枢纽节点通过液冷、AI 调度技术提升资源利用率。
政策与资本双轮驱动:国家集成电路产业基金三期 40% 资金定向投入 AI 芯片,地方政府(如深圳)设立 200 亿元产业基金支持研发。
四、结论
2025-2028 年,推理算力占比 73% 的预测不仅是技术演进的必然,更是 AI 产业商业化成熟的标志。智算卡市场将在国产替代、异构计算和应用扩张的推动下,形成千亿级增量空间。企业需聚焦 “算法 - 硬件 - 生态” 协同创新,同时关注边缘算力、绿色节能等细分领域,方能在这场算力革命中占据先机。
需求留言: