产品咨询:19113907060
联系我们
产品咨询
资讯内容banner 咨询banner-移动

2025年最新技术参数、市场份额及应用场景的国产AI计算卡综合排名

作者:万物纵横
发布时间:2025-10-30 09:32
阅读量:

以下是结合 2025 年最新技术参数、市场份额及应用场景的国产 AI 计算卡综合排名,分为训练、推理及边缘端三大类,并附核心厂商对比分析:


一、训练场景综合排名


1. 华为昇腾 910B


核心参数:7nm+EUV 工艺,32 核达芬奇架构,FP16 算力 320 TFLOPS,INT8 算力 640 TOPS,64GB HBM2 显存,带宽 1.2 TB/s,支持 NVLink 级集群互联(卡间带宽 200 GB/s)。


技术优势:与华为 MindSpore 框架深度协同,在鹏程・盘古大模型训练中实现 91% 的千卡集群线性加速比,算力利用率达 82%,接近 A100 集群的 91%。


市场地位:2024 年出货量超 64 万片,占据国产 AI 芯片市场 23% 份额,稳居第一。


典型应用:千亿参数大模型训练、超算中心 AI for Science 任务(如分子动力学模拟)。


2025年最新技术参数、市场份额及应用场景的国产AI计算卡综合排名(图1)


2. 壁仞科技 BR100


核心参数:7nm 工艺,770 亿晶体管,FP16 算力 1000 TFLOPS,INT8 算力 2000 TOPS,80GB HBM3 显存,带宽 3.35 TB/s,支持 BLink 高速互联(单卡互连带宽 448 GB/s)。


技术突破:首创 “芯片墙” 互联技术,多芯片集群算力可线性扩展至 E 级(百亿亿次),在某智能安防项目中将人脸识别延迟从 200ms 压缩至 50ms。


市场表现:2025 年中标东数西算工程超 10 亿元订单,与长江存储合作优化存储架构,数据读写带宽提升 2 倍。


典型应用:超大规模模型训练(如 1.2 万亿参数 DeepSeek R2)、自动驾驶仿真平台加速。


3. 海光信息 DCU K100 AI 版


核心参数:7nm 工艺,FP16 算力 192 TFLOPS,INT8 算力 392 TOPS,64GB HBM2 显存,带宽 896 GB/s,兼容 ROCM 生态。


技术特点:基于 AMD 授权架构,代码迁移成本低,在金融风控模型训练中效率比传统方案提升 40%。


市场份额:2024 年 AI 服务器市占率超 30%,与中科曙光形成 “芯片 + 整机” 黄金组合,拿下东数西算 20 亿元大单。


典型应用:政务云、金融行业大模型训练,支持 PyTorch/TensorFlow 无缝迁移。


2025年最新技术参数、市场份额及应用场景的国产AI计算卡综合排名(图2)


4. 天数智芯天垓 150


核心参数:7nm 工艺,FP16 算力 295 TFLOPS,INT8 算力 590 TOPS,32GB HBM2 显存,带宽 900 GB/s,支持国产 CUDA 兼容层 DeepLink。


技术突破:自主 Big Island 架构,在 ResNet-50 训练中算力利用率达 78%,较传统 GPU 提升 2 倍。


市场动态:2024 年出货量 3.8 万片,中标某省级政务云超 5 亿元订单。


典型应用:智慧城市视频分析、能源行业地震数据处理。


二、推理场景综合排名


1. 寒武纪 MLU370-X8


核心参数:7nm 工艺,双芯思元 370 配置,INT8 算力 256 TOPS,48GB LPDDR5 显存,带宽 614.4 GB/s,MLU-Link 多卡互联带宽 200 GB/s。


技术优势:在 YOLOv3、BERT 等模型中,8 卡集群加速比达 350W RTX GPU 的 155%,能效比领先 40%。


市场份额:2024 年推理芯片部署超 10 万片,占据国产推理卡市场 30% 份额。


典型应用:互联网推荐系统、医疗影像三维重建(单卡处理 CT 影像仅需 200ms)。


2025年最新技术参数、市场份额及应用场景的国产AI计算卡综合排名(图3)


2. 燧原科技云燧 i20


核心参数:12nm 工艺,INT8 算力 256 TOPS,32GB HBM2E 显存,带宽 819 GB/s,支持单卡 6 实例虚拟化。


技术突破:首创 “驭算 TopsRider” 软件栈,模型迁移成本降低 50%,在某银行反欺诈系统中交易处理延迟降至微秒级。


市场表现:2024 年出货量 1.3 万片,中标字节跳动视频分析项目,支撑 8K 视频实时处理。


典型应用:超高清视频编解码(单卡支持 264 路全高清 HEVC 解码)、智能客服语音识别。


3. 摩尔线程 MTT S4000


核心参数:14nm 工艺,INT8 算力 128 TOPS,16GB GDDR6 显存,带宽 512 GB/s,兼容 DirectX 12 及 PyTorch 生态。


技术特点:在 Stable Diffusion 图像生成中,单卡推理速度达 RTX 4090 的 80%,功耗降低 30%。


市场定位:2025 年签约某智算中心超 14 亿元订单,主打国产化替代及边缘端推理。


典型应用:工业质检(单卡支持 16 路高清摄像头实时检测)、边缘 AI 服务器。


三、边缘端综合排名


1. 寒武纪 MLU220


核心参数:16nm 工艺,INT8 算力 2 Tera-OPS,功耗 5W,支持动态稀疏计算,兼容 Caffe/TensorFlow Lite。


技术优势:在自动驾驶场景中处理 8 路摄像头数据延迟仅 8ms,功耗仅为同类 GPU 的 1/10。


市场份额:2024 年车载 AI 芯片市占率超 25%,合作车企超 10 家。


典型应用:智能驾驶舱、无人机避障系统。


2025年最新技术参数、市场份额及应用场景的国产AI计算卡综合排名(图4)


2. 地平线征程 6


核心参数:16nm 工艺,INT8 算力 6 TOPS,功耗 4W,支持 BEV 感知与多传感器融合。


技术突破:与比亚迪合作车型实现 L2 + 级自动驾驶,模型推理延迟低于 10ms。


市场表现:2025 年车载 AI 芯片出货量预计突破 500 万片,稳居国产第一。


典型应用:高级辅助驾驶(ADAS)、智能泊车系统。


3. 海光信息 DCU K100 边缘版


核心参数:14nm 工艺,INT8 算力 96 TOPS,功耗 25W,支持 PCIe 4.0 接口及国产操作系统适配。


技术特点:在某电力巡检项目中,单卡实现 10kV 线路红外图像缺陷识别,准确率达 99.5%。


市场定位:2025 年中标国家电网超 3 亿元订单,主打工业物联网边缘计算。


典型应用:智能电网设备状态监测、智慧矿山环境感知。


四、厂商生态与技术路线对比


厂商

训练卡代表型号

推理卡代表型号

生态兼容性

技术路线

典型客户

华为昇腾

910B

310B

MindSpore 原生支持,兼容 PyTorch/TensorFlow

专用 ASIC 架构 + 达芬奇计算单元

阿里云、鹏城实验室

壁仞科技

BR100

BR106C

BIRENSUPA 框架,支持部分 CUDA 迁移

通用 GPU 架构 + BLink 高速互联

长江存储、某省级政务云

寒武纪

MLU590

MLU370-X8

MagicMind 工具链,支持 ONNX/TVM 转换

云边端统一架构 + MLUarch03 指令集

百度文心一言、商汤科技

海光信息

DCU K100 AI 版

DCU K100 边缘版

ROCm 生态兼容,支持 PyTorch/TensorFlow

x86 兼容架构 + AMD 授权技术

中科曙光、国家超算中心

燧原科技

云燧 T20

云燧 i20

驭算 TopsRider 软件栈,支持模型自动分片

存算一体架构 + 高带宽 HBM2E

字节跳动、平安科技


五、关键趋势与选型建议


技术迭代方向:


训练卡:壁仞科技 BR200 计划采用 3nm 工艺,FP16 算力目标突破 3 PetaFLOPS;华为昇腾 910C 将引入 HBM3e,显存带宽提升至 3.2 TB/s。


推理卡:寒武纪 MLU590-X16 计划支持 8 位稀疏计算,INT8 算力翻倍至 512 TOPS;燧原科技云燧 i30 将采用 Chiplet 技术,带宽突破 1.6 TB/s。


选型决策树:


大模型训练:优先选择昇腾 910B(生态成熟)或壁仞 BR100(算力密度领先)。


实时推理:寒武纪 MLU370-X8(多卡扩展性强)或燧原 i20(高带宽低延迟)。


边缘计算:地平线征程 6(车规级)或寒武纪 MLU220(低功耗)。


国产化替代:海光 DCU(x86 兼容)或摩尔线程 MTT S4000(自主生态)。


成本对比:


昇腾 910B 单卡价格约为英伟达 A100 的 60%,训练成本降低 40%。


寒武纪 MLU370-X8 的 TCO 比同类 GPU 低 30%,尤其适合长时间推理任务。


壁仞 BR100 虽硬件成本较高,但在超算场景下算力利用率提升 50%,长期 TCO 更优。


六、总结


国产 AI 计算卡已形成 “训练 - 推理 - 边缘” 全场景覆盖的竞争格局:华为昇腾凭借生态优势稳居第一梯队,壁仞科技在高端训练卡实现突破,寒武纪与海光信息分别在推理和兼容生态领域占据细分市场。随着 3nm 工艺、HBM3e 及存算一体技术的落地,国产算力芯片正从 “跟跑” 向 “并跑” 迈进,未来 2-3 年有望在全球 AI 基础设施中占据 30% 以上份额。企业选型时需综合考虑模型规模、开发成本及国产化合规要求,优先选择生态成熟度高、技术迭代能力强的厂商。

- END -
分享:
留言 留言 试用申请
电话咨询 电话咨询 电话联系
19113907060
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *