首页> 新闻动态> 行业资讯> RK1820MC0 M.2 算力卡跑 7B 大模型，延迟和帧率表现如何？

RK1820MC0 M.2 算力卡跑 7B 大模型，延迟和帧率表现如何？

作者：万物纵横

发布时间：2026-06-10 11:31

阅读量：

RK1820MC0（2.5GB 版）跑 7B 可以跑，但要 INT4 量化，速度大概 45–65 token/s，首包延迟约 15–25ms；比 RK1828（5GB）慢、内存更吃紧。

下面分开说 “延迟 / 帧率（token 速率）” 和关键限制。

RK1820MC0 M.2 算力卡跑 7B 大模型，延迟和帧率表现如何？(图1)

1. 硬件与定位

RK1820MC0：2.5GB 合封 DRAM，带宽～1024GB/s，NPU 理论 20TOPS（INT8）。

RK1828：5GB DRAM，才是原生顺畅跑 7B 的型号；RK1820 官方定位 3B 为主、7B 为辅（需量化 + 精简）。

2. 7B 大模型实测（Qwen2.5-7B / DeepSeek-7B 类）

（1）典型性能（INT4 量化，W4A16）

吞吐（TPS / 帧率）：45–65 token/s

首包延迟（TTFT）：15–25ms

端到端交互延迟：~0.1s 级

（2）与 RK1828 对比（同 7B INT4）

RK1828：70–100 token/s，TTFT 10–18ms

RK1820：45–65 token/s，TTFT 15–25ms（内存带宽 / 容量受限）

（3）精度影响（7B）

INT4（推荐）：45–65 token/s，2.5GB 勉强装下（W4A16 约 3.5GB，需部分 offload 或精简上下文）

INT8：25–35 token/s，内存不足（7B INT8 约 7GB），必须大量 offload，延迟陡增

3. 为什么 “帧率”（token/s）不算高

7B 模型权重 + KV 缓存：INT4 约 3.5GB，超过 RK1820 的 2.5GB，必须：

缩短上下文（如 4K→2K）

部分 KV 缓存 offload 到主控（PCIe 2.0 瓶颈）

带宽虽高（1TB/s），但 7B 对内存 / 带宽需求比 3B 高很多。

4. 适用场景

✅ 能跑：轻量对话、指令跟随、摘要（上下文 ≤2K，INT4）

❌ 不适合：长文本、多模态 VLM、高并发（内存 / 延迟压力大）

5. 总结

RK1820MC0 跑 7B：INT4 下 45–65 token/s、首包 15–25ms；能用来做端侧轻量交互，但不如 5GB 的 RK1828 顺畅。

家具美容培训

家具维修培训

- END -

分享：

上一篇：瑞芯微RK1820MC0 M.2 AI推理卡技术分析与选型指南返回列表下一篇：实测对比｜RK1820MC0 M.2算力卡适配RK3588效果分享

需求留言:

热门文章

从WAIC 2026看产业新风向：行为分析算法盒子，开启边缘视觉智能规模化落地时代

告别云端高额费用！DA600 弹性算力边缘一体机，实现本地离线部署 35B 大模型

2026 边缘计算产业拐点：端侧大模型落地加速，弹性扩展式边缘盒成为主流标准

边缘大模型硬件怎么选？RK3588 弹性扩展 DA600 一体机完整评测：算力、功耗、模型实测全数据

WAIC2026 端侧 AI 爆发：万物纵横 DA600 可扩展算力边缘盒亮相，单设备最高 326TOPS 支撑 35B 大模型

AI边缘计算盒子咨询

瑞芯微RK182X相关内容

传统 2D 封装和瑞芯微RK182X 3D 堆叠 AI 芯片性能差距在哪？

国产 NPU 深度解析：瑞芯微RK182X 系列到底能不能对标昇腾芯片？

算力解耦灵活升级，瑞芯微 RK182X 主控 + 协处理器双架构重塑 AIoT 研发模式

瑞芯微 RK182X SDK 1.0.4 重磅上线全栈能力加持加速端侧 AI 规模化量产

热门标签

工地视频监控ai分析盒子

RKNN 人脸识别

ecu的主要作用是什么

算力服务器

医疗物流机器人

智能边缘计算平台

智能路灯控制系统设计

DS-X32 产品介绍手册

领先的边缘智能产品与解决方案提供商

立即体验

高性能AI边缘计算盒子

AIoT 智能设备

大模型一体机 AI边缘盒子 AI服务器 AI 核心板 AI算力卡

AIoT 智能平台

AIoT物联智能平台 IoT物联网平台

AI边缘计算盒子方案 AI智算服务器方案 ThingSense平台方案云边端一体化方案

服务与支持

AI产品资料中心售后服务产品定制

万物公众号二维码

华北地区负责人：17340067106（毛经理）

华东地区负责人：17358670739（甘经理）

华南、华西地区负责人：19113907060（耿女士）

软件算法咨询：18982151213（刘先生）

四川省成都市武侯区天府五街花漾锦江JR大厦B座7层（总部）

Copyright © 2025 万物纵横版权所有

蜀ICP备2023003916号-1 网站地图技术支持物联网资讯边缘计算热门资讯家具维修培训

试用申请

硬件设备咨询

华北地区负责人：17340067106（毛经理）

华东地区负责人：17358670739（甘经理）

华南、华西地区负责人：19113907060（耿女士）

软件算法咨询

18982151213（刘先生）

在线客服

回到顶部

产品订购

*
*
*
*

点击更换
*