RK1820/RK1828 同属RK182X 3D 堆叠 AI 协处理器,不能独立做主控,仅通过 M.2 PCIe/USB3.0 挂载 RK3588/RK3576 等主控做 AI 推理加速;二者CPU、NPU、接口、带宽、精度、功耗、工艺完全一致,唯一核心差距只有片上 3D 堆叠 DRAM 容量,由此衍生模型、并发、多模态能力差异。
一、核心参数对比表
对比项 | RK1820(入门款) | RK1828(旗舰款) | 差距影响 |
INT8 峰值 NPU 算力 | 20 TOPS | 20 TOPS | 纯单路轻模型极限速度理论相同 |
片上堆叠 DRAM | 2.5GB | 5GB | RK1828 内存翻倍,是所有差异根源 |
内存带宽 | 1TB/s | 1TB/s | 带宽无区别,仅容量翻倍 |
原生支持最大 LLM | 3B 参数(Qwen2.5-3B、Llama3-3B) | 7B~8B 参数(Qwen3-7B、Llama3-8B 量化版) | RK1820 跑 7B 会频繁交换内存、掉速、卡顿 |
多模态 VLM 承载 | 单路小图 + 3B 语言,上下文≤8K | 多路 4K 图像 + 7B 图文大模型,16K 长上下文 | 多模态图文理解、数字人强依赖大内存 |
多路视频并发 | ≤2 路 1080P 视觉推理 | ≥4 路 1080P / 单路 4K 视频流并发 | 多路安防、工业多相机必选 1828 |
典型 Token 速度 | 3B 模型:100~180 token/s | 7B 模型:60~120 token/s | 同参数量模型下两者速度一致 |
成本定位 | 低成本、消费轻量化 | 中高端、行业复杂场景 | RK1820 模组便宜 30% 左右 |
典型功耗 | ≈5W | ≈5W | 功耗无差异,散热方案通用 |
底层核心差距拆解
1. 内存墙是唯一分水岭
RK182X 采用 3D 垂直堆叠 DRAM,模型权重、KV 缓存、图像特征全部放在片内高速内存,不占用主控内存;
RK1820 2.5GB:刚好放下 3B 量化模型 + 少量图像缓存,多任务 / 大图直接爆内存;
RK1828 5GB:可完整容纳 7B 量化大模型 + 多路视频特征缓存,KV 长上下文不溢出,无 PCIe 频繁搬运延迟。
2. 算力架构无任何阉割
3 颗 64 位 RISC-V 控制核、2×4 Mesh NPU、INT4/FP8/BF16 全精度、JPEG 编解码、PCIe2.0/USB3.0 硬件完全相同;
只要模型≤3B,两者推理帧率、延迟几乎无差别;差距只在能装多大模型、能同时跑多少路。
3. 多模态场景差距最明显
VLM 图文大模型同时存储图像编码器 + LLM 权重,内存占用翻倍:
RK1820 跑 VLM 只能单张小图 + 3B 轻量语言;
RK1828 可 4K 大图 + 7B 图文一体,支持本地识图问答、数字人实时对话、路侧多目标感知。
二、分场景选型标准(直接对照选用)
选 RK1820(2.5GB)的 4 类场景
满足以下任意一条即可选,极致控成本:
1. 仅轻量化 3B 及以下 LLM:本地离线语音助手、小型终端问答、轻量化知识库,无图文多模态;
2. 单路视觉任务:单目工业缺陷检测、家用单路摄像头、AR 眼镜单帧识别,仅 YOLO/CNN 传统视觉;
3. 预算敏感消费终端:百元级智能硬件、小型离线语音盒、便携低功耗设备;
4. 纯辅助算力扩展:RK3588 主控本身跑基础视觉,RK1820 仅分担少量轻量推理。
限制:不支持 7B 大模型、无法多路 4K 并发、长文本多轮对话容易卡顿。
选 RK1828(5GB)的 5 类刚需场景
只要满足任意一条,必须上 1828,否则性能大幅缩水:
1. 本地部署 7B/8B 大语言模型:离线行业大模型、本地数字人、长文档 16K 上下文问答;
2. 多模态 VLM 图文一体推理:识图问答、视频内容理解、OCR + 大模型解析、机器人视觉语言交互;
3. 多路视频并发分析:≥4 路 1080P 安防 NVR、多路工业相机、车载多目环视、路侧感知设备;
4. 4K 高分辨率图像推理:医疗影像、高精度工业视觉、航拍大图识别;
5. 高并发多轮对话:7×24 小时无人值守客服、导览机器人、多用户同时交互终端。
三、快速选型决策流程图
1. 先确认模型参数量
模型≤3B、单路视觉 → RK1820
模型≥7B / 图文 VLM → RK1828
2. 再看视频并发路数
1~2 路 1080P 以内 → RK1820
4 路及以上 / 4K 单路 → RK1828
3. 最后看成本预算
大批量消费终端、成本优先 → RK1820
工业 / 车载 / 安防高端设备、稳定性优先 → RK1828
四、常见踩坑提醒
1. 不要误以为 “算力一样就能跑 7B”:RK1820 强行加载 7B 模型会持续占用 PCIe 交换权重,延迟翻倍、帧率暴跌,甚至内存溢出崩溃;
2. 多卡叠加场景:多路 7B 多模态设备,直接多片 RK1828,不要用多片 RK1820 凑内存;
3. 3B 模型多路并发:如果同时 3 路以上 3B 图文推理,即便模型小,也建议 RK1828,KV 缓存叠加会占满 2.5GB 内存。
需求留言: