RK1828 是瑞芯微推出的端侧大模型专用AI协处理器,主打高带宽、低延迟,可在边缘设备本地流畅运行7B参数大模型。
一、核心定位与定位
产品类型:AI协处理器(非独立主控,需搭配RK3588等主控)
核心目标:解决端侧部署3B/7B大模型的内存墙与算力瓶颈
对标:Jetson Orin NX,主打更高带宽、更低功耗、更低成本

二、关键硬件规格
项目 | RK1828 核心参数 |
CPU架构 | 3 × 64位 RISCV 核心(SRV+VRV0+VRV1) |
NPU算力 | 20 TOPS (INT8),支持 INT4/INT8/FP16/BF16 混合精度 |
内存 | 内置5GB 3D堆叠高带宽DRAM,实测带宽 100GB/s+ |
接口 | 双 PCIe 2.0 + USB 3.0,可与RK3588深度协同 |
模型支持 | 最高支持 7B参数 LLM/VLM(如Qwen-7B、LLaMA2-7B) |
推理性能 | 3B模型 100+ tokens/s,7B模型 80+ tokens/s,延迟 <0.1s |
封装 | FCBGA,适合嵌入式与工业场景 |
三、核心技术亮点
1. 3D堆叠内存:内置5GB高带宽DRAM,无需外挂DDR,大幅降低系统复杂度与功耗。
2. RISC‑V异构:专用向量核心(VRV)加速Transformer算子(如Softmax、LayerNorm),独立完成推理,减轻主控负担。
3. PCIe协同:与RK3588等主控通过PCIe直连,可多片堆叠扩展总算力。
4. 软件生态:支持 RKNN3 SDK,兼容PyTorch/TensorFlow/ONNX,提供端到端部署工具链。
四、典型应用场景
端侧大模型:本地AI助手、智能座舱、机器人语义交互
多模态推理:视觉+语言(VLM)、OCR+理解、视频分析
边缘计算:工业质检、安防NVR、智能网关、自动驾驶域控
五、与RK1820的区别
内存:RK1828为 5GB,RK1820为 2.5GB
模型上限:RK1828支持 7B,RK1820更适合 3B及以下
定位:RK1828面向中大型模型,RK1820面向轻量化场景
需求留言: