首页> 新闻动态> 行业资讯> RK1828：20TOPS 算力，端侧跑 7B 大模型

RK1828：20TOPS 算力，端侧跑 7B 大模型

作者：万物纵横

发布时间：2026-03-26 13:21

阅读量：

瑞芯微RK1828是专为端侧7B大模型设计的高算力AI协处理器，20TOPS INT8算力+5GB内置高带宽DRAM，可单芯片跑7B模型，端侧推理达50–100+ token/s，延迟低至0.1秒级。

RK1828：20TOPS 算力，端侧跑 7B 大模型(图1)

一、核心硬件规格（专为7B模型优化）

算力：NPU 20TOPS（INT8），支持INT4/INT8/FP16/BF16混合精度

内存：5GB 3D堆叠高带宽DRAM，实测带宽百GB/s级，解决7B模型内存墙

CPU：3×64位RISC-V核心，带FPU与128-bit向量单元

制程：20nm，FCBGA封装（19×19mm）

接口：PCIe 2.1、USB 3.0，可与RK3588等主控协同

二、7B大模型实测性能（官方/第三方）

模型	量化	TTFT（首token）	Decode TPS（生成速度）	对比Orin NX
DeepSeek-R1-Distill-7B	W4A16	159ms	56 TPS	快约3.9倍
Qwen2.5-7B	W4A16	—	约50–80 TPS	—
Qwen2.5-3B	W4A16	85.8ms	87.7–102 TPS	快约3.5倍

三、端侧跑7B的关键优势

1. 单芯片部署：内置5GB DRAM，无需外挂内存，降低功耗与成本

2. 实时交互：7B模型50+ token/s，首token<200ms，接近云端体验

3. 低功耗：端侧离线运行，无网络依赖，数据安全、隐私可控

4. 易集成：兼容RKNN、PyTorch、ONNX，支持OpenAI API，可外挂RK3588升级

RK1828：20TOPS 算力，端侧跑 7B 大模型(图2)

四、典型应用场景

离线智能终端、工业AI盒子、机器人、车载座舱（RK3588M+RK1828）

本地问答、文档摘要、多模态识图、实时语音交互

五、与RK1820的区别（同系列）

RK1828：5GB DRAM，主打7B模型

RK1820：2.5GB DRAM，主打3B模型

家具维修培训

- END -

上一篇：瑞芯微 RK1828 AI 协处理器，百 token/s 极速推理返回列表下一篇：RK1820 vs RK1828 选型指南：精准选更划算，避坑不花冤枉钱

需求留言:

2026-06-24

瑞芯微RK3588 vs 国产竞品晶晨 A311D2 / A311Y3、全志科技 V853 / A733、海思 Hi3559A / Hi3568、地平线 J3全维度对比分析

2026-06-24

瑞芯微RK3588 完整硬件参数 + CPU/GPU/NPU 实测跑分

2026-06-24

瑞芯微RK3588开发板评测参数：6TOPS NPU、8K 解码实测

2026-06-24

云边协同架构升级：边缘AI盒子「本地分析+云端训练」双循环完整方案

2026-06-23

RK1828 核心板相关内容

瑞芯微 RK1828 AI 协处理器，百 token/s 极速推理

2026-03-26

为什么嵌入式开发都选 RK1828 核心板？

2026-03-19

工业级 RK1828 核心板｜多接口、宽温、长生命周期

2026-03-18

热门标签

医疗边缘计算盒子

韬（τ）定律

攀爬检测

高温红外温度传感器

dlib人脸识别算法

智慧工地人员跌倒检测

智能油库厂家

ai算力单位

边缘AI盒子