瑞芯微RK1828算力卡,以协处理器架构为核心,依托RKNN3 SDK全栈软件能力,成为端侧7B级大模型、多模态VLM与视觉推理的高性价比国产化算力方案,可通过PCIe/USB高速接口与RK3588/RK3576等主控无缝协同,满足工业、车载、边缘终端的低时延、高隐私AI部署需求。

一、核心定位:专用AI算力协处理器
RK1828算力卡并非通用主控,而是专注AI推理加速的协处理器,承担LLM、VLM、CNN模型的高密度计算,主控负责调度与控制,分工明确、效率最大化。硬件采用高带宽DRAM合封,NPU频率1GHz,为大模型提供稳定算力支撑。
二、RKNN3 SDK全栈能力(V1.0.0)
工具链:RKNN3 Toolkit(PC端)、RKNN3 Runtime(板端)、Model Zoo预置模型
运行模式:协处理器模式,PCIe/USB低延迟高带宽通信
系统支持:Android/Linux
关键升级:LLM Decode性能提升超15%,支持mRoPE、Function Call、YUV输入、数据传输与推理并行、多核多模型并发、自定义后处理。
三、实测性能:7B模型端侧流畅运行
LLM核心性能(Input/New Tokens=128)
模型 | 加速芯片 | TTFT(ms) | TPOT(ms) | Decode TPS |
Qwen2.5-7B | RK1828 | 158.06 | 14.23 | 70.26 |
Qwen3-8B | RK1828 | 177.87 | 16.36 | 61.11 |
Qwen3-4B | RK1828 | 106.70 | 11.42 | 87.56 |
VLM与CNN性能
多模态:Qwen2.5-VL-7B、Qwen3-VL-4B、MiMo-VL-7B-RL全流程在卡完成
视觉检测:YOLOv5s/v6s/v8s单核30+fps,多核200+fps
分类网络:MobileNetV1单核384.97fps,多核1505fps。
四、模型生态与精度
支持通义千问、腾讯混元、智谱GLM、FastVLM、InternVL、YOLO系列等数十种主流模型,提供预转换RKNN模型下载。W4A16/G32量化下,LLM与VLM精度接近原生float32;CNN模型W8A8量化Top-1/Top-5损失极小,满足工业级部署标准。
五、场景价值
工业边缘:产线质检、异常检测、视频分析,本地推理无网络依赖
智能座舱:语音交互、DMS/OMS、多屏感知,低时延高安全
安防交通:实时目标识别、行为分析、多路视频结构化
智能终端:本地AI助手、多模态交互,隐私数据不出设备
RK1828算力卡以硬件强、软件全、生态广、成本优,成为国产化端侧AI算力升级的首选方案。
需求留言: