华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
软件算法咨询:18982151213(刘先生)

联系我们
产品咨询

瑞芯微RK1828算力卡|端侧7B大模型国产化AI加速新标杆

作者:万物纵横
发布时间:2026-04-03 09:56
阅读量:

瑞芯微RK1828算力卡,以协处理器架构为核心,依托RKNN3 SDK全栈软件能力,成为端侧7B级大模型、多模态VLM与视觉推理的高性价比国产化算力方案,可通过PCIe/USB高速接口与RK3588/RK3576等主控无缝协同,满足工业、车载、边缘终端的低时延、高隐私AI部署需求。


瑞芯微RK1828算力卡|端侧7B大模型国产化AI加速新标杆(图1)


一、核心定位:专用AI算力协处理器


RK1828算力卡并非通用主控,而是专注AI推理加速的协处理器,承担LLM、VLM、CNN模型的高密度计算,主控负责调度与控制,分工明确、效率最大化。硬件采用高带宽DRAM合封,NPU频率1GHz,为大模型提供稳定算力支撑。


二、RKNN3 SDK全栈能力(V1.0.0)


工具链:RKNN3 Toolkit(PC端)、RKNN3 Runtime(板端)、Model Zoo预置模型


运行模式:协处理器模式,PCIe/USB低延迟高带宽通信


系统支持:Android/Linux


关键升级:LLM Decode性能提升超15%,支持mRoPE、Function Call、YUV输入、数据传输与推理并行、多核多模型并发、自定义后处理。


三、实测性能:7B模型端侧流畅运行


LLM核心性能(Input/New Tokens=128)


模型

加速芯片

TTFT(ms)

TPOT(ms)

Decode TPS

Qwen2.5-7B

RK1828

158.06

14.23

70.26

Qwen3-8B

RK1828

177.87

16.36

61.11

Qwen3-4B

RK1828

106.70

11.42

87.56


VLM与CNN性能


多模态:Qwen2.5-VL-7B、Qwen3-VL-4B、MiMo-VL-7B-RL全流程在卡完成


视觉检测:YOLOv5s/v6s/v8s单核30+fps,多核200+fps


分类网络:MobileNetV1单核384.97fps,多核1505fps。


四、模型生态与精度


支持通义千问、腾讯混元、智谱GLM、FastVLM、InternVL、YOLO系列等数十种主流模型,提供预转换RKNN模型下载。W4A16/G32量化下,LLM与VLM精度接近原生float32;CNN模型W8A8量化Top-1/Top-5损失极小,满足工业级部署标准。


五、场景价值


工业边缘:产线质检、异常检测、视频分析,本地推理无网络依赖


智能座舱:语音交互、DMS/OMS、多屏感知,低时延高安全


安防交通:实时目标识别、行为分析、多路视频结构化


智能终端:本地AI助手、多模态交互,隐私数据不出设备


RK1828算力卡以硬件强、软件全、生态广、成本优,成为国产化端侧AI算力升级的首选方案。

- END -
分享:
留言 留言 试用申请
产品咨询 产品咨询 硬件设备咨询
华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
技术咨询 技术咨询 软件算法咨询
18982151213(刘先生)
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *