2026 年,AI 边缘计算进入 “算力下沉、场景细分、国产替代” 的关键期。瑞芯微 RK3588(6TOPS)、算能 BM1684(17.6TOPS)/BM1688(32TOPS)、RK1828(16TOPS)构成国产中端算力盒子的第一梯队,覆盖轻量推理、多路视频分析、端侧大模型三大核心场景。本文从硬件架构、算力实测、模型适配、接口生态、功耗成本、场景落地六大维度,完成 2026 年最全面的横评,帮你精准选型。
一、核心硬件参数:架构决定上限
1. 瑞芯微 RK3588(6TOPS,INT8)

工艺 / CPU:8nm,4×A76@2.4GHz + 4×A55@1.8GHz,八核异构
NPU:三核自研,6TOPS(INT8),支持 INT4/INT8/FP16 混合量化
GPU:Mali-G610 MP4,450GFLOPS,支持 8K 编解码
内存 / 存储:8GB LPDDR4X(最高 32GB),128GB eMMC
典型盒子:万物纵横DA060R、万物纵横DA600、香橙派 5 Plus、飞凌 FCU3501、金亚太 APC3588
2. 瑞芯微 RK1828(16TOPS,INT8)

定位:RK3588 升级款,M.2 算力卡形态,主打高性价比 16TOPS
NPU:四核架构,16TOPS(INT8),兼容 RKNN SDK,支持大模型 INT4 量化
CPU:无内置 CPU,需搭配 RK3588 / 主板使用,功耗仅 8W
典型形态:M.2 2280 算力卡,适配边缘盒子 / 工业主板
3. 算能 BM1684(17.6TOPS,INT8)
工艺 / CPU:12nm,8×A53@2.3GHz,单核性能弱但多核并发强
TPU(NPU):第三代算丰,17.6TOPS(INT8),2.2TOPS(FP32)
视频能力:38 路 1080P 解码,16 路同时 AI 分析,硬编解码拉满
内存 / 存储:12GB LPDDR4X,32GB eMMC
典型盒子:算能 SE5、EC-1684JD4、汉智兴 Coeus-3650T
4. 算能 BM1684X(32TOPS,INT8)
定位:算能旗舰,INT4 可达 64TOPS,对标英伟达 Jetson Orin NX
TPU:BM1684X,32TOPS(INT8)/64TOPS(INT4),支持 Llama3/Qwen2 7B 端侧推理
功耗:≤18W,无风扇被动散热,工业宽温 20℃~+60℃
典型盒子:万物纵横DA320S、算能 IVP03 系列、定制化工业智算盒
核心参数对比表
对比项 | RK3588 | RK1828 | BM1684 | BM1684X |
AI 算力(INT8) | 6TOPS | 16TOPS | 17.6TOPS | 32TOPS |
CPU 架构 | 4A76+4A55 | 无(需外接) | 8A53 | 8A53 |
工艺 | 8nm | 8nm | 12nm | 12nm |
内存 | 8GB(max32GB) | 无 | 12GB | 16GB |
功耗 | 10-15W | 8W | 15W | 18W |
视频解码 | 8K@60fps | 依赖主板 | 38 路 1080P | 16 路 1080P |
二、算力实测:模型推理 “真刀真枪”
1. 目标检测(YOLOv8n/s,1080P)
RK3588:NPU 加速 22-25FPS,CPU 仅 10-15FPS;YOLOv8s 18-20FPS,延迟≤50ms
RK1828:搭配 RK3588,YOLOv8n 45-50FPS,INT4 量化可达 60FPS,延迟≤20ms
BM1684:TPU 加速,YOLOv8n 55-60FPS,16 路并发稳定 30FPS / 路
BM1688:YOLOv8n 80-85FPS,INT4 量化破 100FPS,支持 32 路视频并行分析
2. 端侧大模型(Llama3-7B,INT4 量化)
RK3588:10-15 tokens / 秒,勉强运行,易卡顿
RK1828:30-35 tokens / 秒,流畅对话,支持上下文 16K
BM1684:25-30 tokens / 秒,稳定性优于 RK3588
BM1688:60-65 tokens / 秒,接近云端体验,支持多模态(图文)
3. 图像分类(ResNet18,224×224)
RK3588:244FPS,延迟 4.09ms
RK1828:680FPS,延迟 1.47ms
BM1684:720FPS,延迟 1.39ms
BM1688:1350FPS,延迟 0.74ms
三、模型适配与生态:落地才是硬道理
1. 瑞芯微(RK3588/RK1828)
工具链:RKNN SDK,支持 PyTorch/TensorFlow/Caffe 模型一键转换,量化友好
系统支持:Ubuntu22.04、Android12、Debian,Docker 原生支持
优势:CPU+NPU+GPU 异构协同,多媒体(8K)与 AI 推理兼顾,社区活跃、资料多
短板:大模型支持弱,6TOPS 仅能跑 1B 级模型;RK1828 依赖主板,独立性差
2. 算能(BM1684/BM1688)
工具链:BMNNSDK2,支持主流框架,Docker 化部署,适配工业场景
系统支持:Ubuntu、Debian,无 Android,专注边缘计算
优势:TPU 算力强、视频并发拉满,BM1688 原生支持 7B 大模型,INT4 量化效率高
短板:CPU 性能弱(A53),多媒体能力不如 RK3588;社区资料较少,上手门槛高
四、接口与扩展性:工业场景 “刚需”
1. RK3588 盒子
接口:双千兆网口、USB3.0×2、HDMI2.1(8K 输出)、MIPI-CSI×2、GPIO×33、RS485
扩展:支持 4G/5G、WiFi6、M.2 固态、POE 供电,适配机器人 / 工业视觉
2. RK1828 算力卡
接口:M.2 2280,PCIe3.0×4,仅算力输出,无外设接口
3. BM1684 盒子
接口:双千兆网口、USB3.0×2、HDMI、RS485/RS232、GPIO、SATA
扩展:无风扇设计,-20℃~+60℃宽温,IP40 防护,适配户外 / 工业现场
4. BM1688 盒子
接口:同 BM1684,增加PCIe 扩展,支持多卡并联(最高 4 卡,128TOPS)
五、功耗与成本:2026 年性价比之王
1. 功耗(空载 / 满载)
RK3588:5W/12W,被动散热即可,静音无风扇
RK1828:3W/8W,低功耗,适合嵌入式场景
BM1684:8W/15W,无风扇,工业级稳定性
BM1688:10W/18W,被动散热,功耗可控
2. 2026 年市场价格(整机)
RK3588 盒子:600-1200 元,香橙派 5 Max + 约 600 元,工业款 1000 元 +
RK1828 算力卡:400-600 元,搭配 RK3588 主板,总成本 1000 元内
BM1684 盒子:1500-2500 元,工业款 2000 元 +
BM1688 盒子:3000-5000 元,旗舰定位,对标 Jetson Orin NX(6000 元 +)
性价比总结
轻量场景(≤8 路视频 / 小模型):RK3588最优,600 元级,兼顾 AI 与多媒体
中量场景(8-16 路视频 / 7B 大模型):RK1828+RK3588 组合,1000 元内,16TOPS,性价比拉满
重度场景(≥16 路视频 / 高帧率检测):BM1684,2000 元级,17.6TOPS,视频并发无敌
旗舰场景(端侧大模型 / 多模态):BM1688,3000 元级,32TOPS,国产大模型首选
六、场景落地选型指南
1. 智能安防(8-16 路视频检测)
首选:BM1684,17.6TOPS,16 路并发稳定,无风扇工业设计
备选:RK1828+RK3588,成本低,社区支持好
2. 端侧大模型(本地对话 / 多模态)
首选:BM1688,32TOPS,Llama3-7B 60tokens / 秒,INT4 量化优化
备选:RK1828,30tokens / 秒,基础对话足够
3. 工业视觉(缺陷检测 / 产品分拣)
首选:RK3588,8K 编解码 + NPU 加速,延迟低,接口丰富,适配工业相机
备选:BM1684,高并发,适合流水线多工位检测
4. 机器人(环境感知 / 语音交互)
首选:RK3588,CPU+NPU+GPU 异构,支持多摄像头 + 语音模块,功耗低续航长
结语:国产算力,未来可期
2026 年,瑞芯微与算能形成差异化竞争:瑞芯微胜在 “全能”,RK3588 兼顾 AI、多媒体、低功耗,适合消费级与通用工业场景;算能胜在 “专精”,BM1684/BM1688 聚焦高算力、高并发,适合重度 AI 推理与端侧大模型场景。
随着国产算力生态持续完善,2026 年底RK1828 价格下探至 300 元、BM1688 优化大模型推理,国产算力盒子将全面替代进口,成为边缘 AI 的主流选择。
需求留言: