一、SoC 基础硬件规格(官方 datasheet 标准)
1. 工艺与基础架构
制程:8nm FinFET
架构:DynamIQ 八核大小核,统一 L3 缓存
标准主频:4×A76@2.4GHz(大核)+ 4×A55@1.8GHz(小核)
工业版 RK3588J 降频:A76@1.6GHz / A55@1.3GHz
功耗:整机满载 AI + 视频约 6~8.5W,无风扇可散热
2. CPU 详细参数
核心:4×Cortex-A76 + 4×Cortex-A55 64 位 ARMv8.2
缓存:
A76:512KB L2 / 核
A55:128KB L2 / 核
共享统一 L3:3MB
指令集:NEON、FP16、CRC32,支持硬件虚拟化
调度:大小核自动切换,多任务并行编译、容器、视频前处理
3. GPU Mali-G610 MP4(四核 Valhall 架构)
算力:450 GFLOPS FP32
图形 API:OpenGL ES3.2、Vulkan1.2、OpenCL 2.2
内置 2D 硬件 RGA 加速:图像缩放、色彩转换、抠图
支持 8K UI 渲染、多屏异显、硬件图层合成
4. NPU 自研三核 AI 加速器(核心亮点)
峰值算力:
INT8:6 TOPS(总,单核心 2TOPS)
INT16:3 TOPS
FP16/BF16:1.5 TOPS
TF32/INT4 全精度支持
架构:3 独立 NPU 核心,可单 / 双 / 三核并行推理
片上缓存:每核 384KB,总 1.15MB 本地缓存
算子支持:200 + 算子,原生支持 Transformer、CNN、YOLO、LLM 大模型
工具链:RKNN-Toolkit2,支持 PyTorch/TensorFlow/Caffe 模型量化转换
5. VPU 8K 视频编解码
解码:8K@60fps H.265/VP9/AVS2;8K@30fps H.264;4K@60fps AV1
编码:8K@30fps H.264/H.265
多路 4K 并发:最多 4 路 4K30 同时解码
6. ISP 图像处理单元
48MP 单通道 ISP,支持 HDR、3DNR、WDR、鱼眼矫正
最多接入 6 路 MIPI CSI 摄像头,多路同步采集
7. 内存 / 存储
内存:LPDDR4X / LPDDR5,最大32GB
存储:eMMC 5.1、UFS 2.1、SD3.0、SATA3.0、NVMe(PCIe3.0×2)
8. 高速外设接口
显示:HDMI2.1(8K60)、DP1.4、4 路 MIPI DSI(4K)
网络:2× 千兆 GMAC 以太网
高速总线:PCIe3.0 x2、USB3.1 Gen2×2、Type-C DP Alt Mode
低速:I2C/SPI/UART/CAN/ADC/PWM 等工业 IO
二、CPU 跑分实测(主流开发板 8GB LPDDR4X)
1. Geekbench 5(Linux/Android 通用)
单核:420~445 分
多核:1850~1980 分
定位:接近骁龙 855 单核性能,多核约骁龙 865 60% 水平
2. CoreMark 嵌入式整数跑分
RK3588 八核全开:83860
对比 RK3568(4×A55):29380,CPU 性能≈3 倍提升


3. 安兔兔 V10(Android 系统)
综合总分:60 万~64 万分
CPU 分项:22 万左右,对标天玑 1000+、骁龙 855
三、GPU 图形跑分(Mali-G610 MP4)
1. Glmark2 ES3.2(嵌入式标准)
RK3588 得分:2320
RK3568(G52 MP2):568,GPU 性能≈4 倍提升


2. 3DMark Wild Life(Android)
1080P 标准场景:3100~3400 分
游戏能力:流畅运行 720P 手游,轻度 3D 无压力
四、NPU AI 推理实测跑分(INT8 量化,RKNN Toolkit2)
1. 经典图像分类
ResNet18 640×640:244 FPS,单帧延迟 4.09ms
MobileNetV2 320×320:480+ FPS
2. YOLO 目标检测(640×640)
模型 | 运行模式 | FPS | 说明 |
YOLOv5s INT8 | NPU 三核全开 | 54 FPS | 工业标准实时检测 |
YOLOv8s INT8 | NPU 三核 | 42 FPS | 含后处理端到端 |
YOLOv8-n 轻量化 | 三核异步流水线 | 111 FPS | 无人机 / 低延迟场景 |
YOLOv8n 单核 NPU | 单核串行 | 12.5 FPS | 单任务独占模式 |
3. 端侧大模型 LLM(INT4/INT8 量化)
TinyLlama-1.1B INT4:12~15 tokens/s
Qwen2-7B INT4:18~22 tokens/s(8GB 内存)
7B 大模型可流畅对话、OCR、文档摘要
4. 多任务并行(三核 NPU 优势)
三核独立调度可同时跑:
1 核 YOLOv8 检测 + 1 核人体姿态识别 + 1 核 Whisper 语音识别,互不抢占算力
五、同系列对比速览(RK3568 / RK3588)
参数 | RK3568 | RK3588 |
CPU | 4×A55@2.0G | 4A76+4A55 |
NPU 算力 | 1TOPS INT8 | 6TOPS INT8 |
CoreMark | 29380 | 83860 |
Glmark2 | 568 | 2320 |
YOLOv5s FPS | 14~16 | 54+ |
最大内存 | 16GB LPDDR4X | 32GB LPDDR5 |
六、补充说明
1. 跑分浮动来源:内存规格(4/8/16GB)、散热、系统调频、RKNN 版本、模型预处理是否硬件 RGA 加速;
2. NPU 6TOPS 为峰值 INT8 算力,FP16 推理速度减半;
需求留言: