首页> 新闻动态> 行业资讯> 破局内存与能耗壁垒，瑞芯微 RK182X 以 3D 堆叠技术开启端侧 AI 新世代

破局内存与能耗壁垒，瑞芯微 RK182X 以 3D 堆叠技术开启端侧 AI 新世代

作者：万物纵横

发布时间：2026-06-16 10:08

阅读量：

当下，AIoT 产业正式迈入 2.0 发展阶段，智能硬件不再局限于简单的设备连接与指令控制，而是向着听懂、看懂、思考的全自主智能形态演进。端侧大模型的普及成为行业核心趋势，但传统芯片普遍遭遇 “内存墙” 与 “能耗墙” 两大瓶颈，Transformer 架构下的大模型对带宽、功耗提出严苛要求，不少终端设备出现推理卡顿、发热降频、模型无法流畅运行等问题，严重制约 AIoT 2.0 落地。

破局内存与能耗壁垒，瑞芯微 RK182X 以 3D 堆叠技术开启端侧 AI 新世代(图1)

作为国内领先的芯片设计企业，瑞芯微电子重磅推出RK182X 系列端侧 AI 协处理器，凭借全球首创的 3D 堆叠架构，彻底打破传统 SoC 的物理局限，为端侧大模型部署提供标杆级硬件方案。不同于传统芯片 PCB 长走线、引脚受限的封装模式，RK182X 将 DRAM 晶圆与 NPU 逻辑晶圆通过微米级 TSV / 混合键合技术垂直堆叠，构建数万个高速数据通道，等效带宽跃升至数百 GB/s，相比传统 LPDDR4/5 带宽实现量级提升，完美适配 3B 及以上参数大模型的带宽需求。

在功耗与能效层面，3D 堆叠架构大幅缩短数据传输距离，让访存功耗较传统 SoC 降低一个数量级。实测数据显示，RK182X 运行 Qwen2.5-3B 模型时，推理速度可达 100.15 TPS，是主流同类产品的近 3 倍；能量效率达到 9.02 TPS/W，能效比领先竞品 6 倍，在同等电池容量下可实现更长时长的 AI 运算，完美适配移动终端、离线设备等低功耗场景。

硬件配置上，RK182X 内置 2.5GB、5GB 两种规格 3D DRAM，无需额外外挂 DDR 内存，简化硬件布板设计、大幅降低整机 BOM 成本。芯片原生硬件加速 Transformer 与 Attention 核心算子，全面支持 W4A16 低比特量化、FP16 激活参数及分组量化技术，5GB 版本可稳定运行 8B 参数大模型，量化后依旧保持超高模型精度。在精度实测中，搭载 RK182X 运行 Qwen3-4B、YOLOv8s 等主流模型，RKNN3 方案精度与原始模型偏差极小，兼顾轻量化部署与 AI 效果。

从技术革新到场景落地，RK182X 以架构创新重构端侧 AI 算力标准，攻克长期困扰行业的带宽、功耗、性能三大难题，成为 AIoT 2.0 时代端侧大模型落地的核心算力底座，助力智能硬件真正实现本地深度智能。

家具美容培训

家具维修培训

- END -