产品咨询:19113907060
联系我们
产品咨询
资讯内容banner 咨询banner-移动

BM1684X芯片详细参数及不同负载下的功耗表现

作者:万物纵横
发布时间:2025-07-22 10:41
阅读量:

BM1684X 是算能面向深度学习领域推出的第四代张量处理器。以下是其详细参数:


BM1684X芯片详细参数及不同负载下的功耗表现(图1)


工艺制程:12nm。


CPU:集成高性能八核 ARM Cortex-A53,最高主频 2.3GHz。


算力:内置张量计算模块 TPU,INT8 算力高达 32TOPS,FP16/BF16 算力为 16TFLOPS,FP32 高精度算力为 2TFLOPS。


编解码能力:最高支持 32 路 H.265/H.264 1080p@25fps 视频解码,12 路 H.265/H.264 1080p@25fps 视频编码,还可同时进行 32 路 1080P@25fps 高清视频全流程处理,即解码 + AI 分析。


支持框架:支持 TensorFlow、Caffe、PyTorch、Paddle、ONNX、MXNet、Tengine、DarkNet 等主流编程框架。


接口:拥有 PCIe3.0、GMAC、SDIO3.0、I2C、PWM、UART、GPIO 接口。


BM1684X 芯片的功耗表现与其负载状态密切相关,具体可分为以下场景:


一、空载与待机状态


在未加载任务或设备处于待机模式时,BM1684X 的功耗极低。例如,基于该芯片的算能 AirBox 设备在默认插电但未连接外部设备时,功耗可降至0 瓦。这得益于芯片内置的深度睡眠模式和电源管理机制,能够动态关闭非必要模块以降低能耗。


二、轻负载场景


轻负载通常指芯片仅处理基础系统任务或低强度推理。例如:


系统启动后:设备默认运行状态下(如后台服务、网络连接),功耗约为20 瓦。此时芯片的 CPU 和 TPU 模块处于低频率运行状态,主要维持系统基本功能。


轻量级 AI 任务:在运行轻量级模型(如边缘端图像分类)时,功耗可控制在15 瓦以下。例如,在特定工业视觉方案中,BM1684X 结合 FPGA 实现 AI 推理,能效比提升 20 倍,整体功耗低于 15 瓦。


三、中等负载场景


中等负载对应典型工作状态,例如:


常规视频处理:当处理多路视频解码(如 16 路 1080P@25fps H.265)或基础 AI 分析时,芯片功耗约为16 瓦。这一数值被官方定义为 “典型功耗”,反映了芯片在平衡性能与能效时的表现。


通用模型推理:运行中等规模模型(如 ResNet-50)时,功耗通常维持在 16-20 瓦之间,具体取决于输入数据量和模型复杂度。


四、高负载场景


高负载对应芯片满负荷运行,例如:


高强度推理:当执行密集型 AI 任务(如 32 路 1080P 视频实时分析 + 大模型推理)时,功耗可飙升至33 瓦。此时芯片的 TPU 模块以最高频率(如 950MHz)运行,INT8 算力达到 32TOPS 的峰值性能。


多任务并发:若同时进行视频解码、编码和复杂推理(如目标检测 + 语义分割),功耗可能接近设备级的最大功耗(如 43.2 瓦),但需注意这一数值包含其他组件(如内存、接口)的能耗。


五、动态功耗管理


BM1684X 支持 ** 动态电压频率调整(DVFS)和智能负载分配技术:


频率调节:TPU 模块可根据任务需求在 75MHz 至 950MHz 之间动态调整频率。例如,运行 4B 参数的 Qwen3 模型时,SOC 模式下主频为 950MHz,推理速度达 16.4 tokens/s,而低负载时可降至基础频率以节省功耗。


任务优先级调度:芯片会优先分配算力给高优先级任务(如实时视频分析),并在任务间隙自动降低非关键模块的功耗,从而实现能效优化。


六、应用场景差异


不同行业应用对功耗的需求不同:


边缘计算:在智慧农业或安防监控中,BM1684X 常以轻负载运行,功耗通常低于 20 瓦,同时满足实时响应需求。


大模型部署:当运行 32B 参数的 Qwen3 模型时,需两颗 BM1684X 协同工作,单芯片功耗约为 25-30 瓦,推理速度达 5 tokens/s。


工业视觉:在生产线质检场景中,芯片结合硬件加速模块处理高分辨率图像,功耗约 15-20 瓦,同时实现毫秒级延迟。


总结


BM1684X 的功耗表现呈现显著的负载依赖性:


能效比优势:在轻负载下能效比突出(如 < 15 瓦实现高效推理),而高负载时通过峰值性能满足密集计算需求。


动态调节能力:通过 DVFS 和任务调度,芯片可在 0-33 瓦范围内灵活调整功耗,适配从待机到高强度计算的全场景需求。


设备级参考:实际应用中需结合具体方案评估整体功耗,例如 AirBox 设备在推理时的 33 瓦包含内存和接口能耗,而芯片本身的贡献约占 70%-80%。


如需更精确的数据,建议参考算能官方提供的《BM1684X 技术白皮书》或通过bm-smi工具实时监控芯片的 TPU 利用率和功耗状态。

- END -
分享:
留言 留言 留言咨询
电话咨询 电话咨询 电话联系
19113907060
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *