硬件产品咨询:19113907060(耿女士)
软件算法咨询:18982151213(刘先生)
联系我们
产品咨询

Qwen3系列模型实测拉满 万物纵横DA600/DA600J大模型一体机性能超亮眼

作者:万物纵横
发布时间:2026-03-23 09:27
阅读量:

边缘端大模型运行性能再迎高光时刻!万物纵横DA600大模型一体机公布截至2026年1月的官方实测数据,针对Qwen3系列全品类模型的运行表现全面拉满,从轻量化0.6B模型到百亿参数30B模型,从纯文本LLM到多模态VLM,均展现出超高推理效率、超低延迟的亮眼性能,用硬核数据印证了其在边缘计算大模型部署领域的领先实力,且官方明确表示性能仍在持续优化,未来边缘端大模型运行体验将再升级。


Qwen3系列模型实测拉满 万物纵横DA600/DA600J大模型一体机性能超亮眼(图1)


此次实测基于DA600“通用主控+专用M.2协处理器”的强劲算力组合,针对Qwen3系列纯文本大模型、多模态大模型两大品类展开全维度测试,覆盖不同参数规模、不同输入输出tokens、不同视觉分辨率等多个维度,测试结果全方位适配企业实际应用中的多样化需求,为各行业大模型边缘私有化部署提供了可靠的性能参考。


在Qwen3系列纯文本大模型实测中,DA600展现出极致的低延迟与高解码速度,完美匹配实时对话、文本总结、智能问答等高频场景。针对轻量化的Qwen3-0.6B模型,在128Input Tokens+128New Tokens的测试条件下,首字延迟TTFT仅27.53ms,单token输出耗时TPOT5.58ms,解码速度Decode TPS达179.33tokens/s,实现毫秒级响应,媲美云端推理体验;即使是8B参数的Qwen3-8B模型,同等输入输出条件下,TTFT也仅177.87ms,TPOT16.36ms,Decode TPS保持61.11tokens/s,文本生成流畅无卡顿,完全满足中大型模型的实时推理需求。从0.6B到8B参数梯度,DA600均能实现稳定高效运行,算力调度与模型适配的协同性拉满。


多模态推理作为边缘AI的核心需求,DA600在Qwen3系列多模态VLM模型的实测中同样表现惊艳,视觉处理+文本推理双流畅,打破边缘端多模态大模型运行的性能瓶颈。Qwen3-VL-2B模型在384×384视觉分辨率下,视觉处理耗时仅155.33ms,LLM首字延迟53.39ms,解码速度142.37tokens/s,轻量级多模态模型实现超高速推理;针对4B参数的Qwen3-VL-4B,同款视觉分辨率下视觉处理158.89ms,LLM解码速度仍达89.69tokens/s,兼顾视觉解析精度与文本生成效率。


而在大上下文窗口的核心测试中,Qwen3-VL 4B 32K版本的表现更是刷新边缘端多模态推理认知,该模型支持32K超大上下文窗口,在256tokens输入+256tokens输出的基础测试中,视觉处理仅68.95ms,预填充时间90.48ms,预填充速度高达2833.84tokens/s;即使输入tokens提升至24K,视觉处理耗时仍稳定在68.97ms,预填充速度保持2833.4tokens/s,仅单token输出耗时小幅提升,展现出超强的大上下文数据处理能力,完美适配长文本+多图像的复杂多模态推理场景。


Qwen3系列模型实测拉满 万物纵横DA600/DA600J大模型一体机性能超亮眼(图2)


针对企业级核心需求的百亿参数大模型,DA600搭载DA600-HM50协处理器后,对Qwen3 30B A3B 32K模型的实测表现同样超出预期,实现了百亿参数模型在边缘端的高效本地化运行。在256tokens输入输出的测试条件下,首字延迟TTFT仅338.49ms,预填充速度807.93tokens/s,单token输出耗时41.78ms,解码速度23.93tokens/s;即便输入tokens扩展至24K,该模型仍能稳定运行,解码速度保持13.57tokens/s,成功打破“百亿参数大模型仅能云端部署”的行业桎梏,为中大型企业的复杂AI任务提供了边缘端解决方案。


除了核心性能指标,DA600在Qwen3系列模型运行中的资源利用率与稳定性同样表现优异。实测中,Qwen3-VL 4B 32K模型运行时设备内存占用仅7598MB,Qwen3 30B A3B 32K模型内存占用22774MB,均实现算力与内存的高效调度,无资源冗余浪费;同时,全系列模型测试过程中,DA600的CPU、NPU及协处理器算力协同稳定,无卡顿、掉帧等情况,契合工业级7×24小时稳定运行的需求。


DA600对Qwen3系列模型的实测高光表现,背后是其硬核的硬件架构与深度的模型适配能力。基于RK3588/RK3588J芯片的八核架构+6TOPS基础NPU算力,搭配20/60/160TOPS梯度化M.2协处理器,形成“基础算力+专用算力”的黄金组合;同时针对Transformer架构做了深度优化,实现与Qwen3系列模型的同源适配,无需二次开发即可高效运行,再加上独立的散热与供电设计,为算力稳定输出提供了坚实保障。


此次Qwen3系列模型的实测数据,不仅是DA600大模型一体机性能的硬核印证,更标志着边缘计算领域已实现从轻量化到百亿参数大模型、从纯文本到多模态推理的全品类高效部署,为智能会议、工业质检、轻量安防、智慧交通等各行业的大模型边缘落地,提供了可落地、可参考的高性能解决方案,推动边缘AI应用迈入全场景、高算力的新阶。

- END -
分享:
留言 留言 试用申请
产品咨询 产品咨询 硬件产品咨询
19113907060(耿女士)
技术咨询 技术咨询 软件算法咨询
18982151213(刘先生)
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *