首页> 新闻动态> 行业资讯> Qwen3系列模型实测拉满万物纵横DA600/DA600J大模型一体机性能超亮眼

Qwen3系列模型实测拉满万物纵横DA600/DA600J大模型一体机性能超亮眼

作者：万物纵横

发布时间：2026-03-23 09:27

阅读量：

边缘端大模型运行性能再迎高光时刻！万物纵横DA600大模型一体机公布截至2026年1月的官方实测数据，针对Qwen3系列全品类模型的运行表现全面拉满，从轻量化0.6B模型到百亿参数30B模型，从纯文本LLM到多模态VLM，均展现出超高推理效率、超低延迟的亮眼性能，用硬核数据印证了其在边缘计算大模型部署领域的领先实力，且官方明确表示性能仍在持续优化，未来边缘端大模型运行体验将再升级。

Qwen3系列模型实测拉满万物纵横DA600/DA600J大模型一体机性能超亮眼(图1)

此次实测基于DA600“通用主控+专用M.2协处理器”的强劲算力组合，针对Qwen3系列纯文本大模型、多模态大模型两大品类展开全维度测试，覆盖不同参数规模、不同输入输出tokens、不同视觉分辨率等多个维度，测试结果全方位适配企业实际应用中的多样化需求，为各行业大模型边缘私有化部署提供了可靠的性能参考。

在Qwen3系列纯文本大模型实测中，DA600展现出极致的低延迟与高解码速度，完美匹配实时对话、文本总结、智能问答等高频场景。针对轻量化的Qwen3-0.6B模型，在128Input Tokens+128New Tokens的测试条件下，首字延迟TTFT仅27.53ms，单token输出耗时TPOT5.58ms，解码速度Decode TPS达179.33tokens/s，实现毫秒级响应，媲美云端推理体验；即使是8B参数的Qwen3-8B模型，同等输入输出条件下，TTFT也仅177.87ms，TPOT16.36ms，Decode TPS保持61.11tokens/s，文本生成流畅无卡顿，完全满足中大型模型的实时推理需求。从0.6B到8B参数梯度，DA600均能实现稳定高效运行，算力调度与模型适配的协同性拉满。

多模态推理作为边缘AI的核心需求，DA600在Qwen3系列多模态VLM模型的实测中同样表现惊艳，视觉处理+文本推理双流畅，打破边缘端多模态大模型运行的性能瓶颈。Qwen3-VL-2B模型在384×384视觉分辨率下，视觉处理耗时仅155.33ms，LLM首字延迟53.39ms，解码速度142.37tokens/s，轻量级多模态模型实现超高速推理；针对4B参数的Qwen3-VL-4B，同款视觉分辨率下视觉处理158.89ms，LLM解码速度仍达89.69tokens/s，兼顾视觉解析精度与文本生成效率。

而在大上下文窗口的核心测试中，Qwen3-VL 4B 32K版本的表现更是刷新边缘端多模态推理认知，该模型支持32K超大上下文窗口，在256tokens输入+256tokens输出的基础测试中，视觉处理仅68.95ms，预填充时间90.48ms，预填充速度高达2833.84tokens/s；即使输入tokens提升至24K，视觉处理耗时仍稳定在68.97ms，预填充速度保持2833.4tokens/s，仅单token输出耗时小幅提升，展现出超强的大上下文数据处理能力，完美适配长文本+多图像的复杂多模态推理场景。

Qwen3系列模型实测拉满万物纵横DA600/DA600J大模型一体机性能超亮眼(图2)

针对企业级核心需求的百亿参数大模型，DA600搭载DA600-HM50协处理器后，对Qwen3 30B A3B 32K模型的实测表现同样超出预期，实现了百亿参数模型在边缘端的高效本地化运行。在256tokens输入输出的测试条件下，首字延迟TTFT仅338.49ms，预填充速度807.93tokens/s，单token输出耗时41.78ms，解码速度23.93tokens/s；即便输入tokens扩展至24K，该模型仍能稳定运行，解码速度保持13.57tokens/s，成功打破“百亿参数大模型仅能云端部署”的行业桎梏，为中大型企业的复杂AI任务提供了边缘端解决方案。

除了核心性能指标，DA600在Qwen3系列模型运行中的资源利用率与稳定性同样表现优异。实测中，Qwen3-VL 4B 32K模型运行时设备内存占用仅7598MB，Qwen3 30B A3B 32K模型内存占用22774MB，均实现算力与内存的高效调度，无资源冗余浪费；同时，全系列模型测试过程中，DA600的CPU、NPU及协处理器算力协同稳定，无卡顿、掉帧等情况，契合工业级7×24小时稳定运行的需求。

DA600对Qwen3系列模型的实测高光表现，背后是其硬核的硬件架构与深度的模型适配能力。基于RK3588/RK3588J芯片的八核架构+6TOPS基础NPU算力，搭配20/60/160TOPS梯度化M.2协处理器，形成“基础算力+专用算力”的黄金组合；同时针对Transformer架构做了深度优化，实现与Qwen3系列模型的同源适配，无需二次开发即可高效运行，再加上独立的散热与供电设计，为算力稳定输出提供了坚实保障。

此次Qwen3系列模型的实测数据，不仅是DA600大模型一体机性能的硬核印证，更标志着边缘计算领域已实现从轻量化到百亿参数大模型、从纯文本到多模态推理的全品类高效部署，为智能会议、工业质检、轻量安防、智慧交通等各行业的大模型边缘落地，提供了可落地、可参考的高性能解决方案，推动边缘AI应用迈入全场景、高算力的新阶。

家具维修培训

- END -

上一篇：国产芯片加持！AI大模型一体机性能再升级，边缘端私有化部署迈入新阶段返回列表下一篇：6TOPS基础算力可扩至320TOPS 万物纵横DA600/DA600J大模型一体机解锁算力自由

Qwen3系列模型实测拉满 万物纵横DA600/DA600J大模型一体机性能超亮眼

需求留言:

Qwen3系列模型实测拉满万物纵横DA600/DA600J大模型一体机性能超亮眼