首页> 新闻动态> 行业资讯> 除了通义千问，瑞芯微RK182X还能适配哪些大语言模型？

除了通义千问，瑞芯微RK182X还能适配哪些大语言模型？

作者：万物纵横

发布时间：2026-05-08 09:56

阅读量：

RK182X（RK1820/RK1828）已完成20 + 主流大语言模型适配，覆盖国产、开源主流体系，支持 0.5B–8B 参数，INT4/FP16 量化，延迟普遍≤200ms、TPS≥50。

除了通义千问，瑞芯微RK182X还能适配哪些大语言模型？(图1)

一、国产主流 LLM（深度优化，实测可跑）

通义千问（Qwen）：Qwen2.5-1.5B/3B/7B、Qwen3-8B；TTFT 80–160ms，TPS 56–87。

DeepSeek：DeepSeek-R1-Distill、DeepSeek-7B；TPS 60–80，适合对话 / 推理。

智谱 GLM：ChatGLM3-6B、GLM Edge；TTFT＜180ms，支持多轮对话。

MiniCPM：MiniCPM-2B/4B，轻量高效；TPS＞90，适合移动端 / 嵌入式。

InternLM2（书生）：InternLM2-7B；稳定推理，适配端侧创作 / 问答。

TeleChat（天枢）：TeleChat-7B；中文优化，低延迟对话。

二、国际开源 LLM（兼容适配，可部署）

LLaMA2：LLaMA2-7B/13B（INT4）；TPS 50–70，需授权。

Mistral：Mistral-7B-v0.3；TTFT＜150ms，吞吐高。

Phi：Phi-2-2.7B；轻量极速，TTFT＜50ms，TPS＞120。

Gemma：Gemma-2B/7B；Google 开源，适配端侧教育 / 助手场景。

TinyLLAMA：TinyLLAMA-1.1B；超低功耗，适合 IoT / 便携设备。

三、多模态 VLM（识图 / 摘要，0.1s 级）

Qwen-VL 系列：Qwen3-VL-2B/4B、Qwen2.5-Omni-3B；图文理解 / 摘要，TPS 90–136。

MiniCPM-V：MiniCPM-V-2B；端侧 OCR + 识图，精度≥98%。

其他：LLaVA、MiniGPT-4；支持图像描述 / 文档分析。

四、适配核心条件（为何能跑这么多）

1. 算力与内存：20 TOPS NPU + 2.5GB/5GB 3D DRAM（1TB/s 带宽），解决 7B 模型带宽瓶颈。

2. RKNN-Toolkit2：支持 INT4/FP16 量化、剪枝、蒸馏，显存占用降 75%，适配端侧资源。

3. 双芯协同：RK3588+RK182X 分工，交互延迟＜0.5ms，调度高效。

五、选型参考（按场景）

实时对话（低延迟）：Qwen2.5-3B、Phi-2、MiniCPM-2B（TTFT＜100ms）。

图文识图 / 摘要：Qwen3-VL-2B、MiniCPM-V（端到端≤0.1s）。

离线创作 / 推理：Qwen2.5-7B、LLaMA2-7B、InternLM2-7B（TPS≥50）。

- END -

分享：

上一篇：瑞芯微RK182X 实测通义千问：端侧实时识图、摘要，延迟低至 0.1s 返回列表下一篇：瑞芯微RK1828 与 RTX 3060/4060：7B 模型端侧推理对比分析

需求留言:

热门文章

私有化部署大模型，6TOPS 算力盒子够用吗？实测 Qwen-1.8b

6TOPS 算力盒深度拆解：RK3588 芯片 + 无风扇设计，值不值得买？

拆解瑞芯微RK182X：RISC-V+NPU 异构，国产协处理器的极限设计

PCIe/USB 双接口、可堆叠扩展：RK182X 重新定义端侧算力扩容

瑞芯微RK1828 与 RTX 3060/4060：7B 模型端侧推理对比分析

AI边缘计算盒子咨询

RK1828智算模组相关内容

瑞芯微 RK1828 AI 协处理器，百 token/s 极速推理

工业级 RK1828 核心板｜多接口、宽温、长生命周期

热门标签

行为属性分析盒子

视频识别老鼠的算法

RV1106G2性能参数

Hi3559A性能参数

视觉神经ai算法有哪些

边缘AI服务器

AI目标检测算法

智慧电力监测系统

计算加速卡有什么用

领先的边缘智能产品与解决方案提供商

立即体验

高性能AI边缘计算盒子

AIoT 智能设备

大模型一体机AI边缘大模型一体机 AI边缘盒子AI边缘计算盒子 AI服务器AI边缘服务器 AI模组AI智算模组 AI智算卡AI智算卡

AIoT 智能平台

AIoT物联智能平台 IoT物联网平台

AI边缘计算盒子方案 AI智算服务器方案 ThingSense平台方案云边端一体化方案

服务与支持

AI产品资料中心售后服务产品定制

万物公众号二维码

华北地区负责人：17340067106（毛经理）

华东地区负责人：17358670739（甘经理）

华南、华西地区负责人：19113907060（耿女士）

软件算法咨询：18982151213（刘先生）

四川省成都市武侯区天府五街花漾锦江JR大厦B座7层（总部）

Copyright © 2025 万物纵横版权所有

蜀ICP备2023003916号-1 网站地图技术支持物联网资讯边缘计算热门资讯家具维修培训

试用申请

硬件设备咨询

华北地区负责人：17340067106（毛经理）

华东地区负责人：17358670739（甘经理）

华南、华西地区负责人：19113907060（耿女士）

软件算法咨询

18982151213（刘先生）

在线客服

回到顶部

产品订购

*
*
*
*

点击更换
*