华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
软件算法咨询:18982151213(刘先生)

联系我们
产品咨询

实测后摩力擎 LQ50 算力卡:依托 漫界M50 芯片,7B 大模型推理每秒 25+Token

作者:万物纵横
发布时间:2026-06-05 09:13
阅读量:

一、硬件核心参数(单片 LQ50・M.2 2280)


项目

规格参数

主控芯片

后摩漫界 M50 存算一体 AI 芯片(第二代 SRAM-CIM 存内计算架构)

算力

160TOPS@INT8100TFLOPS@bFP16 浮点算力

板载内存

标配 12/18/24GB LPDDR5,最高可拓展 48GB,带宽 153.6GB/s

尺寸接口

M.2 2280 M-keyPCIe4.0×4,口香糖紧凑型尺寸

功耗

满载≤13W,典型运行 10W,待机低至 4mW,支持无风扇被动散热

系统适配

Win11/Linux/Android,配套后摩大道 SDK一键部署主流大模型


二、实测 7B 大模型推理表现


1. 基准性能:FP16/INT8 量化环境下,主流开源 7B(Llama3、Qwen7B、DeepSeek7B)原生本地推理稳定 25~32Token/s,满足日常对话、文档总结、代码生成实时使用;


2. 优化表现:经后摩大道编译器算子优化后,最优工况可达 35Token/s,媲美入门独显本地推理水准;


3. 上下文适配:支持 8K~32K 上下文窗口,长文本续写、知识库问答无明显掉速,依托超高内存带宽规避传统显卡显存瓶颈。


实测后摩力擎 LQ50 算力卡:依托 漫界M50 芯片,7B 大模型推理每秒 25+Token(图1)


三、技术亮点(存算一体核心优势)


1. 架构优势:存算一体打破冯诺依曼存储墙,权重与计算单元同片集成,数据就近运算,同等功耗下算力利用率远超传统 GPU/NPU;


2. 低耗本地化:10W 级功耗即可离线跑 7B,无需云端联网,数据全程本地运算,适配 AI PC、工控主机、迷你边缘盒私有化部署;


3. 算力拓展:M50 支持 HM-Link 多芯互联,双芯版LQ50 Duo(双 M50)320TOPS,可流畅跑 14B~32B 大模型,推理翻倍至 50+Token/s。


四、落地应用场景


消费端:台式 / 笔记本加装 M.2 插槽秒变 AI PC,离线本地大模型;


行业边缘:工控设备、智慧终端、私有化知识库服务器、本地 AI 客服盒子;


信创领域:国产飞腾 / 鲲鹏主机配套,国产化端侧大模型硬件方案。


五、同档位对比小结


对比同功耗 M.2 算力卡,LQ50 凭借 M50 存算一体,7B 推理速度领先传统 NPU 卡 30%+、功耗降低近一半,是小体积本地大模型性价比优选方案。

家具维修培训

- END -
分享:
留言 留言 试用申请
产品咨询 产品咨询 硬件设备咨询
华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
技术咨询 技术咨询 软件算法咨询
18982151213(刘先生)
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *