华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
软件算法咨询:18982151213(刘先生)

联系我们
产品咨询

从 M50 到 LQ50:后摩如何做出 160TOPS 低功耗 M.2 卡

作者:万物纵横
发布时间:2026-05-14 09:59
阅读量:

从 M50 芯片到 LQ50 M.2 卡,后摩的核心思路是:用存算一体架构把单芯片做到 160 TOPS / 10W,再把整套算力与内存系统塞进标准 M.2 2280 形态,实现低功耗、即插即用的端侧大模型推理。


从 M50 到 LQ50:后摩如何做出 160TOPS 低功耗 M.2 卡(图1)


一、M50:160TOPS 存算一体芯片


2025 年 7 月发布的后摩漫界 M50,是国内首颗面向端边大模型的存算一体 AI 芯片。


算力:160 TOPS@INT8,100 TFLOPS@bFP16


功耗:典型 10W,远低于同算力传统 GPU


内存:单片最高 48GB LPDDR5,带宽 153.6 GB/s


能效:比传统架构提升 5–10 倍,可跑 1.5B–70B 参数本地大模型


工艺 / 面积:自研存内计算架构,芯片约 20×23mm


二、从 M50 到 LQ50:M.2 卡的工程实现


力擎 LQ50 是把 M50 完整算力方案装进 M.2 2280(22×80mm) 形态的产品。


1) 标准 M.2 形态


尺寸:22×80mm(口香糖大小)


接口:PCIe Gen4 ×4,M-Key,兼容主流主板 / AI PC


功耗:整卡典型 ≤13W,支持无风扇被动散热


2) 核心配置(与 M50 一致)


AI 加速器:1×M50,160 TOPS@INT8


内存:12GB–48GB LPDDR5,192bit,153.6 GB/s


系统:支持 Win11 / Linux / Android


推理性能:7B/8B 模型 ≥25 token/s,可本地跑百亿级大模型


3) 关键技术:存算一体 + 板级极致优化


存算一体(CIM):计算贴近存储,减少数据搬运,10W 达成 160 TOPS,能效远超传统 GPU/ASIC。


板级功耗与散热:


多级功耗管理,待机低至 4mW。


定制薄型散热器,支持主动 / 自然散热,适配紧凑空间。


全栈软件适配:后摩大道平台支持模型转换、编译、部署,无缝对接主流大模型。


三、产品矩阵与定位


LQ50:单 M50,160 TOPS,≤13W,M.2 2280,面向 AI PC / 终端。


LQ50 Duo:双 M50,320 TOPS,双槽 M.2,面向高端端侧 / 边缘。


力谋 LM5050/LM5070:2–4 颗 M50,最高 640 TOPS,面向边缘服务器。


BX50 计算盒:多 M50,32 路视频分析 + 本地大模型,边缘网关形态。


四、核心价值


高算力低功耗:160 TOPS / ≤13W,端侧能效新标杆。


即插即用:标准 M.2,AI PC / 笔记本 / 嵌入式设备直接用。


本地大模型:离线跑 7B–70B 模型,低延迟 + 数据隐私。

- END -
分享:
留言 留言 试用申请
产品咨询 产品咨询 硬件设备咨询
华北地区负责人:17340067106(毛经理)
华东地区负责人:17358670739(甘经理)
华南、华西地区负责人:19113907060(耿女士)
技术咨询 技术咨询 软件算法咨询
18982151213(刘先生)
微信在线客服 微信在线客服 在线客服
返回官网顶部 返回官网顶部 回到顶部
关闭窗口
产品订购
  • *

  • *

  • *

  • *

  • *