从 M50 芯片到 LQ50 M.2 卡,后摩的核心思路是:用存算一体架构把单芯片做到 160 TOPS / 10W,再把整套算力与内存系统塞进标准 M.2 2280 形态,实现低功耗、即插即用的端侧大模型推理。

一、M50:160TOPS 存算一体芯片
2025 年 7 月发布的后摩漫界 M50,是国内首颗面向端边大模型的存算一体 AI 芯片。
算力:160 TOPS@INT8,100 TFLOPS@bFP16
功耗:典型 10W,远低于同算力传统 GPU
内存:单片最高 48GB LPDDR5,带宽 153.6 GB/s
能效:比传统架构提升 5–10 倍,可跑 1.5B–70B 参数本地大模型
工艺 / 面积:自研存内计算架构,芯片约 20×23mm
二、从 M50 到 LQ50:M.2 卡的工程实现
力擎 LQ50 是把 M50 完整算力方案装进 M.2 2280(22×80mm) 形态的产品。
1) 标准 M.2 形态
尺寸:22×80mm(口香糖大小)
接口:PCIe Gen4 ×4,M-Key,兼容主流主板 / AI PC
功耗:整卡典型 ≤13W,支持无风扇被动散热
2) 核心配置(与 M50 一致)
AI 加速器:1×M50,160 TOPS@INT8
内存:12GB–48GB LPDDR5,192bit,153.6 GB/s
系统:支持 Win11 / Linux / Android
推理性能:7B/8B 模型 ≥25 token/s,可本地跑百亿级大模型
3) 关键技术:存算一体 + 板级极致优化
存算一体(CIM):计算贴近存储,减少数据搬运,10W 达成 160 TOPS,能效远超传统 GPU/ASIC。
板级功耗与散热:
多级功耗管理,待机低至 4mW。
定制薄型散热器,支持主动 / 自然散热,适配紧凑空间。
全栈软件适配:后摩大道平台支持模型转换、编译、部署,无缝对接主流大模型。
三、产品矩阵与定位
LQ50:单 M50,160 TOPS,≤13W,M.2 2280,面向 AI PC / 终端。
LQ50 Duo:双 M50,320 TOPS,双槽 M.2,面向高端端侧 / 边缘。
力谋 LM5050/LM5070:2–4 颗 M50,最高 640 TOPS,面向边缘服务器。
BX50 计算盒:多 M50,32 路视频分析 + 本地大模型,边缘网关形态。
四、核心价值
高算力低功耗:160 TOPS / ≤13W,端侧能效新标杆。
即插即用:标准 M.2,AI PC / 笔记本 / 嵌入式设备直接用。
本地大模型:离线跑 7B–70B 模型,低延迟 + 数据隐私。
需求留言: