TL;DR:
后摩智能以其存算一体芯片M50,正有效破解端边通用AI算力的“存储墙”与“功耗墙”瓶颈,预示着端侧AI计算将从辅助角色跃升为主导,尤其为AI PC、智能办公及具身智能等万亿级市场提供核心算力底座,重构产业生态并推动AI普惠化。
2025年的商业世界,正加速向一个由智能无处不在的未来迈进。随着大模型技术从云端走向更广阔的边缘和终端,一场深刻的算力范式迁移正在发生。传统计算架构在承载大规模AI任务时所面临的“存储墙”与“功耗墙”挑战,正催生颠覆性技术方案。后摩智能(Houmo AI)及其存算一体(In-Memory Computing)芯片M50的出现,不仅是技术层面的重大突破,更是对未来智能生态、商业格局乃至人类与智能体交互模式的一次深刻预言。
技术原理与创新点解析:突破计算效率瓶颈
端边通用AI算力瓶颈的核心,在于传统冯·诺依曼架构下数据在计算单元与存储单元之间频繁搬运所带来的巨大能耗和延迟。据后摩智能创始人兼CEO吴强指出,约90%的功耗耗费在数据搬运而非计算本身1。这在资源受限的端边设备上,尤其在大模型普及的背景下,成为了制约AI发展的“阿喀琉斯之踵”。
后摩智能选择的“存算一体”技术路径,正是为了从根本上解决这一痛点。存算一体的核心思想是将计算逻辑嵌入存储单元内部,最大程度地拉近数据与计算的距离,从而显著减少数据搬运,实现数量级的能效提升。M50芯片作为后摩智能的旗舰产品,其创新点体现在:
- 极致能效比:M50在仅10W的典型功耗下,能提供高达100-160TOPS(INT8)的物理算力,并可实现100TFLOPS(bFP16)的浮点算力23。这使得其能够在口香糖大小的M.2卡上运行140亿甚至300亿参数的大模型,这对于端边设备而言,是前所未有的突破。
- 大模型适配能力:该芯片配备最高48GB内存和153.6GB/s的超高带宽,能够支持从140亿、200亿、300亿直至1200亿参数的大模型在端侧高效运行,甚至已完成70B参数的DeepSeek模型适配2。
- 第二代存算一体IPU与“天璇”架构:M50采用后摩智能自研的“天璇”架构,创新性地实现了存内浮点运算,并支持按bit位弹性加速2。这不仅提高了计算精度和灵活性,也显著降低了开发者适配大模型的门槛,支持FP16浮点模型直接运行。
- 完备的工具链:“后摩大道”编译器能够自动优化计算策略,支持各类已训练好的开源模型直接转换到硬件运行,无需重新训练1。这种软硬一体的解决方案加速了技术落地。
这些技术创新共同构筑了M50作为“能效比最高的端边大模型AI芯片”3的核心竞争力,为大模型真正走出云端、走向万物互联的智能终端铺平了道路。
产业生态影响评估:重塑端边AI与具身智能格局
吴强指出,未来五到十年,端边侧计算将从以逻辑控制为主转向以AI为主,正站在端边侧AI爆发的前夜。这一“范式迁移”将深刻影响多个产业,STL Partners预测,端边计算的市场规模在未来五至十年有望达到四千亿美元量级1。
- AI PC与智能办公的普及:M50芯片的低功耗、高性能使其成为AI PC和智能办公设备的理想选择。本地运行大模型不仅能大幅提升用户体验(如公文写作、会议纪要等),更能保障数据隐私和安全性,降低对云端算力的依赖。联想、讯飞听见已成为M50的首批意向客户,预示着AI PC市场的巨大潜力2。
- 5G+AI与边缘计算的深化:在工业物联网、智慧城市等边侧场景,M50可集成于AI网关、计算盒子中,实现实时、高效的本地数据分析和决策。中国移动的5G+AI边缘计算平台有望集成M50芯片,加速行业智能化进程2。
- 具身智能:下一代端边AI的关键赛道:吴强强调,具身智能(Embodied AI)机器人需要一颗实时、强思维、可交互的“最强大脑”1。存算一体架构的低延迟和高能效优势,使其成为具身智能芯片的理想选择。后摩智能正与机器人算法及方案厂商共同推进芯片解决方案,这不仅关乎技术,更承载着创造“能照顾家人的陪伴机器人”的哲学愿景2。具身智能市场虽然尚未成熟,但其一旦爆发,吴强认为将比手机市场更为庞大,代表着人机交互的终极形态。
后摩智能的策略不仅是提供芯片,更是与产业链上下游(包括操作系统、主控芯片、算法层、解决方案层)共建端边AI生态。这体现了一种系统性思维,认识到在AI竞争中,算力只是基础,生态才是胜负手。
未来发展路径预测与哲学思辨:智能体的崛起与普惠化愿景
“存算一体”技术路线的成功,不仅在于其对“存储墙”和“功耗墙”的实用性突破,更在于它承载了对AI未来发展的深层思考:
- 智能的边缘化与普惠化:当大模型算力能够在低功耗的端侧设备上运行,AI将真正摆脱对昂贵云端资源的过度依赖,走向普惠化。这将使得智能应用触达更广阔的群体和更丰富的场景,加速AI的普及。每一个智能设备都可能拥有一个“最强大脑”,这无疑将彻底改变我们与技术互动的方式。
- 隐私与安全的新范式:本地运行大模型,意味着用户数据无需上传云端进行处理,从而天然地保护了数据隐私。这对于未来AI应用的普及至关重要,尤其是在个人健康、智能家居等敏感领域。
- 具身智能的加速实现:具身智能代表着AI从虚拟世界走向物理世界,其核心挑战在于如何赋予机器人一个能够实时感知、理解、决策并与环境互动的“身体”和“大脑”。M50这样的存算一体芯片,以其高能效和低延迟特性,提供了构建这一“最强大脑”的硬件基石。这将加速人形机器人、服务机器人、智能驾驶等领域的发展,最终可能带来新的社会生产力和生活方式。正如吴强所言,他希望创造出能照顾家人的陪伴机器人,这触及了技术与人类情感、社会福祉的深层连接。
- 创新架构的“弯道超车”策略:对于初创公司而言,选择存算一体这样高难度的创新架构,是应对国际巨头竞争的**“弯道超车”**策略2。它不再是跟随性的技术迭代,而是从底层逻辑上重构计算方式,从而在能效和成本上取得突破性优势。这种对创新精神的坚持,在AI芯片的“红海”竞争中显得尤为关键。
当然,存算一体技术的量产和工程化仍面临诸多挑战,例如电流控制、电源稳定性等复杂问题2。然而,后摩智能已通过M50的发布和落地计划,证明了其将理论推向实践的能力。公司透露明年将推出基于DRAM存算的下一代芯片,以进一步攻克带宽瓶颈,表明其持续的技术演进路线2。
这一轮由存算一体驱动的端边AI算力革命,不仅仅是硬件性能的提升,更是智能体从数字世界走向物理世界的关键一步,它将深刻影响人类文明的进程,塑造一个更为智能、普惠且个性化的未来。