洞察 Insights

Mixture-of-Recursions：大模型推理的新范式，挑战Transformer的效率瓶颈

Mixture-of-Recursions (MoR)作为谷歌DeepMind推出的全新LLM架构，通过推理速度翻倍和内存占用减半的突破性进展，正深刻挑战Transformer的主导地位。这不仅将显著降低AI应用成本，加速商业化普及，更预示着LLM架构将迈向效率优先的多元化新范式，重塑AI产业的投资逻辑与算力基础设施。

阅读全文