首页
洞察
早报
日报
主题探索
关于
人工智能开源
洞察 Insights
LLaDA-MoE:扩散语言模型的MoE化挑战自回归霸权,效率与精度的新范式之争
蚂蚁集团与人民大学联合发布的LLaDA-MoE,是全球首个原生MoE架构的扩散语言模型,其性能与主流自回归模型Qwen2.5-3B-Instruct持平,并在推理速度上占据优势,为AGI探索开辟了新路径。然而,该技术仍需在应对“效率悖论”和提升序列级准确性方面持续优化,以在更广泛的商业应用中证明其价值。
阅读全文