洞察 Insights
超越自回归:蚂蚁dInfer如何将扩散语言模型推向AGI主干道
蚂蚁集团开源dInfer推理框架,显著提升扩散语言模型(dLLM)推理速度超10倍,使其在效率上首次超越自回归模型,结合其LLaDA-MoE模型在精度上的突破,共同为通用人工智能(AGI)的实现开辟了一条高效且具竞争力的“主干道”。这一进展不仅大幅降低了AI应用的商业化成本,还将重塑AI架构范式,加速产业智能化进程并引发深远的社会影响。
阅读全文
洞察 Insights
轨迹感知RL突破扩散模型瓶颈:AI推理范式的新统一与效率革命
TraceRL框架通过创新性地对齐扩散语言模型(DLM)的训练目标与推理轨迹,显著提升了DLM的性能与训练效率,使其在复杂推理任务上超越了更大规模的自回归模型,预示着AI推理能力与计算效率的深刻变革。这一创新及其开源框架dLLM-RL,正加速DLM成为下一代高效智能体的核心基石,开启“RL大一统”的新范式。
阅读全文
洞察 Insights
LLaDA-MoE:扩散语言模型的MoE化挑战自回归霸权,效率与精度的新范式之争
蚂蚁集团与人民大学联合发布的LLaDA-MoE,是全球首个原生MoE架构的扩散语言模型,其性能与主流自回归模型Qwen2.5-3B-Instruct持平,并在推理速度上占据优势,为AGI探索开辟了新路径。然而,该技术仍需在应对“效率悖论”和提升序列级准确性方面持续优化,以在更广泛的商业应用中证明其价值。
阅读全文