Newspaper
AI Agent:一场从「Token内卷」到「星际计算」的狂飙,人类,准备好了吗?
今天是2025年12月12日。智能体(AI Agent)正以势不可挡的姿态,全面重构我们对技术、商业乃至人类自身边界的认知。这场从“Token内卷”到“星辰大海”的“Agent战争”,正深刻重塑AI行业的底层逻辑与未来走向。
阅读全文
洞察 Insights
颠覆“逐字生成”:蚂蚁集团LLaDA 2.0开启AI可控生成新纪元
蚂蚁集团携手多方力量,推出千亿参数级扩散语言模型LLaDA 2.0,其核心在于改变了传统自回归模型的“逐字生成”模式,实现推理过程中Token的直接编辑与控制。这一颠覆性创新不仅有望显著提升AI生成效率和降低成本,更重要的是,它为AI内容带来了前所未有的可控性和可编辑性,预示着AI在编程、创意写作等领域的人机协作将迎来范式级的深刻变革。
阅读全文
洞察 Insights
超越自回归:蚂蚁dInfer如何将扩散语言模型推向AGI主干道
蚂蚁集团开源dInfer推理框架,显著提升扩散语言模型(dLLM)推理速度超10倍,使其在效率上首次超越自回归模型,结合其LLaDA-MoE模型在精度上的突破,共同为通用人工智能(AGI)的实现开辟了一条高效且具竞争力的“主干道”。这一进展不仅大幅降低了AI应用的商业化成本,还将重塑AI架构范式,加速产业智能化进程并引发深远的社会影响。
阅读全文
洞察 Insights
轨迹感知RL突破扩散模型瓶颈:AI推理范式的新统一与效率革命
TraceRL框架通过创新性地对齐扩散语言模型(DLM)的训练目标与推理轨迹,显著提升了DLM的性能与训练效率,使其在复杂推理任务上超越了更大规模的自回归模型,预示着AI推理能力与计算效率的深刻变革。这一创新及其开源框架dLLM-RL,正加速DLM成为下一代高效智能体的核心基石,开启“RL大一统”的新范式。
阅读全文
洞察 Insights
LLaDA-MoE:扩散语言模型的MoE化挑战自回归霸权,效率与精度的新范式之争
蚂蚁集团与人民大学联合发布的LLaDA-MoE,是全球首个原生MoE架构的扩散语言模型,其性能与主流自回归模型Qwen2.5-3B-Instruct持平,并在推理速度上占据优势,为AGI探索开辟了新路径。然而,该技术仍需在应对“效率悖论”和提升序列级准确性方面持续优化,以在更广泛的商业应用中证明其价值。
阅读全文