百度文心 5.0:DeepMind,承认别人优秀有这么难吗?

温故智新AIGC实验室

TL;DR:

DeepMind CEO 刚吐槽中国 AI 没创新,百度文心 5.0 就带着 1451 的高分在 LMArena “贴脸开大”。这不是简单的弯道超车,而是中国 AI 正在把实验室里的公式,变成高铁、电网和代码行里的真功夫——预览版已这么顶,1 月正式版是要“起飞”吗?

听到 DeepMind CEO 聊中国 AI 的那句“毫无创新,跟进速度可怕”,多少让人心里有点不是滋味。在西方的传统叙事里,他们负责“从 0 到 1”的浪漫发明,我们负责“从 1 到 100”的极致内卷。哪怕你跑得再快,在他们眼里也只是个“勤奋的跟跑者”。

但偏见这东西,最怕硬数据。

12 月 23 日,全球公认最难刷榜、最讲究“盲测体验”的大模型竞技场 LMArena 更新了榜单。在一众硅谷大模的重重包围中,百度文心 ERNIE-5.0-Preview-1203 杀了出来,以 1451 分拿下了国内第一,全球前十 12。这个成绩意味着什么?它不仅把 Claude Sonnet 4.5 甩在了身后,连 GPT-5.2 这种“神级选手”也没能拉开差距。作为前 20 名里唯一的非美国模型,文心 5.0 用实力告诉硅谷:这局棋,逻辑变了。

技术大揭秘:这 2.4 万亿参数是怎么“变聪明”的?

能在大模型竞技场撕开铁幕,靠的不是运气,更不是单纯的“堆显卡”,而是百度在练几门很刁钻的“内功”。

  • 第一招:天生的“视听一体”机。 以前很多所谓的“多模态”其实是缝合怪,给模型外挂一个看图的眼、听声的耳,各感官之间是割裂的。文心 5.0 采用了**“原生全模态统一建模”**技术 3。简单来说,它就像一个天生具备五感的生命体,从训练的第一天起,文字、图片、视频就是融合学习的。这让它能直接读懂视频里的情绪,甚至看清图片里的逻辑,理解力直接上了个台阶。

  • 第二招:“大块头”也有“大智慧”。 文心 5.0 的参数量达到了惊人的 2.4 万亿。通常模型越大越笨重,但百度用了一种超大规模混合专家模型(MoE)架构。这 2.4 万亿参数像是一个庞大的院士库,但每次处理问题时,只激活不到 3% 的“对口专家”来干活 3。这种“精兵强将”的策略,让它在处理复杂逻辑时既快又准。

  • 第三招:知行合一的“行动派”。 它不再只是个只会“想”的思考者,而是进化成了能“干活”的智能体。通过融合思考和行动的复合思维链,它能一边推理一边调用工具。这种端到端的优化,让它解决跨领域问题的能力显著提升。

行业“地震”:实验室里的创新,不如长在泥土里

DeepMind 觉得中国 AI 缺乏创新,是因为他们太看重实验室白板上的公式。但在中国,创新是长在泥土里、车间里和代码行里的。

“硅谷追求算法从 0 到 1 的惊艳,中国追求产业从 1 到 100 的质变。”

不信?去看看中车集团。造高铁最怕的就是气动外形设计,以前全靠扔进风洞实验室里“烧钱吹风”,一次实验要几个月。现在有了文心大模型的科学计算能力,几分钟就能跑出数据 3。更神的是**“虚拟传感器”**,在没法装物理传感器的地方,AI 能凭电流电压数据“盲推”核心部件状态,把故障检测准确率硬生生又提升了 10%。这 10%,关乎的是亿万乘客的生命安全。

还有国家电网的无人机巡检、顺丰日均 20% 的 AI 生成代码 3……这些解决物理世界硬伤、提升生产力极致效率的应用,DeepMind 的精英们可能连想都没想过。

未来预测:Preview 已经封神,正式版还要多强?

最让同行“细思极恐”的细节是:目前在 LMArena 排名前列的这个文心 5.0,后缀还挂着一个词——Preview(预览版) 45

这就好比武林高手过招,对方还没拔剑,只是试探性地出了一掌,就已经惊动了江湖。据圈内消息,文心大模型 5.0 正式版大概率会在 1 月份正式上线 3。经过一个多月的闭关打磨,正式版的性能又会进化到什么程度?

当中美 AI 的技术代差被抹平,接下来的竞争拼的不再是多 10 分的参数,而是谁能把 AI 变成像水和电一样的日用品。百度正在带着整个生态进化,当 AI 深入政务的毛细血管、指导上海交大的化学实验(甚至上了 Nature 封面 3)时,这种“应用壁垒”本身就是一种巨大的技术护城河。

所以,与其傲慢地评判,不如换副眼镜看中国。在这个赛场上,创新没有垄断权,它可以发生在加州的实验室,也可以发生在中国的高铁车间。

引用


  1. 百度文心大模型5.0-Preview 文本能力国内第一 · OSCHINA · OSC编辑 (2025/12/23) · 检索日期2025/12/23 ↩︎

  2. 百度文心大模型在LMArena展現強勁實力 · Stockfisher · 財經新聞 (2025/12/23) · 检索日期2025/12/23 ↩︎

  3. DeepMind还是不懂中国 · 微信公众号“王智远” · 王智远 (2025/12/23) · 检索日期2025/12/23 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  4. 欢迎在LMArena 上测试ERNIE-5.0-Preview-1022! · ERNIE Blog · 百度 (2025/10/22) · 检索日期2025/12/23 ↩︎

  5. 登榜LMArena!文心大模型5.0-Preview文本能力国内第一 · 百度官网 · 百度 (2025/11/08) · 检索日期2025/12/23 ↩︎