刘知远：在算力荒原里，他刻下了AI进化的“百日刻度”

TL;DR：

清华大学副教授、面壁智能联合创始人刘知远凭借“密度法则”登上《自然》子刊封面，揭示了大模型智能密度每100天翻倍的惊人规律。他主张通过算法创新绕过“算力墙”，并预言“用AI造AI”将成为下一场工业革命的终极标志。

2025年11月，北京初冬的寒意并未能掩盖清华园里传出的震动。随着最新一期《自然·机器智能》（Nature Machine Intelligence）封面的发布，一个名为“密度法则”（Densing Law）的词汇迅速席卷了全球科技圈。

封面的背后，是清华大学计算机系副教授、面壁智能首席科学家刘知远。在同行们仍沉浸在“规模法则”（Scaling Law）的暴力美学中，试图用更昂贵的算力和更庞大的模型堆砌智能时，刘知远却像一位精密的制表匠，在算法的微观世界里找到了一条更陡峭、更经济的进化曲线。

“我们正在经历一场比摩尔定律还要快5倍的变革，”刘知远在接受专访时，语调平和却透着某种极客特有的笃定。他所揭示的，不仅仅是一个学术公式，更是中国AI团队在算力围城中突围的生存哲学。

算力墙下的“逆向革命”

长久以来，硅谷信奉的是安迪-比尔定律的AI变体：英伟达增加的算力，总会被更大规模的模型消耗殆尽。这种“暴力出奇迹”的范式，让AI成了大国与巨头的数字军备竞赛。

然而，刘知远和他的面壁智能团队却选择了另一条路。他们推出的“小钢炮”MiniCPM系列，试图用只有巨头1/10的参数，跑出同等的智能。这种对效率的极致追求，源于一种深刻的危机感：当硬件供给遭遇能源和数据的双重天花板，旧有的扩张范式正在失效。¹

“虽然研究是2025年发表的，但想法在2024年初就萌生了，”刘知远回忆道。当时，国内团队刚刚完成对ChatGPT的复现，摆在面前的是两条路：要么继续烧钱追赶GPT-4，要么寻找新的路径。他选择了后者——“如何用更低的成本，承载更高质量的智能”。¹

这种“以小博大”的底色，被《经济学人》称为绕过“算力墙”的中国路径。在刘知远看来，这不仅是无奈之举，更是人工智能回归普惠本质的必然要求：“如果要让每个人都受益，技术就不能昂贵。”²

百日维新：比摩尔定律陡峭5倍的曲线

刘知远提出的“密度法则”给出了一个令人战栗的参数：大模型的智能密度以每3.5个月（约100天）翻倍的速度狂飙。³

这意味着，每过100天，开发者就能用一半的参数量实现当前的顶级性能。如果这个速度持续下去，一年后的成本将降至原来的十分之一。¹

“这不仅是一个技术指标，它正在重塑商业逻辑，”刘知远直言。如果一家公司的模型在发布后3到6个月内无法收回成本，那么它注定会被淘汰，因为后来者可以用四分之一的资源实现同样的能力。这种“百日维新”式的迭代节奏，让AI行业的竞争从“持久战”变成了生存率极低的“遭遇战”。³

在访谈中，刘知远并不避讳谈及“泡沫”。他认为局部泡沫不可避免，但他更看重的是这种指数级增长背后的“自我实现”——投入的人才和资源越多，密度增长就越快。对他而言，Densing Law与Scaling Law并非对立，而是硬币的两面：规模法则开启了通往AGI的大门，而密度法则决定了谁能最终拿到那张普及性的入场券。⁴

“小钢炮”背后的冷思考：算法即制程

刘知远喜欢将MiniCPM这类高效模型比作“芯片制程”。

“你不能通过简单的剪裁把14nm芯片变成7nm芯片，”他解释道。要把模型密度做高，必须从架构设计、数据治理到软硬协同进行原生的体系构建。这是一种“算法制程”，也是他构筑的技术护城河。²

谈及具体的创新，他眼里闪烁着光芒：细粒度混合专家架构（MoE）、稀疏注意力机制、RNN与Transformer的混合……这些复杂的术语在他口中成了实现“计算按需分配”的艺术。他特别提到了谷歌的Gemini 3，认为其在图像可控性上的突破，印证了只要智能被实现，它迟早能在端侧设备——手机、甚至汽车芯片上跑起来。¹

然而，这种快速进化也带来了关于人类位置的焦虑。如果AI的迭代周期缩短到100天，人类智力供给的极限在哪里？

2026：当AI开始制造AI

“我最期待的，是‘用AI制造AI’。”

刘知远在采访最后，给出了一个极具工业革命色彩的预判。他认为，当模型能够通过自主学习（Self-play）和强化学习实现自我探索，人类将从繁重的“数据标注员”和“调参工”中解放出来，转而成为最后的“把关人”。¹

这是一种近乎理想主义的乐观。他相信，AI最终会帮助人类从细分学科的奴隶变成知识的主人，去探索宇宙和生命的终极奥秘。³

在刘知远身上，我们看到了一种独特的跨界特质：他既有清华学者的严谨，又有创业者的敏锐，更有着一种对抗“算力霸权”的人文关怀。他并不追求那个最大的模型，他追求的是那个最聪明的、能让所有人都能负担得起的“智慧单元”。

当2030年的曙光照进现实，或许我们会发现，那条在2025年被划下的、每百天翻倍的曲线，正是通往普惠AGI的真实坐标。

引用

中国大模型团队登Nature封面，刘知远语出惊人：期待明年“用AI造AI” · 腾讯科技 · 郭晓静 (2025/12/25) · 检索日期2025/12/25 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
对话面壁智能首席科学家刘知远：大模型将有新的「摩尔定律」 · 爱范儿 · (2025/12/25) · 检索日期2025/12/25 ↩︎ ↩︎
大模型每百天性能翻倍，清华团队“密度法则”登上Nature子刊 · 36氪 · (2025/12/25) · 检索日期2025/12/25 ↩︎ ↩︎ ↩︎
密度法则”比Scaling Law更有效？清华刘知远团队提出LLM能力密度 · MIT科技评论中国 · (2025/12/25) · 检索日期2025/12/25 ↩︎