刘知远:在算力荒原里,他刻下了AI进化的“百日刻度”

温故智新AIGC实验室

TL;DR:

清华大学副教授、面壁智能联合创始人刘知远凭借“密度法则”登上《自然》子刊封面,揭示了大模型智能密度每100天翻倍的惊人规律。他主张通过算法创新绕过“算力墙”,并预言“用AI造AI”将成为下一场工业革命的终极标志。

2025年11月,北京初冬的寒意并未能掩盖清华园里传出的震动。随着最新一期《自然·机器智能》(Nature Machine Intelligence)封面的发布,一个名为“密度法则”(Densing Law)的词汇迅速席卷了全球科技圈。

封面的背后,是清华大学计算机系副教授、面壁智能首席科学家刘知远。在同行们仍沉浸在“规模法则”(Scaling Law)的暴力美学中,试图用更昂贵的算力和更庞大的模型堆砌智能时,刘知远却像一位精密的制表匠,在算法的微观世界里找到了一条更陡峭、更经济的进化曲线。

“我们正在经历一场比摩尔定律还要快5倍的变革,”刘知远在接受专访时,语调平和却透着某种极客特有的笃定。他所揭示的,不仅仅是一个学术公式,更是中国AI团队在算力围城中突围的生存哲学。

算力墙下的“逆向革命”

长久以来,硅谷信奉的是安迪-比尔定律的AI变体:英伟达增加的算力,总会被更大规模的模型消耗殆尽。这种“暴力出奇迹”的范式,让AI成了大国与巨头的数字军备竞赛。

然而,刘知远和他的面壁智能团队却选择了另一条路。他们推出的“小钢炮”MiniCPM系列,试图用只有巨头1/10的参数,跑出同等的智能。这种对效率的极致追求,源于一种深刻的危机感:当硬件供给遭遇能源和数据的双重天花板,旧有的扩张范式正在失效。1

“虽然研究是2025年发表的,但想法在2024年初就萌生了,”刘知远回忆道。当时,国内团队刚刚完成对ChatGPT的复现,摆在面前的是两条路:要么继续烧钱追赶GPT-4,要么寻找新的路径。他选择了后者——“如何用更低的成本,承载更高质量的智能”。1

这种“以小博大”的底色,被《经济学人》称为绕过“算力墙”的中国路径。在刘知远看来,这不仅是无奈之举,更是人工智能回归普惠本质的必然要求:“如果要让每个人都受益,技术就不能昂贵。”2

百日维新:比摩尔定律陡峭5倍的曲线

刘知远提出的“密度法则”给出了一个令人战栗的参数:大模型的智能密度以每3.5个月(约100天)翻倍的速度狂飙。3

这意味着,每过100天,开发者就能用一半的参数量实现当前的顶级性能。如果这个速度持续下去,一年后的成本将降至原来的十分之一。1

“这不仅是一个技术指标,它正在重塑商业逻辑,”刘知远直言。如果一家公司的模型在发布后3到6个月内无法收回成本,那么它注定会被淘汰,因为后来者可以用四分之一的资源实现同样的能力。这种“百日维新”式的迭代节奏,让AI行业的竞争从“持久战”变成了生存率极低的“遭遇战”。3

在访谈中,刘知远并不避讳谈及“泡沫”。他认为局部泡沫不可避免,但他更看重的是这种指数级增长背后的“自我实现”——投入的人才和资源越多,密度增长就越快。对他而言,Densing Law与Scaling Law并非对立,而是硬币的两面:规模法则开启了通往AGI的大门,而密度法则决定了谁能最终拿到那张普及性的入场券。4

“小钢炮”背后的冷思考:算法即制程

刘知远喜欢将MiniCPM这类高效模型比作“芯片制程”。

“你不能通过简单的剪裁把14nm芯片变成7nm芯片,”他解释道。要把模型密度做高,必须从架构设计、数据治理到软硬协同进行原生的体系构建。这是一种“算法制程”,也是他构筑的技术护城河。2

谈及具体的创新,他眼里闪烁着光芒:细粒度混合专家架构(MoE)、稀疏注意力机制、RNN与Transformer的混合……这些复杂的术语在他口中成了实现“计算按需分配”的艺术。他特别提到了谷歌的Gemini 3,认为其在图像可控性上的突破,印证了只要智能被实现,它迟早能在端侧设备——手机、甚至汽车芯片上跑起来。1

然而,这种快速进化也带来了关于人类位置的焦虑。如果AI的迭代周期缩短到100天,人类智力供给的极限在哪里?

2026:当AI开始制造AI

“我最期待的,是‘用AI制造AI’。”

刘知远在采访最后,给出了一个极具工业革命色彩的预判。他认为,当模型能够通过自主学习(Self-play)和强化学习实现自我探索,人类将从繁重的“数据标注员”和“调参工”中解放出来,转而成为最后的“把关人”。1

这是一种近乎理想主义的乐观。他相信,AI最终会帮助人类从细分学科的奴隶变成知识的主人,去探索宇宙和生命的终极奥秘。3

在刘知远身上,我们看到了一种独特的跨界特质:他既有清华学者的严谨,又有创业者的敏锐,更有着一种对抗“算力霸权”的人文关怀。他并不追求那个最大的模型,他追求的是那个最聪明的、能让所有人都能负担得起的“智慧单元”。

当2030年的曙光照进现实,或许我们会发现,那条在2025年被划下的、每百天翻倍的曲线,正是通往普惠AGI的真实坐标。

引用