TL;DR:
有个叫“亚里士多德”的AI数学家,花了6小时就搞定了困扰人类30年的数学难题——Erdős问题#124的“简易版”,把一众数学大佬都看懵了。这波操作不仅让它一夜爆红,还预示着AI在科学发现领域要“开挂”了,连“数学大魔王”陶哲轩都跑来围观并点赞,直呼AI开启了“Vibe证明”时代!
数学界最近是真·“杀疯了”!当你还在为了毕业论文掉头发,或者为了Excel表格加班加点的时候,一个叫**“亚里士多德”(Aristotle)的AI模型,默默地完成了一件让无数人类数学家“破防”的事:它,竟然只用区区6小时**,就独立证明了一个被数学界**“无奈搁置”了近30年的Erdős问题#124!这速度,简直是给所有“打工人”上了一课:什么叫效率YYDS**!
此时此刻,全球技术圈的“瓜田”——𝕏(前推特)上,关于“AI挑战数学巅峰”的讨论已经炸开了锅。微软前AI副总裁、如今在OpenAI研究AGI的Sebastien Bubeck大佬,激动得像个孩子,第一时间分享了这惊天大瓜:
该解决方案100%由AI生成,总计耗时6小时。
这可不是什么“野鸡新闻”,连被称为“数学大魔王”的澳洲数学家陶哲轩都亲自下场“围观”并参与讨论了!他甚至还“货比三家”,对比了Gemini和ChatGPT的深度研究工具,结果发现——Harmonic的**“亚里士多德”模型表现更佳**。这可真是,“没有对比就没有伤害”,ChatGPT和Gemini这波是不是有点“脸疼”?
揭秘“神仙操作”:AI到底“盘”了个啥?
那么问题来了,这个让AI一夜成名的Erdős问题#124,到底是个什么来头?“亚里士多德”又是如何**“大显神功”**的?
别急,咱接着往下“盘”。
首先,咱得保持清醒,冷静吃瓜:经过各路大神“科普”后才发现,Harmonic模型所证明的,并非原版Erdős问题#124的“终极困难版”,而是一个**“简易版本”**。就像玩游戏,AI是先把“新手村”的Boss给推了,但“终极副本”还在那里等着它。
这个问题的核心,用大白话讲就是:
假设你有一堆**“进制生成器”**(d1, d2, ..., dk),每个生成器都能吐出一些数字。你的任务是:
- 从每个生成器里,最多挑一个数字。
- 把你挑出来的这些数字全部加起来。
- 看看能不能凑出你想要的目标数。
核心问题是:只要你的这套“生成器”满足一个特定条件(具体公式是1/(d1-1) +1/(d2-1)+…+1/(dk-1)≥ 1),那么是不是所有“足够大的整数”,都能用这种方式给**“凑出来”**?1
这个看似“不明觉厉”的问题,在过去几十年里,逐渐分化成了**“困难模式”和“简单模式”**。
- “困难模式”(原版[BEGL96]):不仅不让用数字1,还得额外满足一个**“gcd条件”(可以理解为各进制之间不能有“重复周期”)。结果呢?人类数学家只发现,对于特定集合 {3, 4, 7},猜想才能成立,进展可谓“龟速”**。
- “简单模式”:条件放宽了,允许使用数字1,也不需要额外的gcd条件。而Harmonic的“亚里士多德”模型,就是在这个“简单模式”下,成功证明了:只要满足上述特定条件,就一定能凑出所有大整数!而且,它的证明方案**“出乎意料的简单”,甚至还得到了Lean形式化验证的官方“盖章认证”——这玩意儿就相当于数学界的“公正处”,确保AI的证明没有一丝“幻觉”**,绝对严谨。2
当然,这次证明#124简易版的功臣之一,Boris Alexeev也小声补充了一个“内幕”:
在“形式化猜想”项目中,原本的数学表述有个笔误:注释里写的是≥1,而Lean程序代码里却写成了=1。这个错误让原表述的条件变弱了。因此,我修正了这个错误,并删除了我认为不必要的部分。最终,AI成功证明了这个更简洁、更准确的版本。
瞧,有时候**“眼瞎”不只是人类的专利**,连代码也会“笔误”!不过,正是这种“人机协作”的修正,才让AI的证明更加完美。
所以,总结一下就是:“亚里士多德”证明了“简易版”,但“困难版”还在“高山仰止”地等着人类和AI一起去攀登。
“Vibe证明”时代驾到?背后的“神仙打架”!
尽管只是“简易版”,但这波操作已经足以让大佬们对AI在数学领域的潜力**“刮目相看”**。Harmonic的联创兼CEO,更是激动地宣布:
我们正处于数学领域深刻变革的边缘,Vibe证明时代已经到来。
“Vibe证明”?听起来就很**“有那味儿”!这概念借鉴了AI大神卡帕西提出的“Vibe Coding”,大概就是指AI在数学证明中,能像人类一样捕捉到问题的“感觉”和“直觉”,然后用更优雅、更简单的方式给出证明。这不就是数学界的“降维打击”**吗?
既然“亚里士多德”这么牛,能把ChatGPT和Gemini都给“比下去”,那它背后的**“出品方”Harmonic**,又是何方神圣?
一扒才发现,这家公司可是**“来头不小”,目标更是“野心勃勃”**:打造世界上最先进的数学推理引擎!
Harmonic由两位**“学霸级”联创**共同打造:
- CEO Tudor Achim:卡内基梅隆计算机科学学士,斯坦福计算机科学PhD(目前“on leave”),之前还在自动驾驶公司Helm.ai担任联创和CTO,可谓是**“科技多面手”**。
- 执行主席Vlad Tenev:斯坦福数学学士,加州大学洛杉矶分校数学硕士。更劲爆的是,他现在还同时在金融公司Robinhood Markets兼任CEO!这简直是**“学霸+商业大佬”**的完美结合,分分钟让你觉得“你和学霸的差距,比你想象的还要大”。
这样“神仙配置”的团队,难怪能搞出大事情。而且,Harmonic最近还完成了1.2亿美元的C轮融资,估值直接飙到14.5亿美元(约合人民币103亿)!这资金实力,简直就是给AI的数学探索**“打满了鸡血”**!3
而他们家的**“旗舰模型”,就是这次“一夜成名”的“亚里士多德”。据说,这货还是第一个在2025年国际数学奥林匹克竞赛中**,给出其中五道题形式化验证解决方案的模型。
Aristotle在保证准确性和消除幻觉的同时,达到了金牌级别的表现。
是的,你没听错,“金牌级别”!这简直是让那些在奥数竞赛中苦苦挣扎的“打工人”学生们,看到了AI的**“降维打击”**。难怪Vlad Tenev透露,这次用来证明Erdős问题的“亚里士多德”,又进行了一些更新,推理能力和自然语言界面都更强大了。
AI浪潮之下,开弓已无回头箭
“亚里士多德”这次在Erdős问题上的突破,虽然只是“简易版”,但其意义不容小觑。它不仅验证了AI在数学推理和证明方面的巨大潜力,更像是一面旗帜,预示着AI将会在更多基础科学领域“大展拳脚”。
想想看,未来AI不仅能帮我们**“解题”,还能“出题”,甚至“修正”人类的“笔误”。那些曾被人类数学家“束之高阁”的百年难题、千年猜想,会不会在AI的“神来之笔”**下,逐一被攻克?人类在数学殿堂里,从“拓荒者”变成“协作伙伴”,甚至有点“监工”的意味?
可以预见,随着AI解决复杂数学问题的能力不断突破,科学发现的进程将被**“按下加速键”。这股AI浪潮,已经“开弓没有回头箭”**,它将彻底改变我们认识世界、解决问题的方式。准备好了吗,各位?AI的“数学大考”,才刚刚开始!