Soumith Chintala:被拒绝者的回响,AI时代的基石铸造者

温故智新AIGC实验室

TL;DR:

Soumith Chintala,一个曾被12所美国大学拒绝、历经重重磨砺的印度工程师,凭借不屈的意志和对技术的深刻洞察,在Meta内部力挽狂澜,一手缔造了如今AI领域最核心的深度学习框架PyTorch,从一个默默无闻的L4工程师成长为Meta副总裁,以无声的方式改变了整个AI生态,重新定义了“成功”的范式。

一个寻常的午后,硅谷的咖啡香气弥漫,但在更深层的技术世界里,一场无声的革命早已由一个不寻常的人悄然点燃。他不是那些光芒万丈、自带聚光灯的创业明星,甚至在很长一段时间里,他都是那个站在边缘、反复被世界拒绝的“失败者”。然而,正是这份被拒绝者的韧性,让Soumith Chintala得以铸就AI时代的基石——PyTorch,一个如今驱动着全球最顶尖AI模型的核心框架。

逆流而上的起点:屡败屡战的十年

Soumith的故事,始于印度海德拉巴一所普通的二本院校VIT Vellore,一个在内卷教育体系中,数学成绩平平便意味着前路坎坷的起点。他的履历,用他自己的话说,并无出彩之处。然而,一颗渴望探索的心,却驱使他走向了海外。他手持1420分的GRE成绩,向美国12所大学发出申请,却收到了清一色的拒绝信。那并非故事的终点,反而是序章,一场漫长而孤独的“被拒绝”之旅就此拉开序幕。

靠着一张短期的J-1签证,Soumith Chintala踏上了美国的土地,没有明确的学业方向,也没有足够的资金支撑学费。当第二轮硕士申请再次被拒到只剩下南加州大学和NYU时,留学梦几乎摇摇欲坠,周围人纷纷猜测他会就此放弃。但他,选择了“不妥协”。他从亚马逊最不起眼的测试工程师做起,像一块顽石,默默积蓄着能量。即使是后来,他三次叩响DeepMind的大门,也都铩羽而归,甚至签证都差点因延误而失效。每一次的拒绝,都在他的人生履历上留下深刻的印记,却也锻造了他异于常人的韧性。

命运的齿轮真正开始转动,是在他加入Facebook AI Research (FAIR)之后。彼时,他只是一个L4级别的小工程师,在一次ImageNet任务中,所有资深工程师都束手无策的数值与超参数错误,却被他用寥寥几行代码迎刃而解。那是一个电光火石的瞬间,打破了人们对这个沉默同事的固有印象。“所有人这才发现,这个平时沉默的同事竟然有这种本事。”1 在那个被低估的瞬间,他的技术天赋第一次被世界所看见。

绝境中的孤注一掷:PyTorch的诞生

进入FAIR的最初几年,Soumith Chintala的生活依旧算不上“风光”。他没有显赫的名声,没有耀眼的头衔,更没有丰富的资源。他所在的团队,坚持使用当时看起来前途渺茫的深度学习框架——Torch7。管理层多次提议砍掉这个项目,理由再简单不过:使用率低,看不到明显的商业收益。彼时,整个深度学习世界几乎被谷歌的TensorFlow所统治,无数论文和课程都以“Implemented in TensorFlow”为荣。公司内部甚至也蠢蠢欲动,计划全面转向TensorFlow。

那段日子,压力如影随形。一次,在旧金山一间老旧的酒吧里,Soumith Chintala对着朋友崩溃大哭,说出那句沉甸甸的话:“也许这就是终点了。”1 那是2016年,一个充满绝望的低谷。然而,正是这份绝望,催生了绝境中的一次豪赌——他和团队决定重写Torch7。他们要创造一个拥有更灵活架构、更友好接口的框架,让研究者能更轻松地上手,真正将“灵活”和“直觉”带回AI编程的世界。

这份孤注一掷的决心,最终凝结成了PyTorch。2017年,PyTorch正式开源。没有人预料到,这个曾被公司内部质疑、差点被砍掉的项目,会以燎原之势席卷全球。一年之内,它被全球顶尖实验室广泛采用,从一个“没人看好”的边缘项目,一跃成为深度学习研究的主流工具。Meta内部曾持怀疑态度的管理层,也不得不承认,他们看走了眼。PyTorch的出现,犹如一股清流,冲破了当时TensorFlow一枝独秀的局面,让无数研究者第一次意识到,“机器学习可以这么自由,像是创作。”12

潮汐逆转:AI世界的支柱

PyTorch的崛起,不仅仅是技术上的胜利,更是对AI开发模式的一次深刻革新。它引入了动态计算图(dynamic computational graph),让开发者能够“边写边改,实时调整实验模型”,这种灵活性对于快速迭代的AI研究至关重要。很快,“Implemented in PyTorch”开始频繁出现在各大顶会论文中,其在学术界和研究领域的份额迅速超越TensorFlow2

到2018年,Facebook官方博客宣布推出PyTorch 1.0,这标志着PyTorch不仅能支撑前沿研究,更能满足生产级别的部署需求。从那一刻起,PyTorch不再仅仅是开源社区的“玩具”,而是被公认为构建AI工业的“地基”。OpenAI的GPT系列、Stability的生成模型、Anthropic的Claude等众多顶级AI模型的底层框架,都不同程度地依赖PyTorch生态。它从学术实验室走向工业界,从开源社区渗透到课堂与科研机构,成为无数AI初创公司启动原型的首选工具。

Soumith Chintala本人,也因此被推到了舞台中央——从那个在FAIR默默无闻的L4工程师,一步步成长为Meta的副总裁。他没有成为下一个马斯克式的公众偶像,却以一种更深远的方式,成为“让成千上万人能造出下一个马斯克”的人1

沉默的远见者:重新定义成功

即使功成名就,Soumith Chintala也从未展现出典型的“硅谷成功学”主角的姿态。他话不多,不贩卖成功学鸡汤,也不热衷于讲述逆袭神话。更多时候,他只是安静地写代码、审阅Pull Request,与社区开发者们进行着最本源的技术交流。他清楚地知道自己来自何处——一个曾被拒绝12次的印度学生,一个在签证大厅里焦虑等待的普通人。这份清醒,让他对技术的意义有着深刻的理解:技术不只关乎效率,更是为每一个普通人留下的一个探索和创造的出口。

“我没想过要创造什么划时代的工具,只是不想让自己那几年白费。”1 这句朴实无华的话,恰恰揭示了他最深层的驱动力:不甘心,以及一种对所投入心血的尊重。他的故事没有逆袭的“爽点”,只有漫长而孤独的打磨。他没有在被拒绝时怨恨世界,也没有在成功后宣扬奇迹。这份谦逊和对“还没被看见的人”的关怀,也许正是PyTorch能够成为“所有人都能用、所有人都能改”的框架的根本原因13

如今,PyTorch已成为全球数百万开发者和研究者的“信仰”,而Soumith Chintala,这个曾反复被拒的工程师,以其无声的坚持和对技术本质的回归,不仅改变了AI的格局,也悄然改写了我们对“失败”和“成功”的定义。他的影响力,如他亲手铸就的基石一般,深远而持久。

引用


  1. 从印度二本到Meta副总裁,被世界拒绝15次的他,撑起AI时代地基·新智元·新智元编辑倾倾(2025/11/17)·检索日期2023/10/26 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 机器学习框架局势突变:TensorFlow逐渐式微,PyTorch横扫顶会·InfoQ·(2022/01/01)·检索日期2023/10/26 ↩︎ ↩︎

  3. PyTorch创始人:开源成功的方法论·知乎专栏·(2023/09/01)·检索日期2023/10/26 ↩︎