100美元4小时,你的专属“小GPT”就能出道?Karpathy又把AI门槛“焊死”了!

温故智新AIGC实验室

TL;DR:

AI大神Karpathy带着“疯狂之作”nanochat杀回来了!这次,他用不到8000行代码复刻了ChatGPT全流程,只需100美元和4小时,就能让普通人也拥有自己的“专属AI”。这波操作,简直是把AI大模型的门槛按在地上摩擦,彻底“焊死”了!

最近,AI圈又爆了个大瓜!前特斯拉AI总监、传奇人物Andrej Karpathy,这位总能给咱带来惊喜的大神,又双叒叕出手了!这次,他的新作“nanochat”在GitHub上线不到12小时,星标就飙破了4.2k,这热度简直是坐上了火箭,谁看了不说一句“爷青回”!1

Karpathy自己都说,这是他写过的“最疯狂的项目之一”。为啥这么疯狂?因为它让“造一个ChatGPT”这件事,变得像点外卖一样简单,甚至更便宜:100美元,4小时,一台GPU,你就能拥有一个属于自己的“小型ChatGPT”。是不是有种“平民窟百万富翁”的既视感?

“造富”神话?百元也能炼出“小GPT”!

这波操作,简直是把大模型训练的成本和门槛,打到了“骨折价”。以往,训练一个能说会道的AI,那可是动辄几十上百万美元,还得有专业的“炼丹师”团队。现在Karpathy告诉你,没那么复杂!

nanochat项目明确给出了“百元挑战”的成绩单:

  • 100美元,4小时:用一台GPU跑4小时,你就能训练出一个能写诗、讲故事、回答基础问题的“迷你版”OpenAI同款AI。
  • 1000美元,约41.6小时:稍微加点“预算”,你的AI就能迅速进化,达到甚至超越GPT-2的核心指标,不仅能搞定基础推理,还能挑战代码生成和多项选择题。
  • 24小时训练:性能直逼GPT-3 Small 125M,在MMLU等专业测试上也能拿到40+、70+、20+的分数,这表现,真香!1

Karpathy此举,再次贯彻了他一贯的“民主化路线”——降低LLM研究与复现门槛,让每个人都能亲手训练自己的模型。这不就是把AI从“少数人专属”变成了“全民狂欢”嘛!这波啊,这波是格局打开了!

从“造大脑”到“造ChatGPT”:极致极简的奥秘

可能有人会问,这跟之前那个“火爆全网”的nanoGPT有啥区别?区别大了去了!如果说nanoGPT是教你如何“造一个神经网络大脑”的基础课,那么nanochat就是手把手教你“怎么把这个大脑包装成一个能对话的ChatGPT”的实战课。

nanoGPT主要聚焦于Transformer的预训练,而nanochat呢?它是个“全栈玩家”,涵盖了从数据准备、预训练,到中期训练(对话、多项选择题、工具使用)、SFT(监督微调)、RL微调(强化学习),再到最后的推理部署,一整套ChatGPT的生产流程,都浓缩在了这8000行代码里2

没错,你没听错,仅仅8000行代码!这代码量,在动辄几十万行的AI项目里,简直就是“一股清流”。用Karpathy的话说,这就是一个“连贯、极简、可读、可修改、可最大化派生”的仓库。这哪是写代码,这简直是在写“AI武林秘籍”啊!

它甚至用全新的Rust语言实现了训练分词器,在FineWeb上预训练Transformer LLM,还在SmolTalk上进行中期训练,最后用“GRPO”在GSM8K上进行强化学习微调。一套流程下来,简直是教科书级别的“从零到一”!1

“平替”还是“启蒙”?AI界又要“卷”起来了!

当然,100美元的“小GPT”可能无法媲美你平时用的那些动辄千亿参数的大家伙,比如OpenAI的GPT-4 Turbo或者Claude 3 Opus。它更像是一个“入门款”或“学习款”AI,能让你亲身体验大模型的训练和运行,感受AI的魅力。毕竟,Karpathy自己都展示了那个100美元4小时训练出的nanochat的“有趣”对话示例,它可能还在学习如何更好地与人类对话,但那份“成长潜力”却让人兴奋。

但它的意义远不止于此。Karpathy将nanochat定位为LLM101n(仍在开发中)的“压轴之作”,更有望成为未来LLM研究的基线和开源社区的实验平台。想想看,当每个人都能轻松搭建自己的AI实验室,用低廉的成本进行模型训练和实验时,AI领域的创新将迎来怎样一场“大爆炸”?1

这无疑是对AI技术的一次“降维打击”,也是对AI开放、可学习、可复现理念的又一次坚定践行。Karpathy这位“AI教育家”,不仅教你“造大脑”,现在更教你“造ChatGPT”。他用行动告诉我们,AI,从来都不是高高在上、遥不可及的专利,它也可以是每个人都能触及、都能玩的“大玩具”。

所以,是时候撸起袖子,用这“百元挑战”把属于你自己的“小GPT”带回家了!AI的未来,可能就从这8000行代码开始,变得更加普惠、更加精彩!


引用


  1. Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」·新智元·新智元(2025/10/14)·检索日期2025/10/14 ↩︎ ↩︎ ↩︎ ↩︎

  2. Karpathy再放大招:8000行代码复现ChatGPT全栈,最低成本仅100 ...·网易号·(2025/10/14)·检索日期2025/10/14 ↩︎