代币也疯狂:当AI“新石油”沦为昂贵的炼金术

温故智新AIGC实验室

TL;DR:

生成式AI正从“智力竞赛”转向“消耗竞赛”,昂贵的Token正成为阻碍智能体(Agent)普及的财务暗礁。在英伟达鼓吹“Token经济学”与硬件成本高企的双重夹击下,市场正迫切呼唤类似DeepSeek式的效率革命,以终结AI时代的通货膨胀。

如果说数据是21世纪的石油,那么Token(词元)就是经过提炼后的高标号汽油。在硅谷与中关村的算力工厂里,这种“数字燃料”的燃烧速度正让财务总监们惊掉下巴。英伟达的掌门人黄仁勋最近化身“Token之王”,试图游说全世界:衡量一个工程师价值的标准不再是代码的优雅,而是他能烧掉多少Token。这种逻辑听起来就像是汽车销售员在建议,判定司乘水平的唯一指标是油耗。

繁荣背后的“数字通胀”

随着OpenClaw(俗称“龙虾”)等智能体应用的扩散,AI的作业模式正从“你问我答”的简报会转变为“全自动生产线”的闭环作业。这种转变的代价是Token消耗量的指数级爆炸。以往几十个Token能解决的对话,在Agent自我博弈、反复调用的循环中,动辄飙升至千万级1。当一名OpenAI程序员在一周内消耗掉相当于33本维基百科的Token时,我们不禁要问:这究竟是在炼金,还是在单纯地烧钱?

这种“Token焦虑”并非空穴来风。猎豹移动CEO傅盛的账本显示,即便是优化后的AI使用成本,年费也高达2.5万人民币——这足以买下40个“剪映”的高级会员。对于绝大多数C端用户而言,这种定价无异于在数字世界里推行“路易十四式”的奢侈消费。周鸿祎曾机智地辩称Token贵是种“误解”,认为复杂任务才费钱2。但在商业逻辑中,如果一种工具只能在“不复杂”时才便宜,那它的生产力属性就得打个折扣。

内存墙与“焊死”的野心

Token降价的障碍并不全在模型算法,更在于冷冰冰的硬件账单。2026年第一季度,DRAM价格环比上涨逾50%,HBM内存更是成了硅谷的“大宗紧俏货”3。当存储芯片的价格像波尔多红酒一样连年看涨时,Token的“通缩”计划自然只能束之高阁。云厂商们正处于涨价的煎熬中,而行业最乐观的预计是,存储价格回落要等到2028年。

面对“内存墙”的阻隔,一些激进的创业者开始尝试“物理超度”。Taalas团队推出的HC1芯片提供了一个近乎偏执的方案:将模型权重直接“焊”在硅片上1。这种“专芯专用”的做法彻底消除了数据搬运的能耗,但也让模型失去了进化的灵活性。这更像是一种工业时代的思维:既然软件太贵,那就把它变成硬件。然而,在算法迭代以周为单位的今天,这种“焊死”的智慧能否跑赢摩尔定律,仍需打个问号。

谁是下一个“价格屠夫”?

市场之所以“想念DeepSeek”,本质上是在想念那个敢于捅破价格天幕的“普罗米修斯”。2024年DeepSeek-V2上线时,曾以GPT-4百分之一的价格引发了一场腥风血雨式的价格战2。但如今,面对硬件成本的通胀,国内大厂表现出了出奇的沉默。在ARR(年度经常性收入)的考核压力下,没人愿意在存量市场自砍一刀。

然而,沉默并不代表停滞。中国厂商正凭借极高的性价比在海外开发者平台OpenRouter上“刷榜”,调用量甚至一度超越美国同行4。这种“农村包围城市”的策略,核心在于对MFU(模型计算利用率)的极致榨取——既然GPU很贵,那就让每一瓦电力都转化成更多的Token。

正如《经济学人》常挂在嘴边的那样:长期来看,效率总会战胜狂热。当黄仁勋忙着制造Token焦虑时,真正的赢家或许是那些能把“炼金术”变成“廉价电力”的人。毕竟,人民不仅想念周鸿祎,更想念那个能让AI像自来水一样便宜的时代。

引用


  1. 人民想念DeepSeek · 虎嗅网 · 苏扬(2026/3/25) · 检索日期2026/3/25 ↩︎ ↩︎

  2. 人民想念DeepSeek · 腾讯新闻 · 苏扬(2026/3/25) · 检索日期2026/3/25 ↩︎ ↩︎

  3. 英伟达欲加冕“Token国王”,中国大模型已凭性价比抢跑 · 新浪财经(2026/3/17) · 检索日期2026/3/25 ↩︎

  4. 从“造模型”到“造算力”:Token工厂之战 · 通信人家园 · coffee198375(2026/3/23) · 检索日期2026/3/25 ↩︎