代币也疯狂：当AI“新石油”沦为昂贵的炼金术

TL;DR：

生成式AI正从“智力竞赛”转向“消耗竞赛”，昂贵的Token正成为阻碍智能体（Agent）普及的财务暗礁。在英伟达鼓吹“Token经济学”与硬件成本高企的双重夹击下，市场正迫切呼唤类似DeepSeek式的效率革命，以终结AI时代的通货膨胀。

如果说数据是21世纪的石油，那么Token（词元）就是经过提炼后的高标号汽油。在硅谷与中关村的算力工厂里，这种“数字燃料”的燃烧速度正让财务总监们惊掉下巴。英伟达的掌门人黄仁勋最近化身“Token之王”，试图游说全世界：衡量一个工程师价值的标准不再是代码的优雅，而是他能烧掉多少Token。这种逻辑听起来就像是汽车销售员在建议，判定司乘水平的唯一指标是油耗。

繁荣背后的“数字通胀”

随着OpenClaw（俗称“龙虾”）等智能体应用的扩散，AI的作业模式正从“你问我答”的简报会转变为“全自动生产线”的闭环作业。这种转变的代价是Token消耗量的指数级爆炸。以往几十个Token能解决的对话，在Agent自我博弈、反复调用的循环中，动辄飙升至千万级¹。当一名OpenAI程序员在一周内消耗掉相当于33本维基百科的Token时，我们不禁要问：这究竟是在炼金，还是在单纯地烧钱？

这种“Token焦虑”并非空穴来风。猎豹移动CEO傅盛的账本显示，即便是优化后的AI使用成本，年费也高达2.5万人民币——这足以买下40个“剪映”的高级会员。对于绝大多数C端用户而言，这种定价无异于在数字世界里推行“路易十四式”的奢侈消费。周鸿祎曾机智地辩称Token贵是种“误解”，认为复杂任务才费钱²。但在商业逻辑中，如果一种工具只能在“不复杂”时才便宜，那它的生产力属性就得打个折扣。

内存墙与“焊死”的野心

Token降价的障碍并不全在模型算法，更在于冷冰冰的硬件账单。2026年第一季度，DRAM价格环比上涨逾50%，HBM内存更是成了硅谷的“大宗紧俏货”³。当存储芯片的价格像波尔多红酒一样连年看涨时，Token的“通缩”计划自然只能束之高阁。云厂商们正处于涨价的煎熬中，而行业最乐观的预计是，存储价格回落要等到2028年。

面对“内存墙”的阻隔，一些激进的创业者开始尝试“物理超度”。Taalas团队推出的HC1芯片提供了一个近乎偏执的方案：将模型权重直接“焊”在硅片上¹。这种“专芯专用”的做法彻底消除了数据搬运的能耗，但也让模型失去了进化的灵活性。这更像是一种工业时代的思维：既然软件太贵，那就把它变成硬件。然而，在算法迭代以周为单位的今天，这种“焊死”的智慧能否跑赢摩尔定律，仍需打个问号。

谁是下一个“价格屠夫”？

市场之所以“想念DeepSeek”，本质上是在想念那个敢于捅破价格天幕的“普罗米修斯”。2024年DeepSeek-V2上线时，曾以GPT-4百分之一的价格引发了一场腥风血雨式的价格战²。但如今，面对硬件成本的通胀，国内大厂表现出了出奇的沉默。在ARR（年度经常性收入）的考核压力下，没人愿意在存量市场自砍一刀。

然而，沉默并不代表停滞。中国厂商正凭借极高的性价比在海外开发者平台OpenRouter上“刷榜”，调用量甚至一度超越美国同行⁴。这种“农村包围城市”的策略，核心在于对MFU（模型计算利用率）的极致榨取——既然GPU很贵，那就让每一瓦电力都转化成更多的Token。

正如《经济学人》常挂在嘴边的那样：长期来看，效率总会战胜狂热。当黄仁勋忙着制造Token焦虑时，真正的赢家或许是那些能把“炼金术”变成“廉价电力”的人。毕竟，人民不仅想念周鸿祎，更想念那个能让AI像自来水一样便宜的时代。

引用

人民想念DeepSeek · 虎嗅网 · 苏扬（2026/3/25） · 检索日期2026/3/25 ↩︎ ↩︎
人民想念DeepSeek · 腾讯新闻 · 苏扬（2026/3/25） · 检索日期2026/3/25 ↩︎ ↩︎
英伟达欲加冕“Token国王”，中国大模型已凭性价比抢跑 · 新浪财经（2026/3/17） · 检索日期2026/3/25 ↩︎
从“造模型”到“造算力”：Token工厂之战 · 通信人家园 · coffee198375（2026/3/23） · 检索日期2026/3/25 ↩︎