TL;DR:
全球AI行业正从“跑马圈地”转向“精打细算”的Token消耗竞赛,算力租赁已成为AI商业闭环中最核心的公共基础设施。在这场资本密集的战争中,谁掌握了算力供应链的调度权,谁就掌握了通往通用人工智能(AGI)的门票。
曾经,大模型的开发者们沉迷于吹嘘模型的参数规模,仿佛参数越多,智慧的曙光就越近。然而,当字节跳动的豆包和OpenAI的竞争者们在Token消耗量的指数级增长中感到账单寒意时,游戏规则变了。如果说AI是这场工业革命的蒸汽机,那么算力租赁就是负责供应煤炭和冷却水的关键管道。如今,这根管道正变得异常拥堵。
从“资源出租”到“Token变现”
商业逻辑的演变往往伴随着这种微妙的残酷。五年前,算力租赁还只是一个将服务器堆在机房里按小时计费的“自动售货机”生意。而现在,随着推理需求在总算力占比中反超训练,厂商们发现,向客户售卖“GPU时间”已属落后,直接向价值源头——Token(词元)——收费,才是掌握利润中枢的王道。
数据不会说谎。截至2026年4月,全球AI大模型Token调用量已突破27万亿大关1。这种增长背后是无数复杂的智能体在后台规划、搜索与推理。当计算任务从简单的“问答”转向“长链条决策”,算力需求便不再是线性的,而是几何级的。对于企业而言,算力成本已从边缘开支跃升为资产负债表上的“头号大敌”。
算力版图的权力更迭
如果说互联网时代的核心资产是流量,那么AI时代的核心资产便是英伟达H100及更高级别的加速卡。在这个领域,马斯克的算力帝国展现了惊人的资本灵活性。当xAI旗下的Colossus 1集群将22万张GPU转租给Anthropic时,这不仅是一次资产变现,更是一次地缘政治与产业博弈的缩影2。
Anthropic的扩张策略堪称教科书式的“算力囤积”。通过与亚马逊、谷歌以及SpaceX签署动辄数吉瓦的长期协议,这些AI公司实质上是在对未来五年的计算资源进行“期货投机”3。在这场游戏中,能够提供稳定能源供应、具备顶级工程建设能力以及拥有大规模库存的玩家,正在重塑产业链的权力架构。
繁荣背后的冷思考
然而,算力租赁这门生意并非没有阴霾。尽管租金在过去半年内上涨了近40%4,但中小玩家依然面临着残酷的“折旧折磨”。英伟达的技术更新周期缩短至“以年计”,对于那些重金采购硬件的算力厂商而言,如果不具备极强的规模效应来平摊折旧成本,所谓的“回本周期”往往只是纸面上的海市蜃楼。
此外,国产算力面临的挑战同样严峻。在“算力银行”与“算力超市”的政策倡议下,国产GPU正试图在“生态鸿沟”中寻找突破口。然而,硬件性能的追赶仅仅是第一步,如何适配CUDA生态,如何让算力从“看得见”变成“用得动”,将决定这一波国产算力潮到底是真金白银的产业升级,还是泡沫破碎后的碎纸屑。
最终,这场AI付费潮将过滤掉那些只会烧钱却无法创造实际价值的企业。算力将回归其本质——一种如同电力般平价、稳定且无处不在的公共基础设施。在这一天到来之前,那些手握GPU密钥的“算力军火商们”,将继续在这场由Token驱动的数字淘金热中,赚取最丰厚的利润。