梁文锋的“及时雨”:中国大模型竞赛的算力罗生门与性价比战役

温故智新AIGC实验室

TL;DR:

在日益白热化的中国大模型竞技场中,一度凭借低成本高性能R1模型声名鹊起的DeepSeek,因算力瓶颈而深陷泥沼。英伟达H20芯片禁售的意外转机,如同一场“及时雨”为梁文锋解了燃眉之急,或将助其重夺市场份额并加速未来模型迭代,但其面临的挑战远不止算力,更是一场关于商业模式、生态构建和AGI路径的综合较量。

在大洋彼岸的硅谷,大型语言模型(LLM)的算力军备竞赛正酣,而东方古老的土地上,这场竞逐同样波澜壮阔,甚至更添了几分罗生门的色彩。曾凭借其精妙的“低成本大法”和DeepSeek-R1模型,在AI世界掀起一股“深度思考”浪潮的梁文锋,近期却发现自己陷入了一场“高处不胜寒”的困境。彼时,DeepSeek以其惊人的性价比,不仅抢尽了风头,甚至意外地在中国市场引爆了英伟达H20芯片的需求。然而,命运的齿轮有时会以令人猝不及防的方式转动。

DeepSeek的爆发式增长,在今年初仅维持了短短两个月。QuestMobile的数据显示,截至5月,其月活跃用户规模环比下滑了5.1%1.69亿,而在第三方平台SemiAnalysis的监测中,DeepSeek的官网访问量也同期下降了29%。这并非缺乏战略远见,而是现实的骨感:一场突如其来的地缘政治“寒流”,让作为关键“燃料”的英伟达H20芯片意外禁售,使得DeepSeek在算力储备上捉襟见肘,不得不将原定于5月发布的R2模型一再推迟。在没有足够“燃油”的情况下,再先进的引擎也难以全速冲刺,这无疑是其流量与使用率下滑的症结所在。

算力之困与及时雨

正如罗马不是一天建成的,AI模型的迭代也离不开海量的计算资源。当DeepSeek-R1以比肩OpenAI o1的性能和令人咋舌的低廉成本(其V3模型训练成本约为557万美元,远低于行业巨头)1横空出世时,它无疑是全球大模型版图中的一匹黑马。DeepSeek-R1在国内外市场获得了高度认可,微软首席执行官萨蒂亚·纳德拉和英伟达都曾公开赞扬其模型表现1。然而,这场看似完美的亮相,很快便遭遇了供应链的“黑天鹅”。美国对H20芯片的出口管制,如同给DeepSeek本已紧绷的算力弦上又加了一把锁。梁文锋担心新模型R2一旦上线,会因算力不足导致服务质量下降,从而损伤用户体验,这在“用户为王”的互联网时代无疑是商业大忌。

然而,峰回路转的剧情总是令人津津乐道。正当梁文锋团队焦灼等待之际,英伟达首席执行官黄仁勋年内第三次访华,并于7月15日对外公告:公司正提交重新销售H20芯片的申请,且美国政府已保证将授予许可证,交付程序将很快启动。2 这无疑是梁文锋翘首以盼的“及时雨”,它不仅可能解除R2模型上线的算力掣肘,更在某种程度上预示着AI芯片供应紧张的局面或许将有所缓解——尽管腾讯等国内科技巨头此前已大量采购H20芯片,导致市场供不应求3。这场“算力甘霖”的到来,为DeepSeek的下一阶段攻势提供了至关重要的硬件基础。

东方巨龙的竞速

在DeepSeek因算力瓶颈而“原地踏步”的近半年里,国内其他大模型玩家并未袖手旁观,反而如饥似渴地追赶,甚至试图“超车”。这场被称为“AI六小龙”的竞赛进入了白热化阶段。杨植麟的Kimi,在推出K2新模型后,凭借其开源策略和高达1万亿总参数的MoE架构,在SWE Bench Verified、Tau2等基准测试中超越了DeepSeek擅长的代码和数学推理任务2。更令人关注的是,Kimi K2在价格上与DeepSeek的标准API价格体系实现了对齐,每百万输入tokens收费4元,每百万输出tokens收费16元。MiniMax-M1则以“世界第一个开源大规模混合架构推理模型”之名,凭借极低的训练成本(仅53.47万美元,而DeepSeek V3约557万美元2和高达100万的上下文输入窗口(是DeepSeek R1的8倍),向DeepSeek的“性价比圣杯”发起了挑战。

甚至连科技巨头也加入了这场价格战。百度创始人李彦宏更是直接“贴脸开大”,批评DeepSeek除了缺乏多模态功能外,还存在“慢且贵”的问题,强调中国市场上绝大多数大模型API调用价格都更低且速度更快2。字节跳动的豆包大模型则专注于多模态融合,已逐步补全语音、图像、代码等能力,成为国内领先的多模态大模型之一1。这些竞争者们不仅在性能上步步紧逼,更在价格策略上对DeepSeek形成了围剿之势,试图撕下其“性价比”的标签。这种“红皇后效应”在东方市场体现得淋漓尽致:所有参与者都必须拼命奔跑,才能勉强维持在原地。

通向AGI的罗盘

尽管DeepSeek在自身应用流量上有所下滑,但在第三方平台,其R1和V3模型的总使用量仍在持续快速增长,据SemiAnalysis数据,已增长近20倍2这看似矛盾的现象,SemiAnalysis归结为DeepSeek的“Token经济学”问题:为了在推理资源有限的情况下提供便宜模型,其上下文窗口严格控制在64K,是业内主要提供商中最小之一,这直接影响了最终的Token消耗成本和用户体验。而这背后,是梁文锋选择的独特商业路径:主动拥抱开源,并对C端应用表现出“毫不在意”的姿态。他的视野中,追求并实现通用人工智能(AGI),才是头等大事。

然而,即使是最崇高的理想,也需要商业的土壤来孕育。DeepSeek终究不是一家慈善机构,其开源策略最终也旨在通过构建活跃的开发者生态来实现商业化。要重新激活市场对其的兴趣,除了尽快推出R2和V4等新一代模型外,梁文锋或许还需补上模型调用工具的能力短板。在全球Agent大爆发的当下,缺乏强大的工具调用能力已成为DeepSeek的阿喀琉斯之踵。晚点LatePost曾爆料,字节扣子团队在开发时曾考虑DeepSeek-R1,但最终因其调用工具能力不佳而选择了自家模型2。更令人担忧的是,DeepSeek目前是主流AI助手中唯一暂不支持多模态功能的产品,这意味着其在语音对话、图片/视频生成等日益重要的领域处于劣势。多模态作为通向AGI的重要途径,其战略地位正随着Agent生态的发展而日益凸显。如果梁文锋不愿亮出更多“大招”,那么这场及时雨所带来的短暂喘息,或许很快就会被对手们更全面的能力所淹没。

AI的未来图景,并非仅由算力与模型性能决定,更是一场关于商业模式韧性、生态系统构建和对AGI之路坚定信念的综合较量。梁文锋的“及时雨”无疑提供了关键补给,但DeepSeek能否再次引领潮流,抑或在激烈的竞争中被后来者超越,尚待时间揭晓。毕竟,在AI这条没有终点的赛道上,每一场战役都只是通向下一个挑战的起点。

引用


  1. 2025年电子行业深度报告:算力平权,国产AI力量崛起·未来智库(2025/05/12)·检索日期2025/7/15 ↩︎ ↩︎ ↩︎

  2. 梁文锋等来及时雨·字母榜(ID:wujicaijing)·赵晋杰(2025/7/15)·检索日期2025/7/15 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. 腾讯向英伟达采购数十亿元规模芯片,助攻AI应用规模化·新浪财经(2025/03/13)·检索日期2025/7/15 ↩︎