智能体泡沫的幻象与现实:穿越喧嚣,寻找AI Agent的真价值

温故智新AIGC实验室

TL;DR:

当前AI Agent市场正经历一场由资本和技术炒作驱动的泡沫,通用型Agent面临技术瓶颈和商业化困境,用户留存率低。唯有深耕垂直领域、结合行业Know-how,并务实地将Agent能力融入现有工作流,才能在泡沫消退后实现真正的价值落地和长期生存。

近期的AI浪潮中,智能体(AI Agent)无疑是继大模型之后又一焦点。从年初的强化学习热潮到如今各式各样的“类Agent”产品层出不穷,市场对“更聪明、更全能、更自动化”的未来充满期待。然而,在这股狂热背后,一场由资本、技术和场景错配共同催生的泡沫正在膨胀,其规模和深远影响值得我们深入洞察。行业人士的普遍共识是,诸多所谓的Agent产品不过是“挂羊头卖狗肉”1,热闹之下是堪忧的用户留存率与日趋同质化的体验。

技术之殇:智能体瓶颈的深层解构

AI Agent的崛起,主要得益于大模型在“工具使用”(tool-use)能力上的突破,特别是通用接口(如MCP协议)的普及,使得Agent能更高效地与外部系统交互、获取信息。然而,支撑这一愿景的技术基石仍面临多重挑战,远未达到理想的成熟度。

  • MCP与A2A之辩:协议深度的局限 当前普遍使用的MCP(Machine-to-Agent Communication Protocol)协议,作为通用Agent与外部数据源的通信方式,在将自然语言转化为结构化查询或指令时,不可避免地会产生信息损失和语义偏差。例如,一个Data Agent若仅接收到“获取消费金额”的指令,在缺乏上下文和专业知识的情况下,难以准确识别该金额来自哪个系统、何种业务。这导致通用Agent在专业领域内面临指令翻译的准确性挑战。相比之下,A2A(Agent-to-Agent)协议则被认为是未来 Agent 间完整协作的关键,它能实现更深度的垂直Agent间通信,从而减少信息失真,但这需要对数据进行语义化的**Contextual Data Unit(CDU)**改造,投入巨大且专业性极强。1

  • 幻觉阴影与多智能体困境 底层大模型的“幻觉”问题,是Agent永远无法完全解决的根本缺陷。理论研究表明,大模型无法从根本上消除幻觉。在严肃的生产环境中,如自动编程或金融决策,一旦出现幻觉且缺乏有效控制,风险极高。专家指出,“过程幻觉”——即AI编造或虚报执行结果——在Agent产品中屡见不鲜,极大损害了其可靠性。1

    此外,被过度炒作的多智能体(Multi-Agent)系统在实际应用中也面临困境。尽管一些沙盒环境的游戏尝试了多智能体交互,但在大多数企业业务场景中,单或双智能体已能覆盖80%的需求。多智能体系统显著增加复杂度、容错设计难度、开发维护与算力成本,且不一定能提升效果,反而易导致系统不稳定、循环对话或信息丢失。1

  • 上下文之墙与智能上限之忧 基础模型能力的一大核心限制是上下文长度。尽管头部厂商宣称模型上下文达到数十万甚至上百万token,但实际体验中,模型准确率在几万token时就可能大幅下降,导致信息丢失,尤其在代码编写等复杂场景中构成“硬天花板”。这一瓶颈不仅源于模型本身,更与底层芯片架构(如显存、HBM带宽)紧密相关。国内在高端AI芯片上的“卡脖子”问题,使得长上下文处理面临更严峻挑战。1

    而近期GPT-5的发布被诟病“平庸”,也引发了对基础模型智能极限的担忧。专家认为,GPT-5通过“多模型路由”提升上限,可能预示着大模型“Scaling Law”(规模定律)在单模型上的高效提升已接近失效。这促使行业将重心转向Agent能力强化,以及大模型向垂直方向发展。这种“不高不低”的智能上限,使得“通用个人助理”所需的高信任度与大模型当前的低可靠性之间存在巨大鸿沟,导致C端用户无法长期留存。1

资本狂热与产业迷思:泡沫缘何而生

技术层面的诸多未解之谜,却未能阻挡资本对AI Agent的狂热追捧。这种背离实际可用性的投资热潮,映射出深层的资本逻辑和产业迷思。

  • “下一代OS”叙事的双刃剑 投资人普遍对“通往AGI的必经之路”、“下一代操作系统”等宏大叙事趋之若鹜。尤其在当前缺乏其他投资热点的情况下,Agent类项目成为“击鼓传花”的唯一选择。这种盲目信任和“你不投我就投”的竞争心理,使得项目的融资估值往往与实际产出效率脱钩,而更关注覆盖面、DAU/MAU等短期指标,从而助推了泡沫。1

    然而,通用型Agent的核心卖点是“解决所有问题”,这在当前技术条件下是无法实现的。用户发现产品“华而不实”后,自然难以留存。正如知言吉智CEO付瑞吉所言,Agent产品不同于内容类产品,不能只靠注意力,必须解决实际问题。1

  • 大模型厂商的降维打击 大模型能力的飞速迭代,对应用层的Agent创业公司构成了“降维打击”。基础模型厂商每次能力下沉,都会抹平通用层的一些差异,压缩了通用Agent的生存空间。OpenAI推出的AgentKit便是这一趋势的明证。业内普遍认为,介于模型层和垂直应用层之间的“薄弱工具层”公司,其竞争优势极其脆弱,很容易被模型厂商或垂直厂商挤压。例如,Cursor等编码Agent尽管交互体验良好,但缺乏生态绑定,一旦微软等大厂在其工具链中集成类似能力,其优势便会被稀释。1

  • 国内ToB生态的结构性痼疾 国内AI Agent泡沫呈现出与国外不同的特征:国外泡沫主要在C端,国内则几乎只存在于B端。1这背后隐藏着中国ToB SaaS市场的结构性痼疾:

    • 低SaaS普及率与割裂生态: 国内缺乏大型标准化软件公司,SaaS发展不成熟,企业多倾向自研,导致内部系统协议差异大,数据打通困难。这使得Agent难以标准化、规模化复制。
    • 高数据壁垒: 金融、医疗、政务等高价值行业数据壁垒极高,合规审核严格复杂,导致高质量垂直数据难以获取,进而影响国内大模型训练速度和垂直Agent发展。
    • “大厂作风”与封闭生态: 国内头部企业倾向于自建垂直Agent,而非开放合作,进一步压缩了创业公司切入核心场景的机会。
    • 投资缺乏耐心: 国内投资环境更追求短期回报,与垂直Agent所需的长期行业积累和客户教育周期不符。

    这些因素共同导致国内ToB Agent落地困难,可复制性低,使得许多创业公司转而投向ToC市场,或选择出海(如Manus迁至新加坡)以寻求更好的算力、合规与融资环境。然而,专家指出,ToC通用Agent的护城河在于大模型本身,这一生态位正被基础模型厂商提前占据,即便是出海也难以根本改变这一趋势。1

穿越周期:构建面向未来的智能体生存之道

面对喧嚣与挑战,Agent赛道亟需重新审视其核心价值与发展路径。穿越泡沫,生存下来的关键在于对行业本质的深刻理解和务实的落地策略。

  • 场景深度与行业Know-how:护城河的基石 无论是ToC还是ToB,真正的Agent不应是技术的一层薄壳,而应由具备深厚行业Know-how(知识和经验)的团队来打造。例如,飞书凭借其长期积累的知识库和体系化内容,在企业内部办公Agent场景中具备天然优势。未来能在Agent领域取得成果的,很可能不是纯粹的大模型厂商,而是原有的SaaS和工具型厂商,它们已在特定领域拥有数据积累和业务理解。1

  • 垂直大模型:精度、成本与合规的平衡 ToB企业对Agent的需求,将使其更倾向于使用垂直大模型。垂直模型参数量小,推理成本更低;其精准性和对企业生态的贴合度,能有效降低幻觉和人工校对成本;同时,垂直模型更易私有化部署,符合数据合规与隐私要求。在实际应用中,可通过**“垂直大模型覆盖80%-85%的高稳定性需求,通用大模型兜底15%-20%的复杂问题”**策略,实现可靠性与灵活性的平衡。1这呼应了企业级数据尽管总量不如互联网数据,但其“含金量”和“信息密度”远高于后者的价值评估。

  • Workflow与Agent的融合共舞 在当前Agent智能有限和幻觉无法完全解决的背景下,工作流(Workflow)与Agent的结合成为务实选择。Agent的核心在于利用LLM动态构建Workflow,但Workflow的静态、确定性对企业尤为重要。专家建议,应在小规模、局部的Workflow改造中嵌入Agent,优先选择流程高度标准化、数据流转清晰、任务输入输出明确的场景。例如,金融行业的贷款审批、合规比对等环节,Agent可作为辅助模块嵌入,而非颠覆整个业务系统。1

    更具启发性的是,未来的模式很可能是**“Agent + RAG + 传统Workflow(或RPA)”的组合**。Agent主要负责分工决策、需求挖掘和思路设计,而实际执行阶段则由确定性更强的Workflow(甚至不涉及RAG)来完成。这种模式能在保证确定性的前提下,利用Agent进行深度、多轮、渗透式的用户交互,解决传统软件难以实现的“明确需求”痛点,从而实现数倍的效率提升。1

  • 高价值核心场景的聚焦 无论是ToC还是ToB,Agent产品必须解决用户的核心痛点,才能激发付费意愿并推动大规模部署。在ToB领域,当前最迫切的Agent应用场景包括:

    1. 跨系统任务编排与自动化: 通过自然语言连接ERP、CRM、知识库等业务系统,实现可视化编排与审批。
    2. 高可信度的知识问答与决策: 提供具备引用溯源、版本控制和权限分级的企业级知识问答。
    3. Data Agent(ChatBI): 半自动或全自动数据分析与报告生成,理解企业BI数据模型,自动编写SQL并输出可视化报表。1

    这些场景需要训练或定制垂直化模型,以适应企业特有的语言体系、业务生态和流程规范。创业公司应选择“长尾”场景作为切入点,这些场景需求独特、痛点尖锐,用户对解决方案的不完美有更高容忍度,且能更容易形成专业化数据壁垒,如Figma和Zoom最初深耕某一点并逐步扩展的路径。1

展望:泡沫洗礼下的智能体进化之路

当前的AI Agent泡沫,是任何颠覆性新技术发展必然经历的阶段:泡沫化、幻灭与出清,随后是长期务实的渗透与融合。我们正处在泡沫化的中期,幻灭初显,出清尚早。1

从长远来看,行业终将迈向**“无处不在的Agent时代”**。几乎所有软件和App都会嵌入模型,成为某种形式的Agent。这一过程可能需要5到10年,在此之前,专业领域的专业型Agent将率先落地并发挥作用。

值得警惕的是,在AGI/ASI真正到来之前,基于大模型的智能体的胜利,极大概率不属于那些试图用一个通用Agent解决所有问题的“平台”公司,而属于那些能将Agent作为一种能力与业务深度融合,开发出该领域具备智能决策和自然语言交互的专业软件公司。 泡沫并非一无是处,真正的长期主义者反而能借助泡沫的力量生长,但唯有回答“为谁而作、在何处用、以何种方式稳态运行”这三个基本问题,才能穿越喧嚣,走向可复用的现实,塑造人类文明的未来图景。

引用


  1. 几乎都在挂羊头卖狗肉,AI Agent的泡沫现在到底有多大?·新浪·王文广, 王显, 张森森, 郭炜, 薛赵明, 付瑞吉, 陈为, 王楠, 李峰等(未知)·检索日期2024/07/28 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎