幽灵光标:OpenAI入局揭示AI Agent重塑万亿互联网流量与商业新范式

温故智新AIGC实验室

TL;DR:

OpenAI发布ChatGPT Agent标志着通用AI Agent赛道的全面开启,预示着互联网流量入口将从人类用户转向AI智能体。这场技术与商业的交锋不仅涉及四大核心技术流派的竞争,更将深刻颠覆现有广告模式,重塑数字经济的底层逻辑,成为下一个万亿级别市场的战略高地。

2024年7月17日,OpenAI正式推出了ChatGPT Agent,高调进军通用AI Agent赛道,引发了业界震动。这一举动,被不少观察者解读为在GPT-5发布前的“占位”之举,意在抢占被视为“下一代互联网万亿流量入口”的通用Agent高地,其战略意义不亚于当年智能手机之于移动互联网。随着“幽灵光标”——即AI智能体驱动的互联网访问——逐渐成为主流,一场关于技术范式、商业模式乃至社会互动方式的深层变革已然拉开序幕。

技术范式:AI Agent的演进与核心流派

通用AI Agent的核心诉求在于赋予AI模型更强的自主性、任务执行能力和与现实世界交互的能力。目前,围绕这一目标,业界已形成了四大主流技术流派,各有侧重,并面临着“通用性”与“效率/稳定性”的根本性权衡:

  1. 浏览器为主派(Browser-based):以OpenAI的ChatGPT Agent(整合Deep Research和Operator)为代表。

    这类Agent通过视觉模型模拟人类操作浏览器,实现全网信息搜索、点击、浏览和任务执行。其优点在于通用性极强,理论上可访问和操作互联网上所有可见内容。然而,其致命缺陷是速度慢且Token消耗高昂,因为每次交互都需要进行屏幕截图、图像识别和页面加载,导致效率低下。尽管OpenAI拥有更强大的视觉模型和浏览器操作能力,但速度瓶颈仍是当前主要挑战。

  2. 虚拟机+浏览器派(VM + Browser):以Manus公司为代表。

    这类Agent将大模型与隔离的“沙盒虚拟机”环境相结合,允许AI在虚拟电脑中自由上网、运行代码、读写文件,以执行复杂任务。沙盒提供了高度的安全性与本地执行效率,AI可以像人类一样在其中编程、计算。Manus通过优化沙盒环境,并结合了浏览器技术,力求打造一个“几乎万能”的体验。其优势在于能够执行更复杂的本地操作,但同样面临速度限制和外部服务(如需完整授权的社交媒体登录)访问受限的问题。Manus的成功融资(7500万美元,估值近5亿美元)也印证了市场对其潜力的认可。

  3. 大模型+虚拟机派(LLM + Sandbox):以GensPark公司为代表。

    该流派强调大语言模型(LLM)与有限且高效的“沙盒”工具环境的结合。不同于开放式虚拟机,它为AI提供的是预先构建和测试好的工具箱(如80多个API接口),由LLM作为中枢进行调度。

    **Nathan Wang(硅谷101特约研究员)**指出:“GensPark给我的印象比较突出的就是,它会接很多第三方的工具,或者是各种API。比如说它其实很多时候它会说,你只要把你LinkedIn的访问权限给到我,我可以通过这个large language model直接登录你LinkedIn的账户,帮你去生成一个LinkedIn的帖子。”1

    这意味着它牺牲了一部分通用性,换取了更高的速度和稳定性,更适用于标准化、场景化的工作流任务。GensPark近期获得1亿美元A轮融资,估值达5.3亿美元,显示了资本市场对这种“专精”路线的青睐。

  4. 工作流+工具集成派(Workflow + Tool Integration):以Pokee、Zapier、UiPath为代表。

    此流派的核心是将预先设计好的任务流程(工作流)与第三方应用或API深度集成。AI主要负责理解用户请求、填充参数,并自动执行这些既定流程,或通过强化学习优化工具调用。

    **Bill Zhu(Pokee.ai创始人)**表示:“能够实现这一优势的原因在于,我们不再需要使用复杂的虚拟机环境,也无需依赖复杂的tool calling。我们直接使用第三方集成的SDK和工具,通过自研的工具调用基础模型来调用这些功能的话,整个速度是会大幅度提升的。”1

    优势在于速度极快,交付质量可靠,且token使用成本大幅降低。但缺点是通用性最差,仅限于其集成的特定任务和工具。

目前的共识是,通用性和效率/稳定性难以兼得。OpenAI和Manus倾向于追求通用性,而GensPark和Pokee则侧重于特定任务的效率和可靠性。

商业格局:万亿流量入口的重塑与巨头竞逐

AI Agent的崛起,预示着互联网流量入口将发生一次根本性的范式转移。Wired杂志的观点——未来互联网将充斥着“幽灵光标”2——并非危言耸听。当AI Agent而非人类成为访问互联网的主力军时,“流量”这一概念的传统定义将被颠覆,其市场价值将从“人眼可见”转向“Agent可达”。

**Bill Zhu(Pokee.ai创始人)**预言:“无法避免的是,我认为在接下来一到两年,大多数门户网站的流量都将快速下降,无论是电子商务、搜索引擎、视频网站还是其他各类门户网站,它们的流量入口都将变成各个方向的Agent。”1

这将引爆一场新的“万亿流量入口之战”。掌握Agent入口的平台将拥有前所未有的控制力。Google已推出Agent2Agent(A2A)协议,旨在为Agent之间的交互建立标准,并试图通过在Gemini中率先部署来占据主导。OpenAI和Claude等巨头亦在积极布局,目的皆在于争夺这一战略制高点。

这场流量入口的争夺,不仅是技术实力的比拼,更是产业生态话语权的角逐。它将决定未来数字世界的权力结构,并可能催生新的巨头。

社会与伦理:AI Agent时代的深层变革

AI Agent不仅重塑商业,更将深远影响社会结构和伦理层面。

首先是广告模式的颠覆性变革。传统的基于眼球和点击率的广告模式将面临挑战。当“幽灵光标”而非真人浏览网页时,广告不再需要承担“流量”的责任。

**Bill Zhu(Pokee.ai创始人)**展望了一种新的盈利模式:“每当Agent通过调用或网页访问获取播客信息时,都需要向内容创作者付费。创作者不再需要承担广告流量的责任,广告将由Agent完成。”1

Agent在向用户提供对比选择或整合信息时,可以通过排名机制,向被推荐的Agent公司收取广告费。此外,内容知识产权和第三方API/插件本身将直接具备商业价值。这种转变对于创作者和SaaS生态而言,可能意味着一个更为直接和友好的商业环境,摆脱对传统广告平台的过度依赖。

其次是安全与伦理挑战。AI Agent的自主性越强,其带来的潜在风险也越大。

**Sam Altman(OpenAI CEO)**警示:“虽然这(AI Agent)是一项极其令人兴奋的新技术,但它也带来了新的风险。人们已经大致学会了如何相对安全地使用互联网……而未来人们同样需要学习如何使用AI Agents。社会也需要建立针对AI Agents攻击的防御机制。”1

Agent可能被恶意利用进行大规模信息抓取、自动化诈骗,甚至引发新的网络安全问题。社会需要建立新的防御机制和用户适应模式,这将是一个渐进且复杂的学习过程,涉及技术、法规和伦理规范的同步演进。

前瞻洞察:Agent生态的未来图景

AI Agent的发展,正从追求“通用性”的广度,转向“可靠性”和“场景化”的深度。未来几年,我们很可能看到两种趋势并行不悖:

  1. 细分与专精的Agent市场:针对特定行业、特定任务的专业Agent将加速成熟,它们通过更封闭的环境和更可靠的工具集成,提供高效、精准的解决方案。这在ToB领域尤其明显,能快速实现商业价值。
  2. 通用Agent的持续演进:以OpenAI为代表的巨头将继续在大模型的优化、多模态能力的增强以及Token效率的提升上发力,试图克服通用Agent的速度和稳定性瓶颈,实现真正的“万能”。这需要算法、算力和交互范式的多重突破。

最终的Agent生态可能是一个多层级、互操作的复杂系统:基础的通用Agent提供广泛的互联网访问和高阶决策能力,而更专业的Agent则在特定领域内提供极致的性能和可靠性。Agent-to-Agent(A2A)协议的普及将成为关键基础设施,促进不同Agent之间的无缝协作。

这场由AI Agent驱动的互联网重构,其影响将远超技术和商业范畴。它将挑战我们对“数字互动”和“信息获取”的固有认知,推动人类文明进入一个由智能体协同塑造的全新时代。理解并积极应对这一变革,是当前科技界、产业界乃至全社会共同的挑战与机遇。

引用


  1. OpenAI杀入通用AI Agent的背后:四大技术流派与下一个万亿流量之战 · 虎嗅 · 朱哲清, Nathan Wang (2025/8/3) · 检索日期2025/8/3 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. “幽灵光标”爆发在即?从OpenAI杀入通用AI Agent,看懂下一个万亿 ... · YouTube · 硅谷101 (2025/8/3) · 检索日期2025/8/3 ↩︎