幽灵光标：OpenAI入局揭示AI Agent重塑万亿互联网流量与商业新范式

TL;DR：

OpenAI发布ChatGPT Agent标志着通用AI Agent赛道的全面开启，预示着互联网流量入口将从人类用户转向AI智能体。这场技术与商业的交锋不仅涉及四大核心技术流派的竞争，更将深刻颠覆现有广告模式，重塑数字经济的底层逻辑，成为下一个万亿级别市场的战略高地。

2024年7月17日，OpenAI正式推出了ChatGPT Agent，高调进军通用AI Agent赛道，引发了业界震动。这一举动，被不少观察者解读为在GPT-5发布前的“占位”之举，意在抢占被视为“下一代互联网万亿流量入口”的通用Agent高地，其战略意义不亚于当年智能手机之于移动互联网。随着“幽灵光标”——即AI智能体驱动的互联网访问——逐渐成为主流，一场关于技术范式、商业模式乃至社会互动方式的深层变革已然拉开序幕。

技术范式：AI Agent的演进与核心流派

通用AI Agent的核心诉求在于赋予AI模型更强的自主性、任务执行能力和与现实世界交互的能力。目前，围绕这一目标，业界已形成了四大主流技术流派，各有侧重，并面临着“通用性”与“效率/稳定性”的根本性权衡：

浏览器为主派（Browser-based）：以OpenAI的ChatGPT Agent（整合Deep Research和Operator）为代表。

这类Agent通过视觉模型模拟人类操作浏览器，实现全网信息搜索、点击、浏览和任务执行。其优点在于通用性极强，理论上可访问和操作互联网上所有可见内容。然而，其致命缺陷是速度慢且Token消耗高昂，因为每次交互都需要进行屏幕截图、图像识别和页面加载，导致效率低下。尽管OpenAI拥有更强大的视觉模型和浏览器操作能力，但速度瓶颈仍是当前主要挑战。
虚拟机+浏览器派（VM + Browser）：以Manus公司为代表。

这类Agent将大模型与隔离的“沙盒虚拟机”环境相结合，允许AI在虚拟电脑中自由上网、运行代码、读写文件，以执行复杂任务。沙盒提供了高度的安全性与本地执行效率，AI可以像人类一样在其中编程、计算。Manus通过优化沙盒环境，并结合了浏览器技术，力求打造一个“几乎万能”的体验。其优势在于能够执行更复杂的本地操作，但同样面临速度限制和外部服务（如需完整授权的社交媒体登录）访问受限的问题。Manus的成功融资（7500万美元，估值近5亿美元）也印证了市场对其潜力的认可。
大模型+虚拟机派（LLM + Sandbox）：以GensPark公司为代表。

该流派强调大语言模型（LLM）与有限且高效的“沙盒”工具环境的结合。不同于开放式虚拟机，它为AI提供的是预先构建和测试好的工具箱（如80多个API接口），由LLM作为中枢进行调度。

**Nathan Wang（硅谷101特约研究员）**指出：“GensPark给我的印象比较突出的就是，它会接很多第三方的工具，或者是各种API。比如说它其实很多时候它会说，你只要把你LinkedIn的访问权限给到我，我可以通过这个large language model直接登录你LinkedIn的账户，帮你去生成一个LinkedIn的帖子。”¹

这意味着它牺牲了一部分通用性，换取了更高的速度和稳定性，更适用于标准化、场景化的工作流任务。GensPark近期获得1亿美元A轮融资，估值达5.3亿美元，显示了资本市场对这种“专精”路线的青睐。
工作流+工具集成派（Workflow + Tool Integration）：以Pokee、Zapier、UiPath为代表。

此流派的核心是将预先设计好的任务流程（工作流）与第三方应用或API深度集成。AI主要负责理解用户请求、填充参数，并自动执行这些既定流程，或通过强化学习优化工具调用。

**Bill Zhu（Pokee.ai创始人）**表示：“能够实现这一优势的原因在于，我们不再需要使用复杂的虚拟机环境，也无需依赖复杂的tool calling。我们直接使用第三方集成的SDK和工具，通过自研的工具调用基础模型来调用这些功能的话，整个速度是会大幅度提升的。”¹

其优势在于速度极快，交付质量可靠，且token使用成本大幅降低。但缺点是通用性最差，仅限于其集成的特定任务和工具。

目前的共识是，通用性和效率/稳定性难以兼得。OpenAI和Manus倾向于追求通用性，而GensPark和Pokee则侧重于特定任务的效率和可靠性。

商业格局：万亿流量入口的重塑与巨头竞逐

AI Agent的崛起，预示着互联网流量入口将发生一次根本性的范式转移。Wired杂志的观点——未来互联网将充斥着“幽灵光标”²——并非危言耸听。当AI Agent而非人类成为访问互联网的主力军时，“流量”这一概念的传统定义将被颠覆，其市场价值将从“人眼可见”转向“Agent可达”。

**Bill Zhu（Pokee.ai创始人）**预言：“无法避免的是，我认为在接下来一到两年，大多数门户网站的流量都将快速下降，无论是电子商务、搜索引擎、视频网站还是其他各类门户网站，它们的流量入口都将变成各个方向的Agent。”¹

这将引爆一场新的“万亿流量入口之战”。掌握Agent入口的平台将拥有前所未有的控制力。Google已推出Agent2Agent（A2A）协议，旨在为Agent之间的交互建立标准，并试图通过在Gemini中率先部署来占据主导。OpenAI和Claude等巨头亦在积极布局，目的皆在于争夺这一战略制高点。

这场流量入口的争夺，不仅是技术实力的比拼，更是产业生态话语权的角逐。它将决定未来数字世界的权力结构，并可能催生新的巨头。

社会与伦理：AI Agent时代的深层变革

AI Agent不仅重塑商业，更将深远影响社会结构和伦理层面。

首先是广告模式的颠覆性变革。传统的基于眼球和点击率的广告模式将面临挑战。当“幽灵光标”而非真人浏览网页时，广告不再需要承担“流量”的责任。

**Bill Zhu（Pokee.ai创始人）**展望了一种新的盈利模式：“每当Agent通过调用或网页访问获取播客信息时，都需要向内容创作者付费。创作者不再需要承担广告流量的责任，广告将由Agent完成。”¹

Agent在向用户提供对比选择或整合信息时，可以通过排名机制，向被推荐的Agent公司收取广告费。此外，内容知识产权和第三方API/插件本身将直接具备商业价值。这种转变对于创作者和SaaS生态而言，可能意味着一个更为直接和友好的商业环境，摆脱对传统广告平台的过度依赖。

其次是安全与伦理挑战。AI Agent的自主性越强，其带来的潜在风险也越大。

**Sam Altman（OpenAI CEO）**警示：“虽然这（AI Agent）是一项极其令人兴奋的新技术，但它也带来了新的风险。人们已经大致学会了如何相对安全地使用互联网……而未来人们同样需要学习如何使用AI Agents。社会也需要建立针对AI Agents攻击的防御机制。”¹

Agent可能被恶意利用进行大规模信息抓取、自动化诈骗，甚至引发新的网络安全问题。社会需要建立新的防御机制和用户适应模式，这将是一个渐进且复杂的学习过程，涉及技术、法规和伦理规范的同步演进。

前瞻洞察：Agent生态的未来图景

AI Agent的发展，正从追求“通用性”的广度，转向“可靠性”和“场景化”的深度。未来几年，我们很可能看到两种趋势并行不悖：

细分与专精的Agent市场：针对特定行业、特定任务的专业Agent将加速成熟，它们通过更封闭的环境和更可靠的工具集成，提供高效、精准的解决方案。这在ToB领域尤其明显，能快速实现商业价值。
通用Agent的持续演进：以OpenAI为代表的巨头将继续在大模型的优化、多模态能力的增强以及Token效率的提升上发力，试图克服通用Agent的速度和稳定性瓶颈，实现真正的“万能”。这需要算法、算力和交互范式的多重突破。

最终的Agent生态可能是一个多层级、互操作的复杂系统：基础的通用Agent提供广泛的互联网访问和高阶决策能力，而更专业的Agent则在特定领域内提供极致的性能和可靠性。Agent-to-Agent（A2A）协议的普及将成为关键基础设施，促进不同Agent之间的无缝协作。

这场由AI Agent驱动的互联网重构，其影响将远超技术和商业范畴。它将挑战我们对“数字互动”和“信息获取”的固有认知，推动人类文明进入一个由智能体协同塑造的全新时代。理解并积极应对这一变革，是当前科技界、产业界乃至全社会共同的挑战与机遇。

引用

OpenAI杀入通用AI Agent的背后：四大技术流派与下一个万亿流量之战 · 虎嗅 · 朱哲清, Nathan Wang (2025/8/3) · 检索日期2025/8/3 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
“幽灵光标”爆发在即？从OpenAI杀入通用AI Agent，看懂下一个万亿 ... · YouTube · 硅谷101 (2025/8/3) · 检索日期2025/8/3 ↩︎