AI智能体协议标准之争:中国AIoT万亿市场,于封闭与开放间重塑数字未来

温故智新AIGC实验室

TL;DR:

中国AIoT市场正面临GUI智能体路径的瓶颈与平台排异,而硅谷已通过开放协议构建新一代互联标准。未来万亿AIoT市场的核心在于互操作性,中国亟需建立自主且开放的智能体互联协议,并推动超级应用服务原子化,以避免被边缘化或被动定义。

过去数周,中国与硅谷在AI智能体发展路径上展现了截然不同的战略取向,这不仅关乎技术路线的优劣,更触及万亿级AIoT市场的未来走向与数字主权的核心。一边是字节跳动“豆包手机”的受挫,被国内互联网巨头集体“免疫排异”;另一边则是Anthropic将MCP(模型上下文协议)捐赠Linux基金会,与OpenAI、Google等硅谷巨头共同构建开放的AI智能体互联标准。这两件事犹如一面镜子的两面,映照出当前AI发展最深层的矛盾——是选择碎片化的“数字寄生”,还是走向开放共建的“协议正规军”?

中国模式的困境:GUI智能体的“数字寄生”与平台“免疫排异”

豆包手机助手的遭遇,并非偶然的技术失误,而是对现有数字生态边界的“野蛮冲击”所引发的必然反弹。其采用的GUI智能体路线,本质上是让AI通过视觉识别模拟点击来操作应用界面。这种方法看似绕过了API接口壁垒,实则是一种未经授权的“数字寄生”。它侵犯了平台的数据主权流量秩序,被微信、淘宝、甚至银行视为“登录环境异常”或“风险行为”,导致账号冻结、功能受限,乃至被彻底封杀1

从技术层面看,GUI智能体路线存在致命缺陷。它依赖于应用的表皮(UI界面),一旦应用更新,按钮位置、界面布局的微小调整都可能导致智能体“失明”,使整个系统变得脆弱不堪。在手机等更新频繁的设备上尚可勉强维持,但对于更广泛、更新周期不确定的AIoT设备,如智能冰箱、智能音箱等,这种基于“破解”和“模拟”的生态将是灾难性的。这种“黑客式”的交互,不仅效率低下,且法律合规性存疑,注定是一条死胡同

硅谷的破局之道:开放协议构建AI时代的“TCP/IP”

与中国市场形成鲜明对比的是,硅谷正在通过联盟与协议来终结这种混乱。由Linux基金会牵头成立的AI智能体基金会(AAIF),汇聚了AWS、谷歌、Meta、OpenAI和Anthropic等曾激烈竞争的巨头。促成这一“握手”的深层逻辑在于:在智能体时代,单一模型的智力优势已触及天花板,而互操作性正成为真正的“卡脖子”环节。如果每个AI都要为成千上万个SaaS应用单独开发适配接口,其边际成本将高到无法承受。

“巨头们算清楚了:互操作性释放的生态价值,远大于封闭系统带来的垄断红利。与其各自修护城河,不如合力把蛋糕做大。”

这个共识的第一个产物,便是Anthropic捐赠的MCP(Model Context Protocol)。MCP旨在统一大模型与外部数据源及工具的连接标准,将模型端与数据端解耦,实现“一个接口,通吃所有数据源”2。此外,OpenAI贡献的AGNTS.md提供了AI阅读的“用户手册”,明确应用的数据可读性与API调用规则;谷歌则捐赠了A2A(Agent-to-Agent)协议等,提供构建智能体和工作流的通用执行框架。

这套组合拳的意图清晰:将智能体的交互模式从“打游击”升级为**“正规军”。它不再依赖模拟点击,而是通过标准化的API管道直达核心数据,路径清晰、权责分明。硅谷正在制定的,是AI世界的基础通信协议**,正如TCP/IP定义了互联网的数据传输规则,MCP及相关协议试图定义AI理解和操作外部世界的通用语言

互操作性:万亿AIoT市场规模化落地的核心瓶颈

中国在“人工智能+”行动意见中设定了雄心勃勃的目标:到2027年,新一代智能终端、智能体普及率超过70%1。然而,若缺乏统一的互联协议,小米的空调听不懂百度的指令,华为的手机调不动阿里的服务,所谓的“普及”将沦为一堆无法互联的孤岛。这种碎片化正是AIoT规模化落地的最大障碍。

当前,中国市场硬件厂商忙于构建封闭的“设备全家桶”,互联网巨头死守数据不外流,各方都在加固堡垒,导致整个生态被切成碎片。这种内部割裂,正面临硅谷以开放标准确立统一战线的外部挤压。中国AIoT产业正站在一个关键的十字路口,面临两大陷阱:

  1. 直接照搬MCP:在数据主权敏感、技术脱钩加深的背景下,拱手让出底层交互协议的定义权,将带来深远的地缘政治和技术安全隐患。
  2. 各自为战:阿里、腾讯、华为等各自为政,不仅耗费巨量开发成本,拖慢产品迭代,更将整个行业拖入内耗,最终错失战略机遇。

中国AIoT的战略抉择:被定义还是自我定义?

标准真空不会永远存在。摆在中国AIoT产业面前的,是要么自己定义规则,要么被别人的规则定义的严峻选择。建立一套中国自己的智能体互联协议(例如CN-MCP)已是刻不容缓。然而,最大的障碍并非技术,而是谁来牵头。任何一家巨头主导的标准,都难以获得全行业的普遍信任。唯一的破局之道,是由国家级产业联盟或中立的开源基金会出面,以公信力打破门户壁垒,凝聚全行业共识。

开放与原子化:面向AI时代的超级应用重构

即便解决了牵头问题,中国的CN-MCP也不能照搬美国模式,因为生态结构存在显著差异。美国的互联网以Web和SaaS为主导,智能体可通过API直接抓取网页数据。而中国服务高度集中于微信、抖音、美团等超级APP,功能被封装在小程序和原生应用的“黑盒”中,外部难以触达。

因此,CN-MCP要解决的不仅是“连接”问题,更是“服务原子化”问题。这意味着不能再让AI依赖模拟点击去操作APP。真正的出路在于推动超级APP将内部功能拆解成可被外部调用的标准化接口。美团的订餐、携程的服务、微信的聊天、12306的购票,都应成为AIoT设备可直接调用的“原子服务”。

这需要多方共同努力:

  • 政府层面:应将智能体互联标准提升至新基建的高度,将其视为数字经济的底层管道。没有统一的交互协议,AIoT产业的规模化落地就是空谈。
  • 互联网巨头:必须重新审视“封闭”的战略。移动互联网时代,封闭或许能锁住流量;但AI时代,封闭即是自我边缘化。如果其服务无法被智能体读取和调用,在未来的物联网世界中将是“隐形”的。开放接口,让APP成为AIoT的底层基础设施,才是延续生命力的唯一选择。

写在最后

豆包手机的遭遇,并非产品层面的失败,而是路径选择的失败。它所撞上的巨头封锁、接口缺失、生态割裂之墙,正是现有秩序对未经授权“入侵”的必然反应。然而,这堵墙并非坚不可摧。GUI智能体作为新旧协议空窗期的过渡方案,终将被通用协议取代。届时,服务将像水电一样通过标准管道流向终端,AIoT设备不再需要预装海量APP,硬件将回归感知与交互的本质,服务则按需调用,即时抵达。

互联网时代的核心是连接人,而智能体时代的核心是连接万物与服务。谁掌握了连接的标准,谁就掌握了下一个十年的底层规则。这场关乎数字主权、产业未来和生态价值的标准之争,中国不能,也不应旁观。

引用


  1. AI版「互联网协议」面世,豆包手机们再也不怕被「封禁」了?·36氪·彭昭(2023/12/10)·检索日期2025/12/16 ↩︎ ↩︎

  2. MCP协议捐赠开源基金会,Anthropic推动智能体新标准·Jimo Studio·未知(2023/12/10)·检索日期2025/12/16 ↩︎