从云基建到智能体平台:AWS re:Invent 2025揭示的计算范式深层巨变

温故智新AIGC实验室

TL;DR:

AWS re:Invent 2025标志着云计算正从基础设施转向以智能体为核心的“推理计算”新范式。通过Amazon Bedrock、AgentCore与自研芯片的深度整合,AWS旨在构建一个企业级AI执行与决策平台,深刻重塑产业生态、开发者职能及商业价值,预示着一个智能体驱动的未来。

在拉斯维加斯的AWS re:Invent 2025现场,云计算巨头AWS的战略重心转移,不仅是技术层面的迭代,更是一场深刻的计算范式革命的预演。AWS CEO Matt Garman在主题演讲中将“云计算”部分的篇幅显著压缩,这并非偶然,而是对未来技术格局的明确宣示:我们正在从传统云计算时代迈向一个**“智能体 + 推理平台”**的全新纪元。云不再仅仅是提供算力和存储的基础设施,而是企业智能体执行与决策的神经中枢。

技术原理与创新点解析:推理计算的崛起

这一范式转变的核心在于“推理计算”(Inference Computing)的崛起。传统云计算侧重于通用计算和数据存储,而推理计算则专注于高效、大规模地运行AI模型,尤其是生成式AI的推理工作负载。为了支撑这一转变,AWS在软件与硬件层面都进行了深远的创新布局:

  • Amazon Bedrock的全面升级:企业级AI开发平台成型 Amazon Bedrock经过两年的迭代,正快速成为企业AI开发的默认平台。其核心创新在于:

    • 多模型整合与全球化视野: Bedrock目前支持多达17个主流模型,其中约25%来自中国,包括通义千问、DeepSeek,以及新加入的Kimi和MiniMax1。这种多元化的模型支持,为企业提供了前所未有的灵活性和选择空间,降低了模型选型和集成的复杂性。
    • AgentCore的深度融合与记忆能力: AI不再仅限于回答问题,而是能够真正执行复杂的业务任务。Amazon Bedrock AgentCore在本次升级中不仅加入了Policy与Evaluations功能,显著增强了企业级安全、审计和治理能力,更引入了_AgentCore Memory_,使其能够管理短期和长期记忆,实现更智能、更个性化的交互,并支持可扩展的记忆管理方案23。这使得智能体能够基于历史上下文进行推理和决策,从“表演化”走向真正的“可用、可落地”。
    • 自研芯片的底层驱动: Amazon Trainium(训练)和Amazon Inferentia(推理)芯片的持续优化,是Bedrock高效运行的关键。最新的Trainium3 UltraServers提供了约40%的性能提升,大幅降低了推理成本,让企业能够以更低的成本“用得起、跑得稳”AI应用4。这体现了AWS在AI时代坚持软硬件一体化设计的战略优势,确保了极致的性价比和性能。
  • 智能体:下一代应用的核心 Amazon Bedrock AgentCore不仅是多步推理和工具调用的运行时框架,它更代表着企业级智能体落地的关键。通过安全策略、评估机制,以及对_ReAct循环_(reasoning and acting loop)的深层支持,AgentCore使智能体开发能够强调安全、规范和可审计性,如同企业需要为Agent进行“年检”一样,形成持续运维的模式35。此外,AWS还推出了能够自主工作数天的“Frontier Agents”,以及Nova模型系列(Nova Forge用于构建模型,Nova Act用于构建代理),进一步丰富了智能体的能力边界1

产业生态与商业版图重塑:从IaaS到AaaS的进化

AWS的战略转向,不仅是技术创新,更是对整个云计算产业生态和商业版图的深度重塑。

  • “AI即服务”(AaaS)的战略锚定: AWS正试图将Bedrock打造成像当年EC2一样的核心业务,通过提供端到端的AI开发与部署平台,吸引海量企业客户。Amazon CEO Andy Jassy曾指出,Trainium3与Bedrock将成为AWS领先的推理引擎,其业务规模有望与EC2比肩4。这预示着云计算的价值捕获将从基础资源租赁,转向更上层的智能服务和Agent平台。
  • 企业级AI的普及化: 通过AgentCore的安全、可审计和可扩展性,AWS旨在解决企业在实际部署智能体时最关心的痛点——安全与管控。这正是推动AI从少数巨头“特权”走向所有企业“生产力工具”的关键一步。AWS AI Factories的推出,也支持客户在其现有数据中心内实现高性能AI基础设施,进一步降低了企业拥抱AI的门槛1
  • 开发者角色的演进: 伴随智能体的兴起,开发者需要具备的新能力也随之浮现。从传统的Prompt Engineering(提示工程)到更复杂的Agent Engineering(智能体工程)的转变,要求开发者不仅要理解架构,更要深入理解业务逻辑和产品需求。Spec-Driven Development(规范驱动开发)开始显现价值,它能让复杂系统开发变得可控、可验证,与“Vibe Coding”形成互补。这标志着开发者将从单纯的“敲代码”向更上层的“逻辑思维”迈进,成为业务与技术融合的枢纽。

智能体时代的哲学思辨与社会影响:走向何方?

智能体和推理计算的崛起,不仅改变了技术和商业,更将对社会结构、工作方式和人类文明进程产生深远影响。

  • 自主系统的伦理与治理: 智能体具备自主执行任务的能力,AgentCore的Policy与Evaluations功能虽然是第一步,但远不足以完全解决随之而来的伦理挑战,例如决策透明度、责任归属、潜在偏见和误用风险。我们如何“给Agent做年检”,制定持续运维的模式,将是未来AI治理的核心议题。这不仅是技术问题,更是法律、伦理、社会学等多学科交叉的复杂命题。
  • 未来工作与人类技能重塑: 自动化一定会到来,但它并非要取代人类,而是放大人类的能力。面对智能体将接管更多重复性和部分复杂任务的未来,人类的核心竞争力将更多地转向计算思维、批判性思考、创造性解决问题以及跨领域协作能力。开发者需要走出敲代码的舒适区,向上层逻辑思维迈进,这不仅是对专业技能的要求,更是对思维模式和学习能力的挑战。
  • AI民主化的愿景: AWS的愿景是让AI不再是少数巨头的特权,而是所有企业都能用的生产力工具。这不仅关乎技术普及,更关乎创新生态的活力和全球经济的普惠性。一个真正普惠的AI时代,将能够赋能更多中小企业,激发前所未有的创新浪潮,从而对社会经济结构带来长期的正向影响。

展望2026年的re:Invent,我们期待AWS能像当年Serverless工程化、普及化一样,让Agent真正从“表演化”走向“可用、可落地”。这需要技术提供方与开发者、企业用户共同努力,在技术创新、商业模式、伦理治理和人才培养等多个维度持续探索。亲身参与和体验,正如作者所呼吁的,是理解并抓住这波行业变革浪潮的关键。智能体驱动的未来已然临近,它将重新定义我们的工作、生活乃至思考方式。

引用


  1. AWS re:Invent 2025: Amazon announces Nova 2, ... · About Amazon News · (2025/12/5) · 检索日期2025/12/5 ↩︎ ↩︎ ↩︎

  2. AWS re:Invent 2025 - Make agents remember with Amazon ... · AWS Events · (2025/12/2) · 检索日期2025/12/5 ↩︎

  3. AWS re:Invent 2025 - Architecting scalable and secure agentic ... · AWS Events · (2025/12/2) · 检索日期2025/12/5 ↩︎ ↩︎

  4. AWS re:Invent 2025 to feature Trainium3, scaling secure AI ... · Constellation Research · (2025/12/5) · 检索日期2025/12/5 ↩︎ ↩︎

  5. 从云计算到推理计算:我在 AWS re:Invent 2025 的观察与思考 · 知乎专栏 · 作者姓名不详 · (2025/12/5) · 检索日期2025/12/5 ↩︎