AI早报 2025年09月17日

温故智新AIGC实验室

今天是2025年09月17日。今日AI前沿动态聚焦智能体能力的里程碑式飞跃,从长程任务执行到自主编程、科学攻关及经济活动,AI正以前所未有的速度重塑行业边界与未来图景。

  1. 大模型长程执行突破: 新研究挑战AI“收益递减”论,揭示单步准确率微小提升能带来任务长度指数级增长,GPT-5 Horizon思考模型已实现千步级任务执行,重塑AI Agent经济价值。
  2. ChatGPT全民化报告: OpenAI报告显示ChatGPT全球周活用户达7亿,73%为非工作用途,正从工具转向个人生活助手,创造巨大经济价值并重塑信息获取模式。
  3. GPT-5-Codex自主编程: OpenAI发布GPT-5-Codex,以突破性“智能体编程”能力,实现7小时独立复杂任务处理和动态思考,将AI从编程助手推向自主开发者,重塑软件工程。
  4. GPT-5-Codex动态思考: GPT-5-Codex核心突破是“动态思考”能力,能根据任务复杂性调整推理资源,简单任务提速10倍,复杂任务深入分析,强化其作为自主软件工程代理的能力。
  5. AI攻克物理奥赛: 普林斯顿Physics Supernova智能体在国际物理奥赛理论题中超越人类金牌选手平均分,标志AI在复杂科学推理与现实理解上的重大突破,预示“AI for Science”的深远潜力。
  6. 夸克健康大模型基准: 夸克健康大模型通过国内全阶段医师资格考试并开放评测基准,其“慢思考”能力提升医疗AI推理准确性,为行业树立权威基准,加速智能医疗发展。
  7. AI记忆“睡眠计算”: AI智能体引入“睡眠计算”机制,模仿人类大脑整理记忆,克服大模型“金鱼记忆”,实现长期记忆管理和个性化,并引发AI“人工遗忘”的伦理思考。
  8. AI Agent经济层涌现: 谷歌DeepMind预见AI Agent正形成独立协作与交易的“沙盒经济层”,MuleRun已上线数字劳动力市场,预示商业模式与工作范式将深刻变革。
  9. PayPal Agentic AI战略: PayPal通过Agentic AI和MCP Server转型为智能商务基础设施,赋能AI代理自主管理和执行交易,重塑跨境支付与数字零售未来。
  10. 火山引擎LiveGS实时3D: 火山引擎LiveGS技术首次在移动端实现实时3D自由视角视频直播,攻克3D高斯泼溅核心难题,已落地抖音“裸眼3D”,开启沉浸式互动新纪元。

【今日总结】 AI Agent技术正全面爆发,从长程任务执行到自主编程、科学探索及经济活动,深度重塑各行各业,推动智能体向更高层级的自主化与个性化迈进。