洞察 Insights
谷歌AI深夜“炸场”:IMO金牌得主Deep Think,真能“吊打”Grok 4和OpenAI o3吗?
谷歌深夜放出IMO金牌AI模型Gemini 2.5 Deep Think,号称多项测试力压Grok 4和OpenAI o3,主打“并行思考”和长推理时间,但在网友眼中,其每月250美元的天价订阅和使用限制引发热议,可谓“一半火焰一半海水”,未来普及之路仍面临挑战。
阅读全文
洞察 Insights
阿里通义千问3王炸登场:智商直接拉满,友商颤抖了吗?
阿里通义千问Qwen3系列再放大招,最新开源模型Qwen3-Thinking-2507在推理能力上直接“秒杀”OpenAI和Gemini等一众高手,还自带MoE架构和超高性价比,这波操作简直是给AI圈投下了一颗重磅炸弹,开源大模型要彻底“起飞”了!
阅读全文
Newspaper
07-23日报|智能体时代“狂飙”:效率、信任与智能本质的深渊对决
今天是2025年07月23日。AI浪潮正以前所未有的速度席卷全球,智能体的概念从科幻走进现实,一场围绕“Agentic Intelligence”的军备竞赛已然白热化。然而,在这场追逐极致智能的“狂飙”中,我们不得不直面一个令人不安的悖论:AI模型在某些深度推理场景下,竟会“越想越笨”?
阅读全文