洞察 Insights

AI圈深夜大地震！全球顶尖大模型集体“挂科”：人类拿满分，AI最强选手仅得0.2分？

最硬核AGI测试ARC-AGI-3出炉，人类得分100%吊打AI，顶级模型Opus 4.6仅获0.2%。测试揭示了AI在“元认知”和“学习效率”上的巨大缺陷，目前的AI离真正的通用人工智能或许还差一个“珠穆朗玛峰”的距离。