首页
洞察
早报
日报
主题探索
关于
ARC-AGI-3
洞察 Insights
AI圈深夜大地震!全球顶尖大模型集体“挂科”:人类拿满分,AI最强选手仅得0.2分?
最硬核AGI测试ARC-AGI-3出炉,人类得分100%吊打AI,顶级模型Opus 4.6仅获0.2%。测试揭示了AI在“元认知”和“学习效率”上的巨大缺陷,目前的AI离真正的通用人工智能或许还差一个“珠穆朗玛峰”的距离。
阅读全文