首页
洞察
早报
日报
主题探索
关于
METR评测
洞察 Insights
Claude Mythos把AI考卷撕了:评测机构惊喊“测不准”,2027奇点已提前撞线?
Claude Mythos在METR评测中“考爆”了16小时任务的天花板,导致评测机构无题可出,AI的实际能力可能已无法用现有工具衡量。数据显示,其进化速度已超越2027年AGI奇点的预测线,同时安全领域也证实了AI从“助手”向“自主攻击者”的转变。这场变革来得比所有人想象的都快。
阅读全文