洞察 Insights

超越“解题高手”：OmniEduBench揭示AI教育的“育人”鸿沟与未来路径

华东师范大学发布的OmniEduBench首次将AI教育能力评测拓展至“知识+育人”双维度，结果显示GPT-4o等顶尖大模型在本土化知识与情感支持、批判性思维引导等“育人”能力上表现出显著短板，与人类水平仍有近30%的差距。这揭示了当前AI在教育领域从“智能”到“智慧”跃迁的深层挑战，并预示着未来AI教育产品和模型发展必须聚焦于情商与人文关怀的全面提升。

阅读全文

洞察 Insights

AI榜单内卷？别卷了，AI圈“高考”和“选秀”的瓜，我来帮你理！

AI模型榜单层出不穷，让人眼花缭乱？别慌！这篇文章带你深入了解AI界的两大“评测体系”：像“高考”一样硬核的客观基准测试，和像“选秀”一样看用户体验的盲测竞技场。告诉你榜单背后的小“心机”，并教你如何擦亮眼睛，选出真正适合自己的“私人冠军”！

阅读全文