洞察 Insights
超越“解题高手”:OmniEduBench揭示AI教育的“育人”鸿沟与未来路径
华东师范大学发布的OmniEduBench首次将AI教育能力评测拓展至“知识+育人”双维度,结果显示GPT-4o等顶尖大模型在本土化知识与情感支持、批判性思维引导等“育人”能力上表现出显著短板,与人类水平仍有近30%的差距。这揭示了当前AI在教育领域从“智能”到“智慧”跃迁的深层挑战,并预示着未来AI教育产品和模型发展必须聚焦于情商与人文关怀的全面提升。
阅读全文
洞察 Insights
AI榜单内卷?别卷了,AI圈“高考”和“选秀”的瓜,我来帮你理!
AI模型榜单层出不穷,让人眼花缭乱?别慌!这篇文章带你深入了解AI界的两大“评测体系”:像“高考”一样硬核的客观基准测试,和像“选秀”一样看用户体验的盲测竞技场。告诉你榜单背后的小“心机”,并教你如何擦亮眼睛,选出真正适合自己的“私人冠军”!
阅读全文