TL;DR:
谷歌DeepMind开源的Aeneas模型以多模态AI技术革新古代碑文研究,超越现有模型和人类专家,通过自动化任务大幅提升历史学家效率。这一突破不仅预示着AI在人文学科的深远应用,更引发了对历史知识本质、人机协作模式及开源生态下知识民主化的深刻思考。
人工智能的浪潮正以前所未有的速度涌入传统认知领域,其影响力已远超技术与商业边界,开始触及人类文明最深层的文化与知识构成。谷歌DeepMind最新开源的Aeneas模型,正是这一趋势的鲜明例证。这款专为理解古代铭文而设计的生成式AI模型,不仅在技术上实现了跨越式进步,更对历史学研究范式、知识生产逻辑乃至人类与过去的关系,提出了深刻的哲学拷问。
技术原理与创新点解析:穿越时空的“智能修复师”
Aeneas的核心创新在于其多模态Transformer架构,它能够同时处理文本和图像输入,这使其在修复受损铭文中缺失字符方面,远超单一模态的传统方法和此前的纯文本模型Ithaca12。Ithaca曾专注于古希腊文本的碑文研究,而Aeneas则将能力扩展至拉丁铭文,并新增了对未知数量缺失字符的恢复和相似铭文识别功能13。
为了训练Aeneas,DeepMind构建了迄今为止规模最大的拉丁铭文数据集(LED),包含了176,861个可追溯至公元前7世纪至公元8世纪的铭文,涵盖了从英国到美索不达米亚的广阔罗马世界1。这种高质量、大规模的数据集是Aeneas卓越性能的基石。在多个碑文任务的评估中,Aeneas不仅超越了现有的先进AI模型,甚至在特定任务上展现出超越人类历史学家的能力。更令人瞩目的是,当人类历史学家将Aeneas作为研究工具时,人机协同的综合表现达到了前所未有的高度。一位研究人员深有感触地表示,Aeneas检索到的相似之处“完全改变了我对历史的关注……如果让我自己找这些文本,可能需要几天时间,而不是15分钟”1。这种效率的飞跃,预示着历史研究的**“速度革命”**。
人文研究范式重塑与商业潜力:学术边界的消弭与知识的民主化
Aeneas的出现,无疑将对碑文研究乃至整个数字人文学科产生颠覆性影响。它将历史学家从繁琐的文本重建和匹配工作中解放出来,使其能将更多精力投入到更高层次的分析、解释和历史叙事构建。这不仅是效率的提升,更是研究焦点的转移——从“获取数据”转向“解读意义”。
从商业敏锐度的角度看,尽管Aeneas本身并非直接的商业产品,但其开源性质4和提供的互动演示网站5蕴含着巨大的生态价值和间接商业潜力。
- 学术工具与平台升级: Aeneas的技术可能被集成到现有的学术数据库、数字图书馆或专业研究工具中,催生一批为历史学家、考古学家、语言学家量身定制的**“AI增强型”研究平台**。
- 知识普及与教育: 互动版本可作为教育工具,让学生和公众更直观地接触和理解古代文明,激发对历史研究的兴趣。
- 数据服务与专业咨询: 随着AI在特定领域知识图谱构建能力的增强,未来可能出现基于此类模型提供专业数据标注、清洗或特定领域知识服务的公司。
- 跨学科合作的催化剂: Aeneas展示了AI在非传统科技领域的巨大潜力,将吸引更多投资和人才流向**“AI for X”(AI赋能X领域)**的交叉学科研究,如数字考古学、计算语言学、文化遗产保护等,形成新的投资热点。
DeepMind将Aeneas视为“探索生成性AI如何帮助历史学家更好地识别和解释大规模相似之处的更广泛努力的一部分”1,这不仅是技术愿景,更是其在AI普惠化、知识民主化方面的重要布局。通过开源,它降低了研究门槛,加速了全球范围内相关领域的创新步伐。
伦理边界与认知重构:AI“解释”历史的深层思辨
Aeneas的强大能力也引发了深刻的伦理和哲学思考。Hacker News上的一位用户精辟地指出:
对我来说,这些只是基于现有信息的合理推测,因此无论何时使用这个工具,都需要加上免责声明。话虽如此,许多(古代)历史都是基于部分信息的合理推测。即使我们拥有大量可用的文字资料,比如西塞罗的作品,我们也必须承认,我们是从某个特定视角来看待这些事件的,而这个视角是由个人偏见和动机决定的。因此,我们试图根据存在一定“数据质量问题”的数据来推断历史上发生的事情。1
这段评论直指核心:AI生成的“重建”本质上是基于现有信息的“合理推测”,而非绝对的“真相”。这迫使我们重新审视历史知识的本质:它是否是绝对客观的重现,还是在碎片化数据基础上的持续建构?当AI能够“补全”缺失的历史文本时,我们如何界定其生成内容的权威性与真实性?潜在的AI“幻觉”风险,以及训练数据可能包含的历史偏见,都需要研究者保持高度警惕和批判性思维。
未来的历史学家,其职责将不再仅仅是文本的发现和解读,更将演变为**“人机协作下的历史侦探”和“AI辅助下历史叙事的伦理守门人”**。他们需要理解AI的工作机制,评估其输出的可靠性,并最终承担起解释和传播历史的责任。这不仅是技能的转型,更是认知框架的重塑。
未来图景:AI与文明的深度对话
Aeneas的诞生只是一个开始。DeepMind明确表示,该模型可适应其他古代语言、文字和媒介,从纸莎草纸到硬币,未来有望扩展到更广泛的历史证据中建立联系1。展望未来3-5年,我们可以预见:
- 多模态AI的普及: 类似Aeneas的模型将渗透到考古学、艺术史、人类学等更多人文学科,实现对遗址、文物、图像、口述历史等多元数据的整合分析,构建跨模态的“数字文明图谱”。
- 历史数据标准化与共享: AI模型的训练需求将推动全球历史数据的标准化、数字化和共享,形成更加开放和协作的学术生态。
- AI辅助的历史叙事与虚拟现实: 结合AIGC和VR/AR技术,AI将能够基于历史数据生成沉浸式的古代场景和人物互动,提供全新的历史体验和教育方式,让遥远的过去触手可及。
- 认知边界的拓展: 随着AI处理和发现复杂模式的能力不断增强,它可能揭示出人类历史学家难以察觉的关联性,从而改写我们对某些历史事件、文化交流乃至人类文明发展轨迹的理解。
Aeneas不仅是一个技术突破,更是人类在数字化时代重新发现和理解自身根源的一次大胆尝试。它开启了AI与人文科学深度融合的新篇章,挑战着我们对知识、真理和智能的传统定义。在未来,人类与AI的协作将不仅仅是工具层面的辅助,更将是一场跨越时空、连接古今的文明深度对话,共同重构我们对过去、现在和未来的认知。
引用
-
谷歌DeepMind开源了Aeneas,一个用于分析古代文本的AI模型·InfoQ·(2025/8/17)·检索日期2025/8/17 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登Nature·新浪科技·(2025/8/17)·检索日期2025/8/17 ↩︎
-
或能变革古罗马铭文研究范式?谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文·MIT Technology Review 中国·(2025/8/17)·检索日期2025/8/17 ↩︎
-
Aeneas互动演示网站·Predicting the Past·(2025/8/17)·检索日期2025/8/17 ↩︎