登录体验完整功能(收藏、点赞、评论等) — 已累计有 9197 人加入

让AI触手可及,让应用激发潜能

腾讯混元联合故宫推出古文字评测基准 覆盖汉字七体演化全轨迹

近日腾讯混元大模型联合故宫博物院、多所高校正式发布业界首个覆盖汉字“七体之变”演化轨迹的古文字感知评测基准Chronicles-OCR,该数据集由领域专家完成多层交叉标注,包含2800张高质量平衡图像,此前面向28款主流多模态大模型的测试显示顶尖通用大模型在古文字识别任务上普遍表现不佳,填补了该领域长期存在的评测标准空白。

不少业内此前默认通用多模态大模型的文字识别能力已经达到商用级成熟水平,但在近期一次覆盖甲骨文、金文到草书的跨字体盲测中,包括GPT-5、Gemini 3.1 Pro、Claude Opus 4.7在内的一众头部产品识别准确率跌破及格线,让古文字AI落地的真实短板浮出水面。

当前主流视觉大模型针对现代印刷体、常规手写体的识别准确率已经超过99%,足以支撑绝大多数日常商用场景,但面对跨越数千年演化的古汉字体系,行业始终没有建立统一、客观的评测标准。

大量文博机构的海量甲骨藏品、古籍善本的数字化工作,此前长期依赖古文字专家人工标注,单份资料的处理周期长达数月,AI落地的最大障碍是无法证明自身对异形古文字的识别能力,不少厂商宣称的古文字识别功能实际只能适配少量公开数据集,面对未见过的馆藏资料几乎完全失效。

本次开源的评测基准Chronicles-OCR,是国内首次完整覆盖甲骨文、金文、篆书、隶书、楷书、行书、草书汉字演化全链条的测试数据集,2800张图像全部来自文博领域真实馆藏素材,经过三轮不同背景的古文字专家交叉校验标注,完全规避了此前公开数据集标注粗糙、样本失衡的问题。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯