腾讯混元等联合发布首个古文字OCR评测基准 Chronicles-OCR

IP属地中国·北京 编辑：顾青青 Chinaz 时间：2026-05-19 10:35:33

5月18日，腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学，正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准Chronicles-OCR。该基准的推出，旨在精准衡量多模态大语言模型（VLLM）在面对横跨三千年的汉字视觉分布漂移时的感知能力，推动数字人文领域的底层技术突破。
该数据集由领域专家多层级交叉标注，包含2，800张严格平衡的高质量图像。针对古早字体（甲骨、金文、篆书）与成熟字体(隶、楷、行、草)的特性，项目组设计了阶段自适应标注范式，并设立跨时代字符检测、细粒度古字识别、古文转写和字体分类四大核心任务，实现了视觉感知与语义推理的解耦评测。
在对GPT-5、Gemini3.1Pro、Claude Opus4.7等28个主流大模型的评测中，基准揭示了当前行业多模态能力的短板:在古早字体上，端到端检测任务由于缺乏现代版式先验而导致主流模型全军覆没;在细粒度识别中，最高准确率仅为27.1%;而在字体分类任务中，模型倾向于识别载体纹理而非微观笔画。值得注意的是，实验表明开启推理（Reasoning）模式反而会放大感知不确定性，导致表现下降。
此次 Chronicles-OCR 的开源发布，不仅量化了顶尖商用模型与古文字实际研究需求之间的技术鸿沟，也为学术界和工业界明确了微观感知优化的技术路径。让大模型从“识字”走向“读史”，将成为多模态大模型攻克长尾垂直场景、传承文化遗产的关键一步。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

当AI改进自己：递归自我改进与AI监管

美国AI编程智能体Claude Code有“后门”，阿里内部全面禁用

平晓黎是百度的蒋凡吗？

一加16参数提前揭晓：骁龙8E6 Pro+2亿主摄一加最强旗舰

华为与西部机场集团共创民航“数智解”

【阜成门外】当硅谷企业也烧不起Token，中国大模型成新选项

全站最新

当AI改进自己：递归自我改进与AI监管

美国AI编程智能体Claude Code有“后门”，阿里内部全面禁用

平晓黎是百度的蒋凡吗？

宝马全新iX7谍照来袭！外观内饰亮点多，与BBA同级车再聚首

热门推荐

当AI改进自己：递归自我改进与AI监管

美国AI编程智能体Claude Code有“后门”，阿里内部全面禁用

平晓黎是百度的蒋凡吗？

浙江交投低空基础设施产业发展公司登记成立注册资本2亿

Momenta携“物理AI”赴港上市，智驾赛道角逐下能否突围？

车企涨价，一场关于定价权的试探

一加16参数提前揭晓：骁龙8E6 Pro+2亿主摄一加最强旗舰

华为与西部机场集团共创民航“数智解”

【阜成门外】当硅谷企业也烧不起Token，中国大模型成新选项

虐待学员戒网瘾机构成立仅1年

长城汽车代理要返点90%？博主和品牌被同一个中间商耍了？

《燕云十六声》与《逃离塔科夫》跨界联动，7月10日“渡尘墟”玩法全新上线

我国海水淡化日产水量超300万吨，国家级公共测试平台天津投用

阿里发布内部通知：全面禁用Claude、卸载Anthropic旗下产品

华为与西部机场集团共创民航“数智解”