当大模型能瞬间生成“综述”或“标准答案”,图书馆如何重新定义自身,构建“智慧知识基础设施”,为市民提供超越答案的知识深度与文化价值?第11届上海图书馆开放数据竞赛即日起面向全球征集优秀应用、论文及AIGC作品,以实践探索对变革的解答。
以“典籍新生,数据里的文脉风华”为主题,本届竞赛开放近1.5亿条历史人文数据,总奖金近26万元,设置应用开发及智能体、创意论文、AIGC应用三个赛道,深藏于图书馆与档案馆的文化宝藏,有望借AI技术转化为可感知的城市记忆。
应用开发及智能体赛道中,参赛者可围绕五个方向进行创作:一是让家谱、古籍、书画“开口说话”,开发交互式体验或人文研究工具;二是将人物传记与历史事件编织成动态知识网络,构建历史人物的“数字画像”;三是利用多模态生成、沉浸式交互等技术活化文化遗产,演绎江南风韵、海派之美;四是运用虚拟现实、情景叙事与知识服务技术,创新红色文化表达;五是通过公共文化行为与业务数据,开发面向公众的服务体验应用。该赛道前5名将直通2027年上海开放数据创新应用大赛(SODA)复赛。
创意论文赛道面向深耕学术的研究者,鼓励参赛者围绕开放数据与竞赛主题,从人文、历史、艺术、技术、社会、管理等多元视角,开展关于数字人文、公共服务及文化创新等领域的思辨与探索,推动数据驱动的文化研究与方法创新。除了深耕技术的智能体,今年竞赛的另一大看点是AIGC应用赛道全面升级,设置“AIGC微电影”“AIGC歌曲”及“AIGC文化海报”三个子赛道,试图打破专业门槛,吸引更多创客参与,让传统文化以更年轻、更具冲击力的方式“破圈”。
2016年,首届上海图书馆开放数据竞赛还只是一个围绕家谱资源开展的应用开发活动。十年过去,它已成长为国内数字人文领域的标杆赛事,构建起“政府指导、图书馆主导、社会协同、企业助力”的格局,成为上海城市数字化转型的生动缩影。
随着新一代人工智能迅速发展,本届竞赛重点鼓励探索AIGC智能生成、多模态知识服务、数字人文智能体等新型文化科技路径。来自上海图书馆、南京图书馆、浙江图书馆、安徽省图书馆等28家公共文化机构的近1.5亿条数据,打破馆际与地域壁垒,参赛者可基于家谱、档案、民国报刊等文献,用创意和技术将沉睡在库房中的文本转化为可感知、可交互、可再生的数字资产,让馆藏“动起来”。
从民俗影像、碑帖拓片、雕版图录到江南丝竹、皮影戏、桃花坞年画,利用这些向全球创作者开放的非遗数据,或许可以通过AIGC生成带有江南风韵或海派特色的原创歌曲,设计沉浸式非遗技艺互动体验,用当代语言让非遗“热起来”。古籍家谱、红色文献与老照片“走出”展柜与文献库,通过知识图谱、智能体、多模态生成等技术,让文物“讲述”自己的故事。
10.5万余种家谱、130万余种古籍循证数据、64万余位中国历代人物传记资料、139万首古今诗词、逾200万幅近代文献图片、1000万篇近代文献元数据……向参赛者敞开的不只是静态的数字,而是一座座等待被代码与创意激活的文化宝库。如何发挥创意?去年优秀获奖作品或许能给参赛者一些启发。“看不见的城市”利用Agent技术让市民成为城市记忆的创作者;“舌尖上的图书馆”与“基于IIIF标准和智能体技术的书画研究创新范式”项目通过多模态大模型,对古籍与书画实现了深度知识发现与创意演绎;“沪上印记”与“韬奋·纪念”通过RAG技术与交互叙事,让红色文化与名人精神在数字空间生动“复活”;“闵行民俗文化数字展馆”利用游戏引擎重构了物理空间。
为提升赛事影响力,本届竞赛首次采用“线上直播+区域专场”模式,将联合全国各地高校、图书馆及公共文化机构,面向高校师生、图书馆员、研究人员及社会群体推出五场学术宣讲会,采用“专家报告+赛事宣讲”模式,邀请行业专家围绕AI发展前沿、大模型与智能体技术应用、AI赋能数字人文等主题,通过专家报告、案例分享、数据解读为参赛者提供从理念认知到实操落地的完整指引。
当典籍以数据之名重生,当文脉借智能体与AIGC之手走向更年轻的表达,这场关于“何以为上海、何以为中国”的文化对话刚刚开始。





京公网安备 11011402013531号