![]()
![]()
科研数据是驱动现代科技创新的核心生产要素。随着我国科研水平不断提升,海量数据在各领域不断产生,高价值的科研数据成为提升创新能力、赢得科技竞争主动权的关键战略资源。市人大代表、上海科学院副院长宋扬指出,当前国内已建立了一批科学数据中心,但仍以数据汇交和存储功能为主,对科学数据的可信度、可访问性等方面维护不足,导致数据分析、利用有限,影响了科研数据价值的充分发挥,应进一步破除“数据孤岛”现象,让科研数据“活”起来。
宋扬介绍,高质量科研数据是AI模型训练的关键“燃料”,目前数据来源主要是公开数据库和自身研究积累的实验数据,其中,自研数据产能有限,国外数据库存在禁止访问的风险,而国内数据库建设时间相对较短,在数据覆盖面、规范化、共享规则等方面仍有一定差距,支撑能力有限。
因此,搭建自主可控的高质量科学数据库,保障科研数据战略安全,同时盘活国内产出的大量高价值科研数据,显得迫在眉睫。“上海要强化国际科技创新中心的策源功能,在科研数据层面也要不断探索价值挖掘和共享新机制,努力提升保障能力和国际影响力。”宋扬说。
“国家和上海市层面都要求财政支持的科研项目数据统一汇交,然而不同主体提交的数据标准、规范不统一,给后续整理、共享乃至进一步挖掘研究都造成障碍。”宋扬在工作中发现,当前科研机构使用的主流国际厂商仪器存在数据格式各异且互不兼容的问题。同时,由于目前主要通过行政管理要求汇交科研数据,贡献度无法量化和评价,数据共享的分配机制尚未形成,造成科研人员提交数据动力不足,数据质量参差不齐。
对此,宋扬建议,应强化科学数据共享平台的跨学科协同和管理运营职能,并抓住国产科学仪器加速发展的机遇期,及早制定统一的数据标准,构建可信数据空间。“从历史上看,科学仪器发展早于科学数据库建设,早期的数据积累和分析方法还比较传统。当前国产科学仪器发展恰与新一代信息技术同步,有条件探索更高效的手段。在这一方面,上海应发挥更大作用。”她指出,如果将数据标准化前置到科学仪器端,就能通过信息化手段高效采集,并确保数据可信、安全、可溯源,进而提升后续数据汇交的质量。
同时,由于我国科学仪器与数据库均处于快速发展期,在这一阶段制定统一标准,将大幅提升后续数据汇总开发的效率,从技术上来看也具备实现这一功能的条件。她建议,可以由政府牵头搭建框架,联动市场、仪器企业与科研机构协同推进。
原标题:《高价值科研数据如何“活”起来?代表建议加快自主数据库建设》
栏目主编:张骏 题图视觉中国 图片编辑:徐佳敏
作者:解放日报 吴頔




京公网安备 11011402013531号