作者:王彦峰、袁汝兵、张素娟(北京市科学技术研究院)

国务院办公厅印发的《关于完善科技成果评价机制的指导意见》提出,坚持科学分类、多维度评价。科研数据是一种体量巨大的科研产出形式,是托举所有科研成果的“水下冰山”。近年来,科研数据共享机制逐步形成,在科研活动中的重要性日益凸显。重新定位科研数据的科学价值,将共享数据纳入科技成果评价体系,是建立科研新范式的需要,符合科学发展趋势。

数据共享是科学新范式的需求

科研数据包括各类科研仪器产生的原始记录,以及在此基础上产生的各种分析计算结果,有数字、文本、图谱、音视频等类型。科研数据是科研活动的第一产出形式,承载着重要研究信息,是科研人员智慧的结晶,因此也是科研活动的第一成果形式。

与论文、专利等传统科研成果相比,科研数据具有体量巨大和显示度低两个特点,是名副其实的“水下冰山”。

传统科研范式中,科研数据一般仅作为科研诚信的证据使用,不直接用于科研人员之间的信息交流。这种研究范式和行为习惯导致大量科研数据资源的闲置和丢失。科研数据的成果属性被忽视,其科学价值未得到充分利用。

近年来,随着开放科学理念的崛起,科研数据成为科学开放共享、广域协作的重要基础,对研究活动的重要性日趋凸显。有些学科领域中,数据成为所有研究活动的必要支撑条件。例如,1990年启动的人类基因组计划,在11年中完成了人体2.5万个基因、30亿个碱基对的测序工作,人类后基因组计划就是在这个数据集的基础上产生和发展起来的。

现代科研仪器飞速发展,也使得科研数据体量激增,欧洲大型强子对撞机每秒产生1GB数据,我国FAST天文望远镜每小时产生2.8TB观测数据。科研数据生产已经逐步发展为一个专门的领域,数据生产者和使用者的分工已初见端倪,需要有适合的评价体系应对这一变化。

依据吉姆·格雷的理论,人类科学历经了实验科学的第一范式、归纳总结的第二范式,正处于仿真模拟的第三范式,基于大数据研究的第四范式已初露端倪,并显示出巨大的发展潜力。科学新范式对数据的需求量远超从前,传统科研团队自身产生的数据已无法满足研究需求,科研数据必须在全球领域高效流通,才能发挥最大的作用。科研数据高效共享是促进科学范式变革的必要条件和迫切需求。

科研数据共享遵从FAIR原则,即可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)。开放度和共享度是科研数据价值评判的重要指标,即以数据的共享范围、对后续研究的影响作为标准,评价数据生产者的科学贡献。

我国已开始制订数据共享与评价的相关管理政策。2018年,国务院办公厅发布的《科学数据管理办法》将数据共享作为政府资助研究的原则。但科研数据共享总体上还处于探索阶段。

建立相应数据评价机制是先决条件

正确评价各类科研数据的科学价值,建立相应的评价机制,是实现数据共享的先决条件。建立更具针对性的数据成果评价机制是一个复杂的过程,需要多点发力,制度建设与技术手段研究并重。

在制度方面,需要首先在国家层面为科研数据正名,确认科研数据的成果属性,这是所有后续工作的先决条件。要实现这一条件,一是要树立科研人员数据共享的意识,培养数据开放的习惯;二是要强化落实纵向科研项目的数据汇交工作;三是要在职称评审、评奖等活动中,将科研数据共享数量和使用率纳入评审标准当中。此外,还需要从法律层面,建立健全科研数据的权属制度,使数据分享过程中产生的所有权、收益权等问题的解决有法可依;从国家安全层面出发,划出红线,保证科研数据的公开在安全的范围内进行。

由于数据共享是新型科研成果传播形式,过去的文献计量方式难以对传播的效果进行量化,需要借助先进信息技术满足这一需求。一是要进一步推进科研数据交流共享平台建设,方便科研数据分享和使用;二是将替代计量指标和网络影响力纳入成果评奖指标体系,科学监测科研数据的质量、流通和影响进行评估;三是引入区块链等新兴信息技术,实现对数据使用情况的有效实时计量。

总之,面对科学研究新场景、新范式,应该以开放、合作、共享的开放科学理念,完善现有科研数据评价机制,推动科研成果评价的重心由最终成果向研究过程前移。在此基础上,建立全球范围的科研合作、知识共享和科学组织新模式。这一转变符合“人类命运共同体”的全球价值观,将为构建新发展格局、实现高质量发展发挥重要的支撑作用。


本文由转载于互联网,如有侵权请联系删除!