摘要:公共数据开放有助于增强政府透明度、公信力,提升公众获得感、参与度,激发社会化力量开发利用公共数据,完善数据要素市场化配置;通过对公共数据资源开发利用,有助于释放和提升公共数据资源价值。文章从实践和研究的视角,论述我国公共数据开放的基本情况和现存问题,并从制度保障、数据质量、数据利用等方面提出公共数据开放发展建议,对推进我国公共数据有序开放和加快公共数据资源开发利用具有参考意义。

01

引言

2020年,中共中央、国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中将数据纳入除土地、劳动力、资本、技术以外的第五大生产要素,提出加快培育数据要素市场,要求推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。2021年6月10日颁发的《中华人民共和国数据安全法》对政务数据安全与开放提出明确要求,提出按照规定及时、准确地公开政务数据;国家制定政务数据开放目录,构建统一规范、互联互通、安全可控的政务数据开放平台,推动政务数据开放利用。同时,公共数据开放被写入我国第十四个五年规划和2035年远景目标纲要,提出加强公共数据开放共享的规划和纲要,要求扩大基础公共信息数据安全有序开放。公共数据开放已经成为国家重要战略规划的内容之一,有序推进公共数据开放对推动公共数据资源开发利用、充分释放公共数据价值具有重要意义。本文旨在总结论述我国公共数据开放的现状及问题,并据此提出对策建议和发展路径,为推进我国公共数据有序开放提供参考。

02

公共数据开放概念与发展

公共数据开放一般是指公共管理和服务机构面向自然人、法人和其他组织提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务,其中政府数据开放是公共数据开放的重要组成部分。开放公共数据一般具有完整性、原始性、及时性、可获取性、机器可读性、非歧视性、非私有性、开放授权性的特点。通过公共数据开放,有助于增强政府透明度、公信力,提升公众获得感、参与度,激发社会化力量开发利用公共数据,完善数据要素市场化配置;通过对公共数据资源开发利用,有助于释放和提升公共数据资源价值。

2009年,美国数据开放门户网站data.gov上线,全球正式开启公共数据开放运动。2011年,美国、英国、挪威、巴西、墨西哥、印度尼西亚、菲律宾和南非等8个国家联合签署《开放数据声明》,成立开放政府合作伙伴(OpenGovernmentPartnership,OGP)计划,截至2021年6月,全球共有78个国家加入该计划。在全球数据开放浪潮的推动下,我国也进入公共数据开放行列,2015年《促进大数据发展行动纲要》明确提出稳步推动公共数据资源开放。

为监测公共数据开放水平、提升公共数据开放能力,全球产生了多个数据开放评估体系或监测指数,如万维网基金会的“开放数据晴雨表”、世界银行的“开放数据准备度”、开放知识基金会的“全球开放数据指数”、经济合作与发展组织的“OURdata指数”、联合国的“开放政府数据调查”、复旦大学数字与移动治理实验室的“中国开放数林指数”等。其中“中国开放数林指数”是我国首个综合评价地方政府数据开放水平的指数,自2017年已连续4年发布,评价结果具有一定的权威性。

03

我国公共数据开放现状

本文基于“中国开放数林指数”及国内学者研究,并结合对各地公共数据开放平台的调研,从公共数据开放实践和研究视角,总结我国公共数据开放的现状。

3.1公共数据开放实践现状

“中国开放数林指数”以第三方视角对我国地方政府数据开放水平进行评价,是对我国公共数据开放现状的客观呈现。2020年下半年“中国开放数林指数”分析报告显示,全国范围来看,省级综合排名中,浙江、上海、山东、贵州、广东综合指数较高,地级(含副省级)综合排名中,深圳、温州、青岛、贵阳、济南综合指数较高;综合来看,东南部沿海地区数据开放水平较高,中西部贵州、四川、贵阳和成都也表现相对优秀。

3.1.1政策法规与制度建设

截至2020年10月,共有38个地方政府出台了与数据开放紧密相关的政策法规,如《上海市公共数据开放暂行办法》《浙江省公共数据开放与安全管理暂行办法》《贵州省政府数据共享开放条例》《济南市公共数据管理办法》等,政策法规的出台为公共数据开放奠定了法制基础,为公共数据开放工作开展提供了依据。公共数据开放相关标准规范陆续制定并出台,如国家标准《信息技术大数据政务数据开放共享第2部分:基本要求》(GB/T38664.2—2020)和《信息技术大数据政务数据开放共享第3部分:开放程度评价》(GB/T38664.3—2020)、地方标准《公共数据开放第1部分:基本要求》(DB37/T3523.1—2019)和《公共数据开放第2部分:数据脱敏指南》(DB37/T3523.2—2019)等,为公共数据开放工作的标准化和规范化提供了依据。越来越多的地方政府将公共数据开放列为常态化工作,制定年度工作计划,有序推动公共数据开放,如上海自2015年已连续6年以政府公文的形式发布公共数据资源开放年度工作计划。

3.1.2开放平台与用户体验

自2017年以来,我国地方政府数据开放平台上线数量增长迅速,截至2020年10月,开放平台数量为142个,是2017年的7.1倍。目前,各开放平台功能基本能够满足用户获取数据的需求,其中山东公共数据开放网、上海市公共数据开放平台功能较为完善。公共数据开放平台作为政府公共服务类网站,应注重用户体验、平台运维与常态化互动交流。目前来看,在数据需求、意见反馈、数据纠错、咨询提问等互动交流方面,全国整体水平有待提高。

3.1.3数据数量与数据质量

截至2020年10月,我国公共数据开放有效数据集98558个,是2017年的11.74倍,开放数据总容量近19亿,其中山东省各市开放有效数据集数量较高,浙江、温州等地开放数据容量较高。但总体来看,各地开放数据集总量、开放数据容量存在显著差异。开放数据集主要覆盖社保就业、经贸工商、社会民生、财税金融、信用服务、教育科技、资源环境等主题,主要来源于统计、市场监管、农业农村、教育、人社、住建、交通运输等政府部门。同时,自新冠肺炎疫情暴发以来,各地公共数据开放平台开设疫情数据专题,将卫生健康类数据作为开放的重点。数据质量方面,部分地方仍存在高缺失、碎片化、低容量、数据重复、包含隐私信息等问题,同时部分数据未能及时更新,存在数据利用价值低等问题。

3.1.4数据利用与生态培育

数据创新创业大赛成为各地推进开放数据利用的重要方式,如山东省数据应用创新创业大赛、浙江数据开放创新应用大赛、上海开放数据创新应用大赛、上海图书馆开放数据竞赛等,对营造良好的公共数据开发利用氛围、解决政府部门公共服务中的难点痛点问题、加快培育数据要素市场化配置、充分释放公共数据价值具有重要意义。从数据开放平台展示成果来看,有效利用成果数量不断增多,但成果质量还有待进一步提升。为培育公共数据开放利用生态,部分地方围绕公共数据,联合高校、科研机构、大数据相关企业等,开展多种方式的利用活动,如上海市建立多领域的上海市大数据联合创新实验室、山东省举办的数创沙龙活动等。

3.2公共数据开放研究现状

王知津等以中国知网全文期刊数据库为数据来源,将我国开放数据研究分为3个阶段:(1)酝酿萌芽期(1996—2012年),此阶段特点为发文量少,每年均未超过5篇;(2)快速增长期(2013—2016年),此阶段发文量与时间成比例关系增长;(3)平稳发展期(2017年至今),此阶段热度小幅回落,但发文量稳定。总体来看,我国学者围绕公共数据开放主题,主要从数据开放政策制度、数据安全、数据应用、数据治理等方面开展研究。

数据开放政策制度方面,朱玲玲等以省级地方政府为例,研究政府数据开放准备度关键影响因素,认为数据管理、数据利用、安全保障、部门职责是促进政府数据开放准备工作的关键因素;彭川宇等从政策工具、政策目标、政策力度3个维度构建分析框架,分析成都、重庆两地的数据开放政策问题并给出建议。

数据安全方面,陈美从隐私风险控制的角度,调查美国开放政府数据的隐私保护实践,为我国政府开放数据和隐私保护提供参考;刘建新等研究了政府数据开放共享保障机制“双轨制”下,通过建构政府数据审查规则等措施,达到保护国家机密、商业机密、个人隐私和数据开放共享双重目的。

数据应用方面,孟显印等从平台数据应用的开发利用视角,对全国43个开放政府数据平台进行评估分析,其中上海、广东、武汉、山东、北京名列前茅,同时发现存在应用数量少且质量有待提高、应用更新维护不及时、应用开发主体积极性不高、应用浏览和下载情况较差等问题。

数据治理方面,现有文献鲜有针对文本数据治理的系统研究,郭燕从该角度分析开放政府数据下文本数据现状及应用水平低、条块协同治理难等问题,并对样本文本数据进行了数据处理,以期呈现文本政务数据内容分析的基本范式,为有效治理开放政府数据下的文本大数据提供借鉴。

04

我国公共数据开放现存问题

通过对我国公共数据开放实践和研究现状的分析,总结我国公共数据开放存在的问题。

4.1数据开放发展不均衡

从公共数据开放平台地域分布、各地开放数据集数量和数据容量、数据利用等多方面来看,均存在发展不均衡的问题,东南部沿海地区、川贵地区公共数据开放水平相对较高,其他地区数据开放能力有待进一步挖掘和提升。

4.2数据开放体制机制不够完善

部分地方政府数据开放管理办法和实施细则建构缺失,导致开展具体工作时缺乏顶层指引,因此难以规范、高效、持续地开展平台建设和运营,不利于公共数据的持续开放和开发利用。

4.3存在数据质量和安全问题

部分地方政府在公共数据开放方面存在“重数量轻质量”的问题,导致开放数据格式不规范、数据空行或重复、数据低容量或碎片化、存在隐私数据内容等数据质量和安全问题,公共数据资源利用价值低,且存在一定的数据安全风险。

4.4社会力量较少参与数据创新应用

地方政府未能充分调动社会力量参与数据创新应用,开放平台成果提交多来源于政府。商业化利用欠缺也是社会力量参与较少的原因,目前的数据开放主要是实现了政府工作透明化的目的,真正有价值的公共数据尚未完全实现安全开放和商业化利用。

05

我国公共数据开放对策建议

针对以上现状和问题,本文提出对策建议和实施路径,为我国公共数据开放提供参考。

5.1数据开放,制度先行

国家和地方政府应加快公共数据开放相关管理办法、实施细则、标准规划等的制定,规范公共数据开放平台管理、数据目录编制、开放数据治理、数据开放利用、数据安全管理等工作,使各地数据开放工作开展有据可依。同时不断强化地方政府高层领导、公共数据开放主体及相关工作者对公共数据开放工作重要性的认识,加强对公共数据开放能力的培养。

5.2有序开放,保障质量

国家多次提出推进公共数据有序开放。建议在充分调研了解社会公众对公共数据需求的基础上,对社会公众需求急迫、数据价值高的公共数据优先纳入开放范围,实现公共数据有序开放,不断扩大数据开放范围,并确保已开放的数据都是有利用价值的数据。同时加强开放前的数据治理工作,保障开放数据质量;强化开放后的数据审查工作,切实提高数据质量、保障数据安全,建议建立自动化与人工相结合的数据审查机制,发现问题、实时预警、有效修正。

5.3创新利用,培育生态

联合高校、科研院所、大数据相关企业等,举办数创大赛、数创沙龙、数据供需对接等多种类型的数据开放创新利用活动,营造数据开放利用氛围,增强数据开放利用意识,培育数据开放利用生态。高校和科研院所是激活数据价值的重要力量。通过搭建公共数据开放政校合作平台,深入推动数据应用。将数据开放和数据应用融入大学生课程或研究课题中,深入探讨公共数据在学术研究中的应用,并探索从学术到实践的数据应用发展路径,借助公共数据解决更多实际问题。同时从技术的角度保障数据利用的安全,如“数据可用不可见”等。

06

结语

本文从实践和研究的视角,论述了我国公共数据开放的基本情况,提出我国公共数据开放存在地区发展不均衡、体制机制不完善、数据质量和利用价值低、数据应用社会参与度低等问题,并从制度保障、数据质量、数据利用等方面提出公共数据开放发展建议,对推动我国公共数据有序开放和开发利用具有重要参考价值。


本文由转载于互联网,如有侵权请联系删除!