《关于运用大数据加强对市场主体服务和监管的若干意见》、《关于积极推进"互联网+"行动的指导意见》、《关于促进大数据发展的行动纲要》——短短2个月时间,国务院就密集通过了3份涉及大数据发展战略的指导性文件,甚至出台了较为具体的规划,重视程度可见一斑。
但是,政府究竟能如何运用大数据提高执政能力,大数据能如何辅助领导人进行科学决策,其间的障碍和风险又如何?《南风窗》记者对中南财经政法大学MBA合作导师、国家统计局中国统计信息服务中心大数据研究实验室主任江青进行了专访。
大数据与科学决策
《南风窗》:谈及现状之前,我们不妨先来畅想一下未来,如果能将大数据充分运用到政府服务和国家治理当中,会是一种什么样的情景?
江青:毫无疑问,决策和治理过程会变得非常智能。如果我们搭建一个汇总了各方面数据的大数据可视化平台,“一把手”们就只需要通过PC机、手机或者大屏幕来随时查看自己想了解的数据。那时,所有的数据都已实现互联共享,可以随时分析不同数据之间的变化和关联。根据数据分析的结果去决策,工作就可以有的放矢。
社情民意(舆情)、政务管理、行业管理、旅游、医疗、交通、社区生活、产业规划、社会信用等等,基本上都可以跟大数据结合。一些大数据会提供实时监测的结果,职能部门可以在监管时非常动态地随时调整工作方向。
《南风窗》:领导们的工作越来越有数据分析的色彩?
江青:对,领导决策会从主观变得越来越客观,大数据基本上可以介入决策的整个过程。一个项目是否上马,可以先基于大数据分析可行性,这也是实地调研之外的数据调研方式。并不是说大数据排斥以前的调查结果,而是完善和补充了以往的方式缺失,让数据结果更全面和立体。在资源优化配置方面,大数据非常有用,传统调研只能考虑有限几个要素的影响,但大数据广泛、立体和客观的数据源可以让你参考各方面数据,综合评判之后得出最优结果。
对领导来说,还可以通过大数据随时查看各部门实际工作状况,选人用人也可以用大数据分析一个领导的声誉、工作成绩等各项指标。中央巡视组在去各地巡视之前,就可以把某个领导的朋友圈用数据分析出来。
现在最核心的是数据思维的问题,领导决策应该时时刻刻养成用数据说话的习惯,让数据规划进程。
《南风窗》:思维要贯彻到行动中才有真正的效果,我想先问一句,目前政府是否会经常使用基于大数据的智库报告或者分析结果?
江青:直观感受是国家领导人在用,省部级单位用得并不是太多。像大数据、“互联网+”这些新概念,一部分地方领导、部门负责人可能还没有真正理解。产业发展太快,领导们需要慢慢消化。
领导决策现在主要*直觉经验,除了班子集体会议,最多搞个小型专家组,由若干个经验和直觉合在一起形成决策。你要说一些领导没有数据思维,他们肯定不承认,但看他们具体决策的某些项目结果就能看出来了,一些领导还是比较缺乏真正的、彻底的数据思维。
《南风窗》:现在用大数据进行舆情监测好像是比较常见的,像危化品爆炸、踩踏事件等等方面的应急管理,好像对大数据的运用不是特别充分?
江青:将大数据用于舆情,主要是形象管理、社会稳定的需要,领导们比较关注个人形象、政府形象是很有必要的,而社会稳定也是政府服务民生福祉的需要。实际上应急管理是最容易用到大数据的,比如说某旅游景区的当前人口密度超过警戒值,就不能再往景区里放人了,同理,上海外滩的踩踏事故也可以提前得到预警和有效应对。
现在的交通实时监控系统、公安等领域,还是有比较好的大数据使用基础,但挖掘方面不太理想,还停留在呈现阶段,下一步就要做一些研究应用。但一个个的应用并不代表就拥有了“大数据思维”或者已经形成产业化。一些应用被放在了“信息化”的概念里面,从“信息化”导入“大数据”,需要有个过程。
真要发展大数据,就肯定是“一把手”工程,因为这需要调动方方面面的资源。大数据技术并不是最难的,分析和研究人员也都有,但你要不要用这些人?如何用?要不要用这种思维来做这件事?这就需要领导拍板,一个具体的部门负责人是很难协调和推动的。
障碍与风险
《南风窗》:有一个现实情况是,有的领导并不是不重视数据,但他们仍然认为数据都是虚假的,分析也没用。请问您如何看待数据质量的问题?
江青:但那些数据有可能就是他们自己生产的或者通过他们审核后报出来的呀!现在大数据对科学决策主要有两个隐患,首先,如果模型算法不科学的话,大数据的预判、分析等功能就有可能出现失误。其次就是数据质量的问题。
减少虚假数据的影响有两个方法,一是数据共享和公开,一旦数据实现了共享和公开,就会倒逼数据必须得是真实的,接受监督。第二,大数据的特点就是它会有其它数据源来佐证,当数据量足够大、数据源足够多的时候,我们可以根据关联数据分析出贴近真实的情况,少量的虚假数据很难影响整体结果。传统调研是对未知情况的调查,但大数据是对已知情况的记录和汇总。当数据搜集越来越智能,人为干预的因素就会越来越少。
我觉得应该明确一下,现在的大数据和传统的抽样统计调查数据是不同的。大数据更重视挖掘数据背后的价值、更多考虑关联研究。传统的统计数据能出个总数都很不容易,所以后期处理基本就是把数据分类汇总,很少关注A和B等等之间的关系——不是说不能,只是传统思维模式是到这儿就觉得一年的工作已经完成了,大家都没想着继续挖掘它或者工作职能里也没有这个要求,但如果稍微有个机构或者个人多做了一点挖掘工作,就会比别人强很多。
《南风窗》:大数据行业的人才现在非常抢手,政府能持续吸引这方面的人才吗?
江青:在我眼里,谈论大数据的现在分成两类人,一类是专家学者,主要在谈一些概念,另一类人讲技术比较多,集中在IT行业。但两类人中间缺少环,没办法扣起来、结合到一起。
大数据方面的人才确实很不充沛,各地发展大数据还需要非常坚实的信息化基础,思维、环境、人才必须一个都不缺,所以政府在这一块的外包力度比较大,因为政府暂时不具备相关能力。但对政府来说,需要的并不是单纯的IT人或者统计人,而是同时还要兼具管理学、传播学等知识的复合型人才,这才能帮助领导在管理决策上更好地判断。这些人需要将大数据跟本身擅长的技能相结合,打开大数据的思维。
《南风窗》:如果完全外包的话,是否会产生数据安全方面的担忧?
江青:会。目前有的企业做完政府外包以后,就把数据截留了,它们也不一定会把数据泄露出去,也许只是拿着自己内部使用。但有些部门或者地方政府没有意识到这种风险,认为这些数据放在我手里也没什么用。可是你自己发现不了数据的价值,别人却有能力知道,因为有些机构或者人会有目的地去研究你。
之前有某个做国家级课题的教授拿到了某区域的人口数据,但课题组有个美国留学生把数据带回去了。美国那边分析数据发现,某个很偏僻的地点违背常理地聚集了一大片博士、博士后,最后分析出那里有个绝密的军事基地。数据会呈现很多规律,透露很多信息。
数据共享与开放
《南风窗》:对数据安全的担忧会阻碍数据开放的进程,但要想让大数据助力科学决策,一个很重要的前提就是数据的互联共享和开放。
江青:我们希望推进数据公开,这可以倒逼政府改进工作方法,提高数据质量,提高公共服务能力。但是,这肯定不是近阶段能完成的。我都没有搞清楚我自己家有什么数据,怎么去公开?公开哪些,有没有风险?我们目前正在讨论的是部门间的内部共享,完全公开还到不了。
现在正要做的,就是摸清数据方面的“家底”。《关于运用大数据加强对市场主体服务和监管的若干意见》在附件第20条要求相关部门探索建立政府信息资源目录,要求2016年12月底前出台目录编制指南,如果解读这个也就意味着这个工作目前还没有大规模地开始着手。一旦打通了数据,各方数据会像万花筒一样勾兑出很多新内容,但我们前期数据的打通还没解决。
《南风窗》:那先不谈数据开放,打通数据、实现内部共享的难度大吗?
江青:打通政府数据不是一般的难度,首先就是条块分割的问题。数据共享是必须的,但无法做到的单位可能还不是少数,有些人觉得共享会出“麻烦”的。而且保留自己的一块权力,让别人来找我商量,我不就更有话语权了吗?
第二个就是瞻前顾后。看看别人干了没有,别人没干,我就先等等看。为什么大数据叫“一把手工程”?就得“一把手”统一思想才行。现在大数据已经提到国家战略高度了,上面在拉,下面在技术层面推,中间不动也是不可能的。美国用了18年把政府数据公开了,中国用多长时间还不太好说。
如果说一些政府数据公开出来是为社会发展助力,让大众创业创新,而不是糊里糊涂的被某些具有国际资本背景的企业用所谓的“某某云”给置换走的话,形成垄断或者干脆也成为斯诺登曝光的“棱镜、上游、X关键得分”的合作者这是可以的。不同的视角会挖掘出公开数据中的不同价值,这会释放大众的智慧,大众创业也有了创新的途径,从而真正实现数据取之于民、用之于民。
我国政府早已意识到政府数据安全的重要性,也加强了政府数据安全方面的工作。但一些政绩观作祟官员的迟钝和跟风,和虽不是“ioe”却有着“ioe”同样大股东背景的某些企业数据大盗行为,却会让心系国家的大数据从业者感到越来越不安。