摘要:互联网的快速发展将人类社会迅速引入信息时代,新闻生产的方式随之更新,媒介开始呈现融合发展态势。在信息过剩的今天,大数据的出现与发展颠覆了传统新闻生产模式,为融合新闻生产提供了新的思路和形式,在内容和表现形态上扩宽了新闻的深度与广度。本文以2016年美国大选的融合新闻报道为例,具体分析大数据在融合新闻生产中的具体应用与呈现方式,总结其区别于传统新闻报道的特点、存在的问题和未来可能的发展方向。
关键词:大数据;融合新闻
一、文献综述
近年来,“融合新闻”日益成为新闻报道的发展方向,针对融合新闻报道的研究也逐渐丰富和深入。融合新闻是从应用新闻学的角度对媒介融合发展的研究,又称“多样化新闻”,主要指利用多媒体手段进行新闻传播活动。
根据美国西北大学教授里奇?高登(Rich Gordon)的划分,作为多种媒介介质汇流的媒介融合包括5个层次:所有权融合、策略性融合、结构性融合、信息采集融合、新闻表达融合。前三个层次是宏观融合层面,后两个层次则是媒介融合操作过程中的新闻生产与呈现方式,具体表现就是“融合新闻”。它是媒介融合的“终端新闻产品”,具有新闻业务整合化、新闻载体数字化、视觉传达多样化等特点。
随着融合新闻的发展,大数据的出现与发展颠覆了传统新闻生产模式,为融合新闻生产提供了新的思路和形式。大数据在内容和表现形态上扩宽了新闻的深度与广度,也增强了其可读性和可视性,并对未来融合新闻生产提出了更高要求。
大数据(big data),泛指巨量的数据集,具体来讲,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中,大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。IBM提出大数据具有5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
大数据之所以被称为“大”,首要原因就是数据体量巨大。其数据来源极为广泛,既有人们每日媒介使用,尤其是社交媒体数据,也有政府数据和企业数据,还包括医院、学校、银行等社会基础机构,这就为新闻生产跨界合作提供了基础。
在已有的大数据结合新闻报道的融合新闻生产中,比较常见的是基于政府大数据的融合新闻报道。诸如历年的春运报道,铁路局提供春节前后交通数据,媒体负责专题制定和新闻制作;又如近年来雾霾问题报道,将气象局历年空气质量数据进行整理、分析、挖掘,用适当的新闻呈现方式进行报道。
利用大数据,更能以事物的关联性作为预测未来的基础,启发新闻策划更多地关注文本和社会现象之间的相关性,策划出更有社会意义的报道,编排出更具传播效果的版面或专题栏目。这要求新闻媒体在注重建立自身的数据库和数据传输渠道的基础上,加强与其他数据提供平台的合作,不仅降低数据获取和挖掘的成本,也能在合作中迸发新的灵感。
二、研究方法和案例选取
近年来,大数据这个概念愈发炙手可热,国内外媒体都创作了许多优秀数据新闻作品。
本文计划采用个案研究法,通过对具体案例进行分析,研究大数据在融合新闻生产中的具体应用与呈现方式,总结其区别于传统新闻报道的特点,探讨其存在的问题,未来可能的发展方向。
在案例选取方面,基于数据体量大、数据来源广泛、呈现形式多样等标准,本文最终决定选取2016年末的美国总统大选作为研究案例。
历次美国总统大选是世界范围内最受关注的话题之一,全民投票的大选形式所形成的海量数据为利用大数据进行新闻报道提供了良好素材,而美国大选本身又是极具重要性、时效性的新闻话题,因此,大选投票日当天,国内外多家媒体进行了数据新闻报道,进行实时票数统计。
本文选择国内的凤凰网和国外的CNN(美国有线电视新闻网)两家新闻媒体,从数据更新、数据处理能力、数据呈现形式等方面进行分析,比较两者利用大数据进行融合新闻生产的方式、特点、存在的差异,并探寻差异形成的原因。
三、案例分析
(一)数据更新
凤凰网美国大选实时票数统计()是凤凰网针对2016年美国大选特别制作的网页,实时跟进各州开票进度。CNN的美国大选结果()则在官网Politics栏目下开设Election Results,跟进每个洲的开票结果。
尽管网页数据更新要跟着各州开票结果的更新而动,但相比而言,凤凰网的更新频率比CNN官网更高,在开票最后阶段,凤凰网的开票数据领先于CNN,更先一步确定了特朗普的胜局。
事实上,美国大选总票数为538票,先获得270票者胜出。11月9日当天,计票结果为特朗普306票比希拉里232票,随后绿党候选人吉尔·斯坦(Jill Stein)要求重新计算威斯康星州、密歇根州、宾夕法尼亚州票数。美国联邦法律规定所有重新计票必须在大选后35天内,即12月13日之前完成。12月7日,美国密歇根州地方法院院长叫停重新计票。至12月13日,仅威斯康星州完成了重新计票。
凤凰网将密歇根州统计状态标注为“进行中”明显不合事实,可以推断最后一次更新在密歇根重新计票被叫停之前;CNN的威斯康辛州票数统计更新至11月28日,尽管重新计票结果依然为特朗普胜出,也表明CNN并未跟进重新计票的进度。
(二)数据处理的能力
基于以上原因,凤凰网在最终票数统计中扣除了密歇根州的16票,显示特朗普290票比希拉里232票,与最终结果产生了准确性上的偏差。
此外,美国大选开票当日,凤凰网的票数统计曾出现波动,特朗普的得票数在200票前后时出现票数下滑,这是由于票数统计未完,凤凰网就进行了过早的获胜判定,而最终结果产生反转。CNN的更新虽慢,基本是在某洲票数全部统计结束之后才进行数据图的修改。
在大数据种类和数量层面,CNN所展现的选举细节提供选超凤凰网。
在各州票数细节的统计上,凤凰网提供该州的总票数、计票状态、双方票数百分比和已开选票百分比(仅在开票过程中呈现);CNN在首页显示类似的信息,然而点击各州将打开新网页,讲呈现该州具体的投票结果,包括其他候选人票数和各郡(县)、市票数。
在全美票数统计的过程中,CNN不仅以行政区域划分,也从全国人口、参议院、众议院等角度统计了选举结果。除此之外,CNN还抽样统计了选举人的年龄、性别数据,以表格的形式将数据呈现出来,全方位、多角度地报道了美国大选的方方面面。
(三)数据呈现形式
大数据的呈现主要依赖对数据分析结果的图表化,凤凰网和CNN都在此次新闻报道中尝试了多种数据呈现方式。
凤凰网的统计页面更多地照顾到手机端用户的阅读习惯,整体页面多屏、“瘦长”。票数呈现采用了“记分牌”的形式,增加了竞争感,采用数据地图的形式展现美国各州的选举结果并对应填色,将鼠标移动到具体的州地图上,将弹出该州的票数统计详情,以设计感较强的动态展现形式,表现红蓝两个色条的增长。
在呈现和比较两位候选人具体票数数据时,采用以柱状图为基础的可视化图表。在各州选情呈现图表中,点击候选人头像,可以看到该候选人的所有获胜州,并以支持率降序排列。
CNN也采用了数据地图的形式,不仅做了以州为划分的全国数据地图,还做了每个州内部的数据地图。这两种地图有形式上的区别,各州地图是实际地域外形,全国地图则将每个洲简化为一个圆圈,圆圈中包含该周的缩写、总票数和红蓝颜色,并给关键州标上金色外圈。鼠标移动到圆圈上同样会弹出具体信息。虽然形式简约,所能呈现的数据体量却更大了。
在数据图表化的呈现中,除了简约风格的表格,CNN也有创新之处,在呈现众议院结果时,CNN借鉴了众议院座位的安排,也将图表设计成半环座椅的样子,生动且简明。
四、研究结果
可以看出,凤凰网和CNN的美国大选报道,作为大数据融合新闻的代表作品,区别于传统新闻报道的特点表现得非常明显。
基于网页制作技术和数据分析处理能力,大数据融合新闻能做到更加实时、直观地反映数据及其动态变化;采用数据图表与文字解释相结合的方式,在丰富了报道信息量的同时降低阅读难度;网页的交互功能“华而有实”,恰当地地整合了繁杂多样的数据,对读者而言极大地提升了阅读体验。
与此同时,凤凰网和CNN在选举数据获取、分析和呈现方面存在许多差异。