
作为开放新闻的数据新闻——英国《卫报》的数据新闻实践.doc
8页作为开放新闻的数据新闻——英国《卫报》的数据新闻实践 章戈浩 澳门科技大学人文艺术学院 摘 要: 本文以英国《卫报》的各类数据可视化为例, 分析了数据新闻在新闻实践中运用以及对传统媒体带来的挑战与机遇数据新闻并不等同于在新闻实务中直接引入数据分析技术或可视化技术, 其核心仍是新闻叙事, 而在《卫报》的新闻战略中, 数据新闻实质上是其应对新媒体特别是公民新闻的冲击, 而提出的开放新闻观的具体策略之一关键词: 《卫报》; 数据新闻; 数据可视化; 开放新闻; 数据新闻 (data journalism) , 又称数据驱动新闻 (data driven journalism) 它指的是对数据进行分析与过滤, 从而创作出新闻报道的方式近年来国际知名媒体《纽约时报》《卫报》《经济学人》、英国广播公司等纷纷推出了自己的数据新闻作品2010 年 7 月, 在维基解密事件之中, 数据新闻更是大显神通, 数据新闻这一概念开始大行其道, 在研讨会和学术论文中被屡屡提及较早从事数据新闻实践的新闻从业者更是频频在媒体网站与个人博客对这一新的新闻形式大力推介芬兰学者发布了《数据新闻趋势》的研究报告, 世界各地最早尝试数据新闻的业界与学界人士还共同推出了集当今数据新闻实践大全的《数据新闻手册》。
当然, 在传统的新闻操作中也曾有过基于数据分析与综合而完成的新闻作品, 事实上, 采用统计或量化方法分析数据并生产新闻的方式与理念在新闻学界早已有之, 如菲利浦·梅耶的《精确新闻》与《新精确新闻》就是这一领域的先行者上世纪 90 年代以来西方新闻学界又提出计算机辅助新闻 (Computer Aided Journalism/Reporting) 的概念, 以及新闻 2.0、数据库新闻等一系列概念它们从不同侧重点表达了当前时代传统新闻面临新媒体挑战而作出的转型努力可以说, 数据新闻正是承袭了在新闻实践中引入社会科学研究方法的努力之一不过, 近年兴起的数据新闻至少在三个方面有所突破首先, 数据新闻所分析的数据量级已远非传统新闻操作中数据图表可相提并论, 其数据多以上万甚至百万、千万计这当然是拜信息技术发展所赐, 为数据分析与数据挖掘技术的大力发展提供了可能其次, 在作品展示方面, 由于可视化技术的发展, 以及网络媒体的出现, 使得互动式可视化效果在新闻作品中的呈现成为可能虽然数据新闻作品也有在传统媒体中展示的, 但总体来说, 主要仍出现在各类数字媒体平台之上最后, 更重要的是, 以往更多的是文字为主、数据为辅 (data for the journalism) 或是数据与文字相辅相成 (data with the journalism) , 而数据新闻则是数据为先、文字在后, 数据驱动的新闻, 在一定程度上改变了新闻生产的思路与流程。
不同于传统新闻, 主体由对事实的描述或当事人的话语引用构成, 数据新闻更多的是对数据的展示因而数据可视化 (data visualization, 也有人称之为信息可视化 information visualization) 成为数据新闻的重要组成部分之一然而, 并不能简单地认为数据新闻就是与数字打交道, 或画出夺人眼球的信息图它与传统新闻一样仍然是在讲述故事, 讲述数字背后人的故事, 只是采用了数据新闻的方式, 可以更简单而清晰地让受众明了复杂的情境从某种意义上说, 数据新闻实际上整合了从传统的调查新闻到统计、从设计到编程的若干个专业领域它对新闻从业人员提出了更高的要求, 而对新闻的受众来说, 新闻的价值则大幅提升了Lorenz 将数据新闻的生产过程以下图所展现的方式加以描绘:数据经过过滤与视觉化后形成故事, 而在这一过程之中, 于公众而言数据的价值也提升了Bradshaw 则依照传统新闻学里关于“倒金字塔”结构理论, 提出了数据新闻的双金字塔结构 (见右图) 倒金字塔的自上而下是编辑、清理、情境与综合, 而通过传播的连接, 是一个正金字塔, 自上而下是视觉化、叙事、社交化、人性化、个性化、应用化。
与 Lorenz 对于数据新闻生产与制作流程的观念一致, Bradshaw 也认为数据新闻的产生基于对原始数据的分析并将其放入具体的情境, 不过他同时还强调, 数据新闻通过可视化形成新闻叙事之后在各种平台发布而实现社交化, 然后, 读者可以进一步将新闻作品按个人的兴趣与需求加以应用数据新闻的倒金字塔结构 The Inverted Pyramid of Data Journalism (complete) 下载原图不过最先从事数据新闻报道的一批编辑记者也意识到, 不能仅仅将数据新闻视为数字技术, 也不能把数据分析与数据挖掘技术或数据可视化等同于数据新闻, 英国《卫报》数据新闻编辑 Simon Roger 曾说:“数据新闻不是图形或可视化效果, 而是用最好的方式去讲述故事只是有时故事是用可视化效果或地图来讲述《卫报》的数据可视化与数据新闻在诸多较早投身数据新闻实践的媒体中, 英国的《卫报》成绩斐然, 别具一格《卫报》在众多国际媒体中不仅较早地意识到新媒体带来的挑战, 也较早地把握了新媒体所带来的机遇2006 年 6 月 13 日, 《卫报》宣布了“网络优先”的报道策略, 要求所有的稿件先在网络上发布, 然后才在纸质版本上登出。
网络优先”的策略强调将传统报业的优势用网络彰显, 而将传统报业的劣势用网络弥补, 走出了打造报纸网络版的迷思, 不是简单地将报纸内容放在网络上, 而是着眼于打造全球领先的新闻网站此后《卫报》又将此策略调整为“数字优先”, 以适应移动网络等多种数字平台的出现所带来的改变2009 年《卫报》开创了“数据博客” (http://www.guardian.co.uk/news/datablog) , 可谓数据新闻发展的一个里程碑这个设于《卫报》网站上的独特栏目从 2009 年 1 月 14 日上线至 2013年 5 月, 共制作各类数据新闻 2500 多则涵盖政治、经济、体育、战争、灾难、环境、文化、时尚、科技、健康等不同领域, 采取的形式有图表、地图以及各种互动效果图, 数据类型既有量化数据也有质性数据, 还有两者兼顾的混合数据现在不少钟情于数据新闻的国际媒体均采取了类似的形式, 如《洛彬矶时报》的“数据桌” (data desk) 等不同的新闻机构在生产数据新闻时可以采取不同的策略, 有的要求记者具备编程能力, 而有的则是外包给软件公司;有的购入专门定制的软件工具, 有的则使用免费的网络工具。
《卫报》的数据新闻团队目前主要由五人组成, 其中Simon Rogers 创立了《卫报》的数据新闻项目, 编辑“数据博客”和“数据商店”等栏目;John Burn-Murdoch 本人既是记者也是数据研究者, 他们两人在数据新闻界相当活跃其他成员则并非全职的数据新闻记者, 同时还隶属于《卫报》的不同部门, 从事其他新闻采编工作目前, 数据新闻的分析与可视化的不少工作都可以采用开放源代码的软件工具实现, 如用于互动图表的 Google chart、Google map、IBM Many Eyes、Tableau、Spotfire;用于基于时间顺序的时间线类作品的 Dipity、Timetoast、Xtimeline、Timeslide;用于基于地理信息的 Google earth、Quanum GIS;用于网络分析的 Spicynodes、VIDI、Node XL;用于社交媒体可视化的 Storify;用于文本可视化即标签云的Wordle、Tagxedo 等等《卫报》在早期大量使用 Flash 作为主要的技术支持手段来实现动态效果, 但 2012 年 10 月之后, 几乎不再制作这类作品。
这也是近年来数据新闻制作的一个趋势, 主要是由于 Flash 技术与部分移动网络终端不能完全兼容, 加之软件成本昂贵, 反而各类免费软件成为了制作数据新闻的主力军数据新闻及其可视化可以采取变化万千的不同形式, 在《卫报》的实际操作中使用最多的主要是数据地图、时间线和交互图表1.数据地图让《卫报》数据新闻一鸣惊人的是 2010 年 10 月 23 日刊登的一则伊拉克战争日志《卫报》使用来自维基解密的数据, 借用谷歌地图提供的免费软件 Google fushion 制作了一幅点图 (dot map) , 将伊拉克战争中所有的人员伤亡情况均标注于地图之上 (见图 1) 地图可以缩放大小, 数据多达 39.1 万条左右在地图上一个红点便代表一次死伤事件, 鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间, 造成伤亡的具体原因这里既没有用枯燥的数字作毫无人性的平静描述, 也没有采取夸张的文字进行煽情式的叙述, 但地图上密布的红点却显得格外触目惊心新闻从业者富于人性的思索通过精准的数据和适当的技术被传达出来此则新闻刊登后在英国朝野也确实引起了震动, 相当程度上推动了英国最终做出撤出驻伊拉克军队的决定。
《卫报》团队在制作数据地图时一般会采用 Google fushion 作为主要的工作软件, 将包括地理信息如经纬度在内的各类数据, 整理成表单形式, 在导入fushion 后, 就可以使用软件自带的功能导出地图在 2011 年 9 月 6 日刊出的英国伦敦骚乱的系列报道中, Simon Roger 仍使用Google fushion 软件作图, 但不仅仅是以地图标示出骚乱发生的地点, 而是更进一步以热力图的方式, 用不同颜色色块标示出伦敦各地区的经济指标 (见图2) 蓝色表示富裕地区、红色表示贫穷地区地图明确清晰地显示出了骚乱与社会经济发展不平衡的密切相关性, 从地理位置上凸显出一个分裂的社会而在制作这则新闻之时, 所使用的数据完全是来自公开的法庭审理骚乱案件资料以及政府关于社会经济状况的统计资料这幅地图不仅标明了骚乱爆发的地点, 也形象而视觉化地阐明了骚乱发生的原因伦敦骚乱爆发后, 英国舆论与政界一度将骚乱归罪于社交媒体如 Facebook、Twitter 传播谣言、煽动骚乱, 甚至要求关闭社交媒体《卫报》数据新闻团队通过与学术团队一起研究社交媒体在骚乱中的作用, 分析了 260 万条关于骚乱的推特信息, 观察谣言如何在推特上传播, 以及不同的用户在宣传和散布信息中的功能, 以确定推特和其他社交媒体是否煽动了骚乱。
他们对推特信息进行了内容分析, 分类编码为:重复、驳斥、质疑、评论, 还对数据进行可视化处理, 从而发现推特在纠正谣言方面也发挥了积极作用之后, 《卫报》与伦敦政治经济学院的学者合作推出了一本用数据解读骚乱事件的小册子《解读骚乱》, 使得新闻报道具备了带有前瞻性的社会科学研究的性质可视化不仅仅被用作展示或是解释 (explanation) 数据的工具, 还成为进一步探索 (exploration) 数据的工作2011 年《卫报》的数据编辑团体正是凭借着灵活运用谷歌表单等工具、开创了通过数据讲述新闻的新思路而荣获KnightBatten 奖的2.时间线如果说数据地图在展现数据基于地理或空间的分布时大展身手, 时间线则能在表现数据在时间维度的演变时大显神威如伦敦骚乱报道中使用的时间线, 读者拖动其下方的时间滑动条, 可以动态地见到骚乱发生时不同时间段的主要事件, 点击事件的图标, 侧面则会弹出详细的事件描述 (见图 3) 从叙事角度来说, 大部分的新闻叙事其实都是基于事件发生和发展的时间序列而讲述的当讲述的时间跨度较长, 或是事件众多繁杂之时, 传统的新闻文本式叙述就有可能力不从心如果将众多事件视作数据, 就可以使用专门的软件制作成基于时间线的可交互的动态作品。
采用时间线的形式, 也可以使得众多新闻事件之间的时间顺序甚至因果关系更明晰地凸显出来因此, 不仅作品信息量增大, 而且沉浸感增强, 可以供读者持续阅读与使用, 让新闻阅读变得如玩电脑游戏一般, 使受众大大增强了。












