数据新闻概论第二章.ppt
68页如何制作和传播数据新闻,第二章,,,第二章 如何制作和传播数据新闻,,1.数据新闻的类型,,,,,2.数据新闻的生产流程,3.数据新闻的制作团队,数据新闻的类型,第一节,一、“大数据新闻”与“小数据新闻”,(一)划分依据: 支撑报道的数据的性质 两类数据新闻的差别就在于两类报道中所处理的数据对象是隶属于“大数据”的范畴还是“小数据”的样本二)大数据(big data)的三个基本特征: (1)海量数据(volume): 相比传统数据或小数据,大数据拥有庞大的数据量 一般认为10TB~100TB是成为大数据的门槛 2012年互联网数据中心为大数据设立的标准中就确定数据体量需超过100TB以上 讨论:100TB的容量有多大?,(二)大数据(big data)的三个基本特征: (2)类型多样(variety): 相比传统数据多以文本数据作为主要类型,大数据的类型更为多元化 其包含了网络日志、图像数据、文件数据和各种复杂的记录信息 (3) 高速处理(velocity): 数据量的增长速度很快,需要处理的速度和响应的时间越来越快大数据 (巨量数据集合(IT行业术语)),大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分 结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据) 非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等一、“大数据新闻”与“小数据新闻”,(三)小数据与大数据十个方面的区别,知识链接,在计算机编程中,⾃省是指这种能⼒:检查某些事物以确定它是什么、它知道什么以及它能做什么 大数据自省技术: 计算机技术,通过内部的一种机制可以查询到数据的各种上下文四)“大数据新闻” “大数据新闻”是指在报道中采用大数据量级的数据作为分析对象或引用大数据研究成果的数据新闻 数据量级巨大、类型多样 选题类型:有很强社会影响力的事件一般应用于报道对象较为复杂,牵涉面广,需要采用庞大数量的样本分析,而非小规模抽样样本的选题 大数据新闻需投入大力人员,花费时间长,投入经费高 此类作品较少大数据新闻作品典范:《卫报》如何报道英国骚乱?,2011年8月,伦敦大骚乱并迅速蔓延至六大城市 1.报道目的:用科学的方法帮助人们解读骚乱(发生原因及如何应对) 2.报道团队:一百多名记者、学者和研究人员。
3.资金支持:两个基金会 4.作品完成时长:一年多,大数据新闻作品典范:《卫报》如何报道英国骚乱?,《解读骚乱》的报道历经了两个研究阶段 第一个阶段的成果发表于2011年12月,集中在探寻骚乱产生的原因上,报道团队先后采访了六大城市中270位骚乱参与者 第二个阶段主要基于对300多名受骚乱波及的人的采访 详细报道见:,大数据新闻作品典范:《卫报》如何报道英国骚乱?,值得一提的是第一阶段中的另一项重要内容,报道团队对260万条与骚乱相关的Twitter数据进行了统计分析 《骚乱谣言如何在Twitter中传播》数据报道对Twitter的谣言数据的全体样本进行了研究,让用户看到了谣言生成、扩散和传播的过程 报道影响了英国政府对社交网络管理的公共政策,《卫报》网站或得2012年度“数据新闻奖”大数据新闻作品典范:《卫报》如何报道英国骚乱?,作品所体现的大数据新闻的特点: 1.数据量庞大、类型多样 2.260万条Twitter信息 3.好几百人的深度访谈和问卷调查资料 4.仅参加骚乱者的采访录音材料就有130多万字 成功因素: 1.科研机构的协助 2.媒体对整个报道的规划和全程投入 3.基金会的资助。
五)“小数据新闻” 与“大数据新闻”不同,“小数据新闻”是指在报道中采用小数据量级的数据作为分析对象或引用小数据研究成果的数据新闻 目前业界的数据新闻实践多以“小数据新闻”为主,其数据来源较为单一,采用抽样样本,数据量级有限,数据的类型构成简单,对数据处理技术的要求也相对较低 小数据新闻投入成本低,操作时限短,技术门槛较低,更便于在媒体操作和推广小数据新闻典范作品——《傻瓜的艺术品市场》 作品对2008-2012年间,全球拍卖市场中 拍价最高的320件艺术品进行数据统计与 分析,展现了艺术品拍卖市场中诸多现象 和规制,意在让对艺术品市场完全外行的 人也能迅速读懂 数据来源:已有的艺术品拍卖价格报告和艺术品 市场报告 启示:好的作品不一定基于大数据分析,关键是作 者发现新闻选题价值的能力,以及数据分析和可视化呈现的能力《傻瓜的艺术市场》,二、自我采集数据型和现有数据再利用型,(一)划分依据: 数据新闻中数据的来源 (二) 自我采集数据型的数据新闻 指那些由报道者直接通过深度访谈、问卷调查、田野调查等社会科学研究方法获取第一手资料,并将这些资料量化为数据后进行处理,最后制作成的新闻报道 此类报道中的数据是报道者收集的原始数据,是真正意义上的第一手材料。
实践过程:报道者设立清晰的报道目标——根据设定的目标确定调查范围和调查对象——展开研究,收集数据 报道者对数据进行分析就是为了解决报道目标中设立的一些具体问题优点: 一是媒体采用自己采集的数据报道可以增强报道的原创性和独家性,避免和其他媒体出现题材撞车现象; 二是自我采集的数据相比已有的数据而言,其从最初的采集筹备到实施的过程都处于清晰的报道目标的指引之下,因而数据的纯度较高,可被利用的价值更大,这可以减少数据过滤的难度 《卫报》对英国骚乱的报道就属于自我采集数据型,媒体和科研机构合作耗时一年多,通过各种调查方法采集到关于骚乱的第一手材料,并将之进行分析解读后公之于众,其根据扎实的数据而提出的关于骚乱的观点打破了一些人的成见,引发了全社会的广泛关注,媒体也因此获得美誉三) 现有数据再利用型的数据新闻,指报道者收集其他企业、科研机构、媒体或个人发表的与报道主题相关的数据分析报告或新闻报道,按照自我的报道意图对其中的数据进行新闻价值的再挖掘,将已有数据按照报道的叙事逻辑进行分析重组后制作成的数据新闻 优点:可以依据公开的丰富的数据资源,避免数据采集过程中可能遭遇的问题与麻烦,减少不必要的成本支出,它特别适合一些中小型媒体或是初步尝试数据新闻实践的媒体,可避免过度投入的风险。
应注意数据的真实、权威和可信,报道应标明数据的出处和来源链接现有数据再利用型的数据新闻作品——《六十五年国人婚恋观变迁》,2014年是中华人民共和国成立六十五周年,网易“数读”栏目于9月26日推出了《六十五年国人婚恋观变迁史》的报道 该报道以可视化信息图表的方式呈现,将信息图表设置为若干个色块,每一个色块代表着婚恋观的一个部分具体包括择偶条件、最受欢迎、性行为态度、平均婚龄、离婚率、再婚占结婚总数比例等六个部分该报道选题从小处着眼,通过透视婚恋观念的变化,以具体的数据展现人们从单一到多元、从压抑到自由的观念变化,从而折射出六十五年来中国社会的巨变 数据来源比较笼统 此类数据新闻的报道者需要有清晰的思路和明确的报道角度,带着选题找数据 失宠的中国旅游业,,讨论,如果一个媒体将本媒体曾经的报道数字化,并建立相应的数据库,那么当它使用这个数据库的已有数据进行数据报道时,这种数据新闻应当属于哪类数据新闻呢?,三、以事件为选题的数据新闻与以话题为选题的数据新闻,(一)划分依据: 以选题性质为划分标准 (二)以事件为选题的数据新闻 指将报道选题聚焦于某一新闻事件,对事件呈现出来的具有新闻价值的数据进行解读和呈现的数据报道。
以事件为选题的数据新闻最常出现在重大新闻事件的报道中在这类事件中,数据报道可能是媒体精心制作的报道主体,也可能是媒体对事件的整个专题报道中的一个有机组成部分事件类型: 可预见的重大新闻事件一般多指会议、活动、庆典或赛事,作为媒体可以用较为充足的时间投入对这类事件选题的策划中 突发新闻事件在此类数据新闻中,媒体不但可以将事件主体的信息制作成数据报道,也可以将事件的背景材料进行整合和可视化 针对这类事件的数据新闻在增多,大量数据资源的整合和运用为此类新闻报道增添了更多科学性 《卫报》英国骚乱报道案例中对网络谣言的报道就属于此种类型的数据新闻案例:《纽约时报》如何报道马航MH370失联事件?,2014年3月8日,一架由马来西亚飞往北京的航班MH370与地面失联,3月24日马来西亚总理宣布该客机坠落 《纽约时报》网站为此推出了数据报道专题“寻找马航370”(The Search for Malaysia Airlines Flight 370),以强大的数据挖掘、分析和整合能力对该航班可能的飞行路线、搜寻范围做了解析和预测,并用可视化的方式将这次事件中大众普遍关心的技术问题以直观的形式呈现出来。
失联搜救中的统计数据分析 | 统计之都 (中国统计学门户网站,免费统计学服务平台) http://cos.name/2014/04/search.rescue.plane.statistical.data.analysis/,,,(三)以话题为选题的数据新闻,指将报道选题聚焦于某类新闻话题,围绕此话题收集数据,并对之进行解读和呈现的数据报道 这类数据新闻的选题有了更广阔的创意空间编辑记者可以根据最新发生的事件做出选题的推理和联想,或是根据一些潜在的社会现象和问题做出思考,或是在已有的公开数据材料中找出具有新闻价值的部分,并以此为话题进行数据报道,甚至还可以是编辑记者自身或读者对某个话题感兴趣而收集数据做报道特点: 前一种类型的数据新闻具有非常规性,因为事件本身是否可以运用数据新闻的形态进行报道并不是确定的 以话题为选题的数据新闻没有很强的时效要求,选题更加灵活、多样,其关键在于编辑记者寻找到的话题能吸引用户的关注,且用数据来解读该话题比其他报道方式更具有优势 有助于媒体的独家报道和差异化竞争,并逐步在用户心中产生数据新闻品牌效应 《傻瓜的艺术品拍卖市场》就属于此类数据新闻案例:NPR如何报道美国和墨西哥的边境地带?,2014年4月,美国国家公共电台(NPR)网站推出了一则和调查报道中心(The Center for Investigative Reporting)合作完成的数据报道,工作人员用时两周,途经3 900多公里的美墨边境,不仅用镜头,也用数据向我们呈现了一个真实的边境。
点击进入这个名为《边境》(borderland)的报道,你会看到页面上用显著的标题告诉读者:“边界线不仅仅是一条线,它是一个场所在关于报道的简短描述中,编者指出:“你在阅读报道,边境也处于忙碌中《边境》,这段文字下方是五个处于变动中的数据,会伴随读者阅读时间的增加而不断增长这五个数据与边境生活密切相关,分别是:有多少辆车合法通过边境,有多少行人合法来往于边境,有所少人因为非法穿越边境而被拘,有多少磅大麻被警方搜获,有多少盎司的可卡因被警方搜获 只要停留几分钟,读者就会惊异地发现这些数据变动之快,让人不得不感叹边境之忙和边境之乱http://apps.npr.org/borderland/#_/introduction,案例:NPR如何报道美国和墨西哥的边境地带?,报道以“边境”这个话题为切入,进行历史纵深和现存状况的多维度剖析,用大量历史和现实数据来辅助解读,并以一种网民乐于接受的多媒体融合报道的形式来呈现 推行以话题为选题的数据新闻在一定程度上能拓展媒体报道的选题空间案例:NPR如何报道美国和墨西哥的边境地带?,从制作到传播——数据新闻的操作环节,第二节,一则数据新闻的产生需要经历制作和传播这两个关键环节。
在制作阶段,发现、收集、整理和分析数据是核心内容;而在传播阶段,则需要运用可视化,并整合。





