数据新闻的学科建构:演进逻辑、知识图谱与前沿热点
——基于美国核心期刊数据库Web of Science(1992-2018)的文献分析
■傅居正 喻国明
【本文提要】本文以Web of Science数据库1992-2018年间关于数据新闻研究的文献为对象,利用文献信息可视化软件CiteSpace进行计量分析。研究发现,数据新闻研究滥觞于1992年,激增于2009年社交媒体崛起的大背景下,尤以近四年的研究数量为巨。数据新闻的研究在地理空间上的分布很不均衡,其研究重镇集中在美国,亚洲及中国学者的研究在本领域影响尚弱。从学术共同体建设的角度看,数据新闻研究中学术共同体的发育尚不成熟,稳定的合作群体不多,学派建设尚未成型,机构间的合作也较少。目前国际上对数据新闻的研究已经由内而外,即从对于数据新闻本体要素、结构、功能与方法的研究转而主要集中在数据新闻的社会性连接、数据伦理与场景问题的研究。
【关键词】数据新闻 演进逻辑 CiteSpace 知识图谱 共引分析 共现分析
【中图分类号】G210
“数据新闻”(data journalism)也被称为“数据驱动新闻”(data-driven journalism)这一概念近年来挟大数据泉涌之大势,流行于新闻实践领域。西方主流媒体例如英国的《卫报》运用可视化技术从Twitter上抓取260万条内容,制作并报道了《伦敦骚乱中的谣言》,于2012年获得了由“全球编辑网络(Global Editors Network)”主办、谷歌给予支持的首届“新闻数据奖”。2016年4月普利策新闻奖“全国报道奖”颁发给了《华盛顿邮报》团队制作的警方枪击事件的数据新闻。由欧洲新闻学中心和开放知识基金会共同编写的《数据新闻手册》(The Data Journalism Handbook)是数据新闻的集大成专著。这本手册汇集了国际上知名的与数据新闻有关的学者观点和优秀的业界案例,但它本身存在的一个问题就是研究视点比较分散,重点在于给业界的新闻工作者提供一个操作层面上的工作指南,并无具体的关于数据新闻系统严谨的研究成果以及发展总结。①另外,在经历了英国脱欧和美国大选等事件后,情感压倒事实的“后真相时代”让关系要素、情感共振及由此造成的信任成为带来更高的公众参与度品牌忠诚度的目标,也直接决定了用户为内容付费的意愿和花费在获取新闻内容上的时间。在各类“爆款话题”、“虚假新闻”层出不穷的当下,英国广播公司BBC的新闻编辑部在英国脱欧公投期间以及美国大选期间都做了基于数据挖掘的深度报道来对抗谣言的传播。由此可见,数据新闻的价值在如今碎片化信息阅读的多元分层的后真相时代更加凸显。
基于数据新闻被各国广泛应用的现状及其在当今的重要意义本文以美国核心期刊数据库Web of Science收录的与数据新闻相关的1251篇期刊论文为依托利用CiteSpace软件对数据新闻研究的演进逻辑、知识图谱与前沿热点进行数据挖掘和可视化分析以期为数据新闻的深入研究、实践探索和产业推进等提供有价值的参考。
一、研究方法与数据处理
(一)研究方法
科学知识图谱以知识域为对象,它能够展示科学知识的发展进程与结构关系。②笔者主要采用了美国德雷塞尔大学计算机与情报学陈超美教授开发的信息可视化软件CiteSpace分析工具,它主要基于共引分析和网络寻径算法等对特定领域计量,研究其发展关键路径和知识转折点(关键论文为代表)。③本研究中主要采用了作者、机构和国家共现、关键词共现和聚类、参考文献共被引等分析方法,通过分析可视化网络知识图谱,直观地呈现出数据新闻研究领域的知识结构、热点领域以及前沿演进。
(二)数据来源与处理
本文以美国综合性在线文献数据库Web of Science(简称WOS)作为数据来源,因为WOS数据库与EBSCO、Wiley-Blackwell等其他大型数据库相比,其涵盖面更全面,包括社会科学、自然科学和人文艺术学科等大量研究资料,④并包含所有SSCI来源期刊,在学术界享有较高权威,⑤能为本研究提供扎实全面的数据支撑。运用高级检索设置主题为TS=(data journalism OR digital journalism),文献类型为“Article”和“Proceedings Paper”,时间跨度为所有年份,进行筛选与检索后共获得文献1251篇,用CiteSpace除重后得到1246篇有效文献。数据的最后更新时间为2018年7月17日。
二、国际学术界在数据新闻研究领域的发展状况与特点
本部分从数据新闻研究的时间和空间分布、作者、机构和国家间的合作网络关系以及文献共被引等方面描绘并分析数据新闻研究的学术场域。
1.从时间维度上看,论文发表量呈现明显的“J”型分布,2015年以来不到4年时间的发表量占总数的66.2%。
统计显示,数据新闻研究成果呈现出时间上逐年递增,空间上集中分布的态势。对精炼后的1246篇文献进行统计,在时间维度上的统计结果如下(图1 图1见本期第59页)。
某研究领域的发文量能够在一定程度上反映出该领域在不同时期学术发展的基本状况。如图1所示,从文献总量来看,数据新闻研究的发文数量在时间轴上呈现明显的“J”型分布:1992–2006年是数据新闻研究的发轫期,这15年的总占比为5.8%,年均发表量为4.8篇;2007–2014年为成长期,这8年的总占比为28.0%,年均发表量为43.6篇;2015–2018年为爆发期,截至2018年7月17日,这四年已发表的论文数量的总占比已达66.2%,年均发表量为206.3篇。
很显然,数据新闻是随着个人电脑数量的增加、互联网的普及和社交媒体的崛起,以及大数据的涌现而成长起来的一种新闻传播领域的现象级发展。
20世纪90年代,随着个人电脑数量的增加、互联网的问世,计算机辅助新闻报道、数据库新闻报道的比例日益增加,这被认为是数据新闻起源的重要动因。1989年,美国成立了全国计算机辅助报道联合会。在这一阶段中,业界鼓励记者运用数据进行调查性新闻报道,并且指出公开公众议题数据可帮助记者设置政治议程。⑥但由于数据的短缺以及获得成本的高企,从1992年数据新闻进入学术界视野以来,之后的十多年的实践应用和研究发展均较为缓慢。
2008年在社交媒体崛起的大背景下,9月的《自然》杂志推出了名为“Big Data”的封面专栏,此后大数据时代的到来加之“开放数据”运动在全球的蓬勃发展,国外开始较为系统地推行数据新闻。2009年年初,英国《卫报》在网站上创建“数据博客”栏目,成为数据新闻实践的领跑者。⑦此后,《纽约时报》、《华尔街日报》以及BBC等新闻业先驱纷纷开设数据新闻专栏,为数据新闻在学术界的研究提供实践基础。同时,于2011年出版的《数据新闻手册》和2012年首届国际数据新闻大赛的推出也为其增添了关注度。这一时期数据新闻研究也随之大增。
其后,We are social发布的《2015年全球互联网数据报告》指出,2014年是互联网和移动互联网快速发展的一年,其中一个具有里程碑意义的数字是:全球接入互联网移动设备于2014年12月超过了36亿台,这个数字相当于全球人口总数的一半。⑧社交媒体以及互联网移动终端的普及催生了大数据的涌现以及用户级商家消费信息和服务的方式。随着计算机算力的提升、关联算法的巨大进步等,数据新闻的广泛应用使得人们对数据新闻伦理有了更迫切和深层次的研究。从2015年开始数据新闻这一研究话题的相关文献数量发生了爆发式增长,2015–2018年这4年的发文总量约占总发文量的66.2%。
2.从空间分布上看,数据新闻研究的学术版图以美国、欧洲为重镇,美国具有绝对的影响力,尤以它在研究的结构性分布方面的优势为最,但荷兰、丹麦等国在某些学术成果的影响力方面也具有相当地位。
利用CiteSpace软件对国家进行共现分析,得到(图2 图2见本期第60页)的国家合作图谱。其中,网络中节点的大小反映的是国家发文量,连线表示合作关系。本项研究对文献来源的国家/地区分布情况进行了统计,结果显示:数据新闻研究数量前五的国家(或地区)分别为:美国、英国、西班牙、澳大利亚、瑞典。中国的研究数量相对落后,排在第九位(图3 图3见本期第61页)。数据分析表明,数据新闻研究在地理空间维度上的分布很不均衡,研究主要集中在美国和欧洲等发达国家。国家间有一定的合作关系,且大多都是以美国或欧洲国家,尤其以美国为中心进行的合作。笔者进一步对排位第九之后的国家(或地区)进行统计(图4 图4见本期第61页),分析显示,排在中国之后的依次为丹麦、挪威、南非、瑞士、比利时、奥地利、以色列、俄罗斯和希腊,除中国有35篇的发文量外,其余国家的发文量均不超过30篇。总体来说,这些国家在对数据新闻的研究场域中还有很大的发展空间。
此外,圆圈的大小表示研究涉及的领域(学术版图)的多寡,从图中可以明显看出,美国占据最大的“学术版图”,其次是英国、西班牙等。而用深色外环重点标注的节点体现的是某些学术成果的影响力,即中心性(Centrality)指标,它的数值越高,说明其在某项(或某些)议题上的影响越重要。丹麦和荷兰的发文量虽然较少(29篇和43篇),但其中心性分别达到了1.02和1.00,说明荷兰和丹麦在数据新闻研究的某个(些)研究领域中拥有影响力较为核心的地位;智利和冰岛中心性次之,分别为0.50和0.47。美国和英国因为设计的研究领域较为广阔,所以其中心性的平均值分别为0.25和0.39。
3.作者及其合作图谱:论文作者之间几乎都是“单兵作战”,彼此联系极少,尚未形成学术共同体。
在了解数据新闻研究作者和研究机构合作情况时,本研究均将时间跨度选为1992年至2018年,Time Slice均设置为每一年一个时间分区,分析对象分别选择“Author”和“Institution”,分析对象数据之间的连接强度选择默认的夹角余弦距离(Cosine),分析对象筛选标准分别为 Top10、Top30,均采用最小生成树(Minimum Spanning Tree)算法对图谱进行修剪,运行CiteSpace软件后,分别得到数据新闻研究作者合作图谱和数据新闻研究机构合作图谱。
在作者合作网络图谱中,节点字体大小代表作者发文量,连接边表示合作性。结果显示,网络节点数量为88,连线数量为14,网络密度为0.0039。显然,数据新闻研究的作者队伍十分松散,作者之间几乎都是“单兵作战”,联系极少,尚未形成学术共同体(图5 图5见本期第62页)。对数据新闻研究最多的五位研究者分别是美国明尼苏达大学的Seth C. Lewis、意大利格列高利大学的Claudia Mellado、美国华盛顿大学的Nikki Usher、瑞典卡尔斯塔德大学的Michael Karlsson和美国纽约市立大学的C. W. Anderson。其中,Seth C. Lewis发表了13篇相关文献。他的研究主要集中在数据新闻伦理和公民新闻上,其被引用频次最高的文献为《新闻业和它的边界:专业主义控制与公民参与的博弈》,它强调了在数字化媒体的环境中,媒介内容生产与消费的界限正逐渐被打破提出了“参与式伦理”,这种伦理将新闻生产与受众整合视为好的数据新闻的“标准规范”。⑨
4.研究机构及合作图谱:美国和英国的研究机构是本领域研究的执牛耳者,学术机构之间的联系与合作渐已形成。
利用CiteSpace软件对机构进行共现分析,得到图6的机构合作图谱。数据分析显示,数据新闻研究的机构网络较为松散,但机构之间的联系与合作渐已形成(图6 图6见本期第62页)。迄今对数据新闻研究最多的学术重镇是:美国的得克萨斯大学奥斯汀分校(共24篇),美国威斯康星大学、英国伦敦大学、英属哥伦比亚大学、奥地利的维也纳大学、瑞士的苏黎世大学、瑞典的哥德堡大学(均超过15篇)。结合数据新闻各国文献数量可知,在数据新闻研究领域内,美国和英国无论在总体上还是代表性研究机构的数量上都居世界前列。中国对数据新闻研究最多的是香港浸会大学,但排名在89位,发文量也只有4篇,分别是《在大数据时代讲故事:香港学生对数据新闻的准备和态度》、《冲突的新闻创造力:当记者陷入不一致的媒体专业化和政治意识形态时》、《定量分析:香港和中国大陆媒体的差异》、《新闻学跨学科学习:香港数据新闻教育研究》。由此可见,这些并不能代表华语世界在本领域的研究状况,但却突出反映了华语世界的研究者在本领域的国际话语权和影响力还是相当羸弱的。
5.数据新闻研究的知识基础:迄今为止数据新闻的研究所涉及的知识点分布较为散漫,对全部论文的共被引文献的聚类分析表明,其研究文献的知识聚类特征不明显。这说明目前数据新闻研究领域的专注度及深度有待进一步强化。
知识基础是“科学文献中的引文和共被引的轨迹”。⑩共被引分析即通过同时被其他文献引用的频次来表达文献之间的关联,如果两份文献同时被其他文献引用,引用频次越高,则其关系越密切,学科背景越相似。共被引分析能定量地解释学科的知识结构、亲缘关系和变化的规律。美国学者皮尔逊(Persson)认为,“从文献计量学来看,……被引文献组成了知识基础”。[11]据此,我们可以利用文献的共被引分析,找出共被引频次和中心性较高的文献,以此揭示数据新闻研究的知识基础。
将分析对象设置为“Cited reference”,节点类型选取标准设定为“Top30”,运行CiteSpace进行文献共被引分析,(表1、2 表1、2见本期第63页)分别列出了数据样本中数据新闻的高被引文献和高中心性文献的前10篇信息。
进一步查阅可以得知,英国伦敦大学学者Jane B.Singer的《参与式新闻:保护在线报纸的门户》一书被引次数最多,达到52次。此书梳理了西方学者使用的“参与式新闻(participatory journalism)”这个概念,认为这个概念更准确地抓住了普通公众如何参与到收集、选择、出版、发布、评论及公开讨论新闻的过程和这种贡献所产生的效果,它的核心在于新闻的合作性生产和集体性生产。[12]美国肯塔基大学学者Deborah Soun Chung的文章《利润与风险:在线新闻制作人对互动和互动性功能的认知》中心度达到0.58,此文运用了访谈法对提名在线新闻奖的网站制作人进行了关于互动范式的研究,他们的调查发现,尽管网站制作人表现出了兴趣,但他们在整合这些互动功能时遇到了诸多问题,所以会对采用这些互动性功能保持谨慎态度。[13]这篇文章对后续数据新闻研究的影响较为深远。
值得注意的是,有三篇文章同时进入了高被引和高中心性排名的前10位(已在下表中用阴影标注),可视为本研究领域的关键性文献。按照发表时间从远到近排序,David Domingo等学者的《媒体的参与式新闻实践》(被引频次和中心性分别为32和0.29)以16个在线报纸为样本,表明新闻机构开始改变传统的垄断式新闻生产方式,允许受众参与到讨论时事的过程,但这依然不能影响媒体最终的传播决策。[14]Eugenia Mitchelstein和Pablo J. Boczkowski的《传统和改变之间:在线新闻生产的总体分析》(被引频次和中心性分别为26和0.43)对数据新闻的历史背景和市场环境、创新过程、新闻实践的变化、对专业主义新闻的挑战和用户生成内容的角色认定这五个方面进行回顾总结。[15]Dominic L. Lasorsa等学者的《使Twitter正规化:新兴传播场域中的新闻实践》(被引频次和中心性分别为47和0.45)基于对2200条新闻工作者的推特所进行的内容分析,探讨了新闻工作者在社交媒体大行其道的背景下,推特等社交媒介在多大程度上改变着传统新闻专业的规范和实践。[16]在上述基础上,对论文共被引文献进行聚类,计算得到的Modularity Q=0.9076,Mean Sihouette=0.1605<0.5,说明相关文献的知识聚类特征不明显,数据新闻研究领域的专注度和深度有待进一步强化。
三、数据新闻的研究热点及其趋势分析
(一)研究主题识别:通过关键词共现所呈现的学术脉络
利用Citespace得到26年间数据新闻研究的高频和高中心性关键词。图中的字体大小代表关键词的词频高低,节点之间的连线表示关键词之间的共现关系。从(图8 图8见本期第64页)和(表3 表3见本期第65页)可知,“新闻业”和“媒体”是该知识图谱中频次最高的两个节点。此外,“社交媒体”、“报纸”、“互联网”、“在线新闻”、“数字新闻”、“传播”、“公民新闻”、“技术”、“记者”、“信息”、“受众”、“参与”、“创新”等关键词的频次也位居前列。
其次,关键词的中介中心性越强,说明其占据节点的位置越多、控制的关键词之间的信息流越多,在整个知识网络中则发挥了战略性的中介作用。[17]根据表3可知“报纸”作为传统媒介与互联网媒介转型升级的焦点级对象物居于研究中心性的首位,中心性为0.22。位居其后的关键词依次是“互联网”、“电视”、“报道”、“维护网志”、“用户生成内容”、“公民新闻”、“读者”、“科学”和“政策”等。
因此,从知识图谱中关键词的频数以及中介中心性来看,26年间数据新闻的研究热点主要集中在“互联网”、“报纸”、“新闻业”、“媒体”、“传播”、“在线新闻”、“公民新闻”等方面。
(二)研究热点与发展脉络:以关键词聚类为分析角度所显现的学术版图
为了更好地解释和分析上述关键词透射出来的学术意义,通过CiteSpace的LLR算法提取关键词,让系统生成高频关键词聚类图谱,Modularity=0.7049>0.3Mean Silhouette=0.6952>0.5说明聚类情况良好,有明确的轮廓。如图10所示,知识聚类的具体信息见(表4 表4见本期第66页)。其中最大的两个聚类是聚类0“慢新闻”和聚类1“把关”,聚类内文献数量分别为21和18。
本文基于以往学者的研究和知识图谱的分析,对数据新闻的研究热点归纳整理,从宏观视角将其分为以下几个研究热点,以理顺数据新闻研究的知识体系和发展脉络。
1.对于数据新闻内容的研究
这类研究主要包括聚类图中的#1、#6和#9,论文内容主要关注数据新闻与政治/公共等社会话题的结合,利用数据的客观性和透明性改进新闻推动民主的方式。代表性的关键词包括“选举(election)”、“运动(campaign)”、“民主(democracy)”、“权利(power)”、“关爱(care)”、“性别(gender)”、“环境新闻(environmental journalism)”、“公共相关(public relation)”等。Katharina Rall等学者在《人权倡导的数据可视化》中指出,人权倡导者越来越多地使用数据来更好地理解侵权行为,并将其发现传达给普通公众、决策者和司法机构等目标受众,从而维护和宣扬人权。[18]T. Nirmala和I. Arul Aram的文章《印度报纸中的环境图像》通过内容分析法和视觉话语分析法对比分析了两家印度报纸对环境问题的报道情况,并指出数据新闻以其特有的优势应该更加广泛地应用于水资源、二氧化碳排放等环境新闻的报道中。[19]2.对于数据来源和数据采集的研究
这类研究出现于图中的#3、#4和#8,论文内容主要关注数据新闻中的数据来源以及数据采集时的伦理规范。代表性的关键词包括“伦理(ethics)”、“把关(gatekeeping)”、“大数据(big data)”、“开放数据(open data)”、“社交媒体(social media)”、“博客(blog)”、“推特(Twitter)”、“算法(algorithm)”、“数据分析(analytics)”、“技术(technology)”、“黑客(hacker)”、“用户生成内容(UCG)”等。目前数据新闻的数据主要来源于政府、公司、营利/非营利调查机构以及社交媒体等。Ricardo Matheus等学者的《传播和促进开放政府数据的使用:一项基于巴西里约热内卢市政厅的案例研究》旨在确立开放政府数据的管理策略[20]。Masahiro Yamamoto等学者在《美国报纸编辑对社交媒体作为新闻来源评级》一文中探讨了社交媒体的内容在多大程度上可以作为新闻数据的来源。[21]此外,对于数据采集的研究大部分探讨了有关技术和伦理的问题。Edson C.Tandoc Jr和Ryan J.Thomas在《网络分析的伦理》中提出,在通过收集受众的数据后由算法可以了解受众偏好的技术背景下,新闻工作者要警惕这种将受众过于细分的危险,应以新闻专业主义的伦理规范来平衡公共利益和受众需求。[22]3.对于数据新闻特征的研究
这类研究主要在图中的#2、#7,论文重点讨论数据新闻的参与性、创新性和交互性等特征。代表性的关键词包括“交互(interactivity)”、“参与(participation)”、“创新(innovation)”、“创造(creativity)”、“数字文化(digital culture)”。Inka Salovaara在《参与式地图:数字信息图和新闻生态》中介绍了亚马逊新闻数据平台“InfoAmazonia”进行热带雨林环境传播的可视化示例,指出这种数字地图增强了新闻工作者、生态系统和物种等的互动,为受众提供了清晰的信息体验。[23]Sandra Zwinger的《在线新闻中交互性信息图的接受度和可用性》也强调了交互式信息图是传播复杂新闻信息的有力工具,并通过调查总结目前可视化信息图制作的成功因素,为未来受众更好地接受数据新闻中的交互式信息图提出建议。[24]Stefan Baack在《数据化和赋权:开放数据运动如何重新阐明民主、参与和新闻的概念》从三个方面做了关于开放数据的调整,第一个调整认为应该把数据视为生成知识的先决条件,行动者需要从之前源代码的分享转向原始数据的共享,并且,共享原始数据应该打破政府垄断,允许公众参与并利用这些原始数据解释公众问题。[25]4.对于数据新闻人才培养的研究
这类研究主要在图中的#5,论文内容主要关注目前国外部分院校、媒体机构已开设数据新闻教育的现状和面临的阻碍。代表性的关键词包括学生(student)、大学(university)、新闻教育(journalism education)、读写能力(literacy)等。澳大利亚学者Kayt Davies和Trevor Cullen在《澳大利亚大学的数据新闻课程》中通过访谈35位来自不同学校的教授,得出了数据新闻教学中的技术种类、数据来源还有面临的障碍。这些障碍包括数学的厌恶、低水平的读图能力、缺乏技术升级时间和新教材的学习空间。[26]这篇文章为后来数据新闻如何更好地适应教学提出了建议。Sergio Splendore等学者的《数据新闻的教育策略:一项基于欧洲六国的对比调查》,通过比较德国、瑞士、荷兰、意大利、波兰和英国这六个国家的数据新闻教育,得知非学术机构(如欧洲新闻中心或调查新闻中心)和主要的国际新闻媒体(如《卫报》和《纽约时报》)是主要的教育提供方,这和长期从事新闻实践所得的经验有关。另外,作者提到运用数据生产新闻可以揭示隐藏的现实问题,尽管数据新闻教育是一门非常年轻的学科,但不可忽视最基本的新闻工作原则,比如道德问题、透明公开性、问责制和回应机制。[27]这篇文章批判了许多从事数据新闻教学人员单方面重视数据处理技能培养的问题,指出学生综合思辨能力和数据呈现能力的结合才是未来数据新闻人才的培养方向。
(三)研究趋势辨析:时区图
为了更形象地展示出数据新闻研究领域的发展阶段与趋势,本文通过CiteSpace软件绘制出了该领域的关键词聚类时间线视图从(图10 图10见本期第67页)。
从图10可以看出,26年间数据新闻领域的研究热度,大致可以划分为1997–2007年、2008–2015年、2016–2018年三个阶段。1997–2007年由于技术的限制,新闻报道很少涉及与数据结合的报道。2008年后,随着大数据技术的推动,数据新闻的形式在新闻报道中迅速崛起,2012年《卫报》在美国大选期间做了多达55篇信息图表,而且除了静态图表外,还有近三分之一的报道运用了交互式动态图表。除了技术的推动,业界为数据新闻设立奖项的增多和社交媒体等移动终端的迅速普及,也为数据新闻的发展提供有力支撑,因此2008–2015年出现多个研究热点。2016–2018年,研究热度开始呈现下降趋势,重点也开始转移,主要研究放在了大数据热后新闻从业者如何对数据进行把关、利用数据新闻对虚假信息的事实核查等命题上,实现了从数据新闻本体的相关研究到外延的伦理规范研究的转变。
四、简要的结论与研究的不足
本文基于CiteSpace可视化软件以Web of Science数据库中有关数据新闻的文献为样本,分析了数据新闻研究现状、知识基础、研究前沿和热点等内容,得到如下结论:
1.自数据新闻提出和运用以来,受到业界以及学术界的广泛关注,近年来研究兴趣更显浓厚,研究总体呈现良好发展态势。在地理空间上,研究成果大量集中在美国和英国等欧美国家,而中国等亚洲国家的数据新闻研究相对较少,还有很大的发展空间。
2.就数据新闻相关研究的合作情况来看,数据新闻学术场域的合作团队比较松散,研究成果多为个人研究成果。数据新闻研究的机构网络较为松散,各研究机构有一定联系。而数据新闻研究的国家合作网络较为紧密,以美国、英国等欧美国家为中心的合作较为密切。
3.通过共被引文献路径信息发现一些对数据新闻研究有长远影响的重要文献,这些文献构成了数据新闻研究的知识基础。如Jane B. Singer的《参与式新闻:保护在线报纸的门户》、Dominic L. Lasorsa的《使Twitter正规化:新兴传播空间中的新闻实践》等文献。但共被引文献聚类特征不明显,数据新闻研究的专注度有待提高。
4.通过文献关键词的聚类分析,数据新闻研究的内容版图可以大致归纳为:对于数据新闻的内容研究、数据来源和采集数据的研究、数据新闻运用中的伦理与规范化研究,以及人才培养的研究等四个方面。从聚类时区视图发现,随着信息技术的不断发展,数据新闻的研究也愈发深入,一些新型视角正在被引入数据新闻的研究领域。
本次研究中数据收集是关键一环,而其中使用的检索方式尤为重要,但目前的检索方式仍存在进一步优化的可能性。此外,本研究利用CiteSpace引文空间分析软件从宏观着手,概括性地计量分析了数据新闻研究的现状,但具体到每篇相关文献时,对文献全文内容关注不足,有待后续研究在进一步扩展数据的基础上,采用与文本分析交互的方法,去深挖数据背后隐含的丰富内涵。■
①BounegruL.Chambers, L.and Gray, J. (Eds.). (2012). The Data Journalism Handbook. EJC: Brussels. http://datajournalismhandbook.org/1.0/en/.
②陈悦、陈超美、刘则源:《CiteSpace知识图谱的方法论功能》,《科学学研究》2015年第2期
③ChenC. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology,200657(3):359-377.
④杨宇琦:《报复性公正研究知识基础与研究热点——基于citespace的信息可视化分析》,《西南交通大学学报(社会科学版)》2018年第1期
⑤马仁锋、梁贤军、姜炎鹏:《西方文化创意产业研究学术群体与热点演进》,《世界地理研究》2015年第2期
⑥Sylvain ParasieEric Dagiral. Data-driven Journalism and the Public Good : “Computer-assisted reporters” and “Programmer journalists” in Chicago[J]. New Media and Society,2014 ( 4) : 853-871.
⑦刘义昆、卢志坤:《数据新闻的中国实践与中外差异》,《中国出版》2014年第20期
⑧https://wearesocial.com/uk/special-reports/global-statshot-august-2015.
⑨Seth C.Lewis. The Tension Between Professional Control and Open ParticipationInformationCommunication & Society2012(15):6836-866.
⑩[11]刘则渊、陈悦、侯海燕等:《科学知识图谱:方法与应用》第54、58页,人民出版社2008年版
[12]SingerJ.B. Journalism:Guarding Open Gates at Online Newspapers[M].2011..
[13]Deborah Soun Chung. Profits and Perils Online News Producers’ Perceptions of Interactivity and uses of Interactive Features[C]. Convergence: The International Journal of Research into New Media Technologies 2007(13)1:44-61.London.
[14]David Domingo , Thorsten Quandt , Ari Heinonen , Steve Paulussen , Jane B. Singer & Marina Vujnovic PARTICIPATORY JOURNALISM PRACTICES IN THE MEDIA AND BEYOND[J]. Journalism Practice. 2008(2)3:326-342.
[15]Eugenia Mitchelstein and Pablo J. Boczkowski.Between tradition and change A review of recent research on online news production[J]. Journalism.2009.10(5):562-586.
[16]Dominic L. LasorsaSeth C. Lewis & Avery E. Holton. NORMALIZING TWITTER Journalism practice in an emerging communication space[J].2012.(13)1:19-36.
[17]张灵芝:《1998年以来中国高等教育研究热点及其知识可视化图谱分析———基于 CSSCI 高等教育类论文关键词的分析》,《高教探索》2012年第2期
[18]Katharina Rall, Margaret L. SatterthwaiteAnshul Vikram Pandey, John EmersonJeremy BoyOded Nov & Enrico Bertini. Data Visualization for Human Rights Advocacy[J]. Journal of Human Rights Practice.2016(8):171-197.
[19]T. Nirmala ,I. Arul Aram. Environmental Images in Indian Newspapers[J]. Asia Pacific Media Educator.2018.28(1):38-54.
[20]Ricardo MatheusRIBEIROManuella Maia RibeiroJosé Carlos Vaz. Strategies and instruments for the dissemination and promotion of open government data use in Brazil: case study of Rio de Janeiro city hall[J]. Revista Tecnologia e Sociedade.2018.14(33): 172-189.
[21]MASAHIRO YAMAMOTO,SEUNGAHN NAH & DEBORAH S. CHUNG U.S. Newspaper Editors’ Ratings of Social Media as Influential News Sources[J]. International Journal of Communication.2017(11):684–700.
[22]Edson C. Tandoc Jr. & Ryan J. Thomas. The Ethics of Web Analytics[J].Digital Journalism, 2015(3):2243-258.
[23]Inka Salovaara (2016) Participatory Maps, Digital Journalism, 2016(4):7827-837.
[24]Sandra ZwingerJulia Langer, Michael Zeiller. Acceptance and Usability of Interactive Infographics in Online Newspapers.
[25]Stefan Baack. Datafication and empowerment: How the open data movement re-articulates notions of democracyparticipationand journalism[J]. Big Data & Society.20152(2):1-11.
[26]Kayt Davies. Trevor Cullen. Data Journalism Classes in Australian Universities: Educators Describe Progress to Date[J]. Asia Pacific Media Educator.201626(2):132-147.
[27]Sergio SplendorePhilip Di SalvoTobias Eberwein, Harmen Groenhart , Michal Kus & Colin Porlezza. Educational strategies in data journalism: A comparative study of six European countries[J]. Journalism.201617(1):138-152.
傅居正系北京师范大学艺术与传媒学院2016级硕士研究生,喻国明系教育部长江学者特聘教授、北京师范大学新闻传播学院执行院长、中国人民大学新闻与社会发展研究中心主任。