数据入侵:“538”博客的实践与启示
□瞿旭晟
【本文提要】本文以数据驱动新闻的新闻业实践为背景,结合对于政治新闻博客“538”的个案分析,讨论大数据以及数据化思维对传统新闻业在新闻报道形态、新闻组织形态、新闻记者和组织角色等方面产生的冲击,并在此基础上尝试提出新闻行业在大数据时代需要直面的问题与挑战。
【关键词】大数据 数据驱动新闻 数据开源 新闻生产 Five Thirty Eight
【中图分类号】G210
近几年来,伴随着网络技术对社会生活中的全面渗透,一股新的数据浪潮正迎面而来。“数据集”、“非结构化数据”以及“大数据”等语汇在各行各业开始流行。传媒行业因其和信息产业的天然紧密联系,相关主题的讨论更是不绝于耳,这些议题分布在新闻记者如何处理非结构化数据,数据驱动新闻如何改变行业语态,大数据对传媒业形态的影响等各个层面。本文试图以FiveThirtyEight这个案例为切入点,从一个非常小的侧面来理解数据化思维的引入对新闻报道形态、组织重构等方面的影响,进而分析在数据化浪潮下新闻业需要直面的挑战。
FiveThirtyEight:“统计学家”闯进新闻圈
2012年由哥伦比亚新闻研究院发布的《后工业时代的新闻业》报告中指出,随着信息收集、解读和传播方式的持续革新,十年以前无法想象的信息传播方式今天已经可以实现,比如通过数据自动化生成新闻,比如通过“众包”方式来获取数据并持续更新报道,比如通过现有数据的进一步挖掘来发现新的信息。①而由Nate Silver创办的FiveThirtyEight(下文简称“538”)博客就是前述最后一种类型的代表——通过分析和过滤现有数据集,“538”从旧数据中发掘出新故事。
“538”目前是《纽约时报》旗下的博客站点,其名称来自美国总统选举中全国选举人票的数量。从名称即不难推测,“538”是一个致力于政治领域特别是政治选举相关议题报道的站点。事实上,也确实是因为在政治选举预测方面的惊人表现,“538”在美国政治新闻报道圈中极为引人注目。而更加让人吃惊的是,主持这个政治新闻博客的却是一个“圈外人”:统计学家Nate Silver。
职业生涯起步于商业咨询公司毕马威的Nate Silver看起来和新闻行业没有多少联系,尽管在芝加哥大学求学期间他曾经得到过去《华盛顿邮报》工作的机会。在白领工作之余,Nate Silver自行设计开发了一套统计模型,该模型通过对美国棒球职业大联盟历史赛事数据及运动员数据的有效挖掘,以相当高的成功率推测如何配置运动员才能获得更大的赢球概率,这套模型最终被相关商业公司收购,这是Nate Silver的数据天才在实际社会生活中的第一次演练。
2008年,Silver意识到当时绝大部分政治预测报道完全不能适应实际需要。他想重新改造这一领域。在一次和《纽约时报》编辑Gerald Marzorati于火车月台上的短暂交流后,“538”作为一个独立博客诞生了。②其时,他的预测能力使奥巴马的竞选团队也来寻求指导。③在2008年选举日当天,这个诞生不久的博客吸引了300万访客。④当年,他成功预测了全美50个州中49个州的总统选举结果。
2008年的成功,使得“538”一炮走红,尤其在整理和分析鱼龙混杂的民调数据方面迅速成为一个权威的信息渠道。⑤2010年,Silver和《纽约时报》签订了为期三年的合约,使得他从圈外人变成新闻行业的内部人。自2010年夏天在《纽约时报》运作以来,“538”一直是该报在政治新闻报道方面别具一格的风景。到2012年年初,根据对《纽约时报》网站浏览量的统计,大约10%~20%的政治报道浏览量中包含有“538”,而在总统选举前一周,这个数字达到71%。选举前一天,《纽约时报》网站的访客中有20%浏览了“538”。换句话说,在这个全美第六大新闻网站上,每五个访客中就有一个造访Silver的博客。甚至《纽约时报》的公共编辑Margaret Sullivan也称赞Silver“可能是这个时候最引人注目的记者”。⑥《纽约时报》的执行主编Jill Abramson更直言不讳地承认,“‘538’为报纸网站带来了巨大的流量,有趣的是,相当一部分流量是完全冲着Silver来的”。⑦
“538”的成功,背后是Nate Silver将民调和选举数据转化为新闻业富矿的非凡能力,其关键在于他自己开发的统计预测模型。在2012年11月6日大选日几周以前,他就声称综合民调数据显示奥巴马将赢得选举。选举日当天,他预测奥巴马有90.9%的机会赢得此次选举。正如Greg Sargent在《华盛顿邮报》的专栏文章中所说的,成千上万的普通选举观察者淹没在“一片混乱和相互矛盾的数据与推测”中,他们发现Silver基于常识的预测比媒体上所谓的专家评论员要更加靠谱。《纽约时报》的主编助理Jim Roberts说,“我们有很多非常棒的政治记者,他们都可以抓住新闻的精华,但是Nate的工作确实填补了一个空白,在民调数据泛滥的当下,他让民众能够理解民调的意义并做出判断”。⑧质而言之,Nate Silver的成功,是新闻业“逻辑对权威”的胜利。⑨将来源各异的各选区基本人口数据、就业数据、市场数据、既往投票数据等不同类型的数据纳入到自己的统计预测模型中来,“538”的报道在承认不确定性的前提下以严谨的逻辑支撑明确的结论,呈现出一种和传统报道样态迥异的风格。
数据驱动新闻的新报道形态
虽然有人认为,Nate Silver的工作并不直接涉及大数据,他所处理的都是他能接触到的相当细微和有限的数据集。这些数据集合起来具有强大的预测力,但这并非大数据。⑩但按照大数据专家维克托·迈尔-舍恩伯格的衡量标准:“建立在相关关系分析法基础上的预测是大数据的核心。” [11] Nate Silver所做的工作无疑和大数据有着密切的逻辑联系。诚然,数据在新闻报道领域并非新鲜事物,数据新闻和印刷媒体一样历史悠久,一些大型报纸也早早就开始了所谓数据可视化的工作。换句话说,数据新闻久已成为媒体行业的一部分。[12]甚至部分新闻机构因为在金融市场数据领域的成功开拓而建立起专业名声。但是今天的数据新闻和由数据驱动的新闻面临着完全不一样的情境。
长期以来,人们的日常生活、工作和学习中所产生的数据都难以收集、整理并模型化。“甚至在2000年的时候,数字存储信息仍只占全球数据量的四分之一;当时,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上”。[13]但得益于互联网技术的发展,近十年来,越来越多的数据以惊人的速度被生产并储存起来。这些所谓的大数据正在不断丰富新闻业的素材库,以至于新闻业可持续发展的一个重要问题就是传统新闻机构如何应对、处理这些数据。[14]而《纽约时报》对“538”及其代表的报道形式的积极接纳,为未来数据新闻的开拓提供了参考。
1.社会科学方法再引入
越南战争期间,沃尔特·克朗凯特的报道也影响巨大。但后者的权威来自他已经建立起来的公信力,而在这个数字化的时代,Silver的权威性却是来自他在数据处理方面的科学方法[15]。正如前文所述,在“538”这样的实践形态中,Nate Sliver所做的工作就是承担统计学家的角色,将简单但强大的经验性方法引入充满争议的政策议题讨论,并以高度量化的形式呈现给普通读者。尽管和传统新闻工作者一样在做事实核实的工作,但Silver是通过算法来分析大量的统计模型,测算其准确度并提出自己的结论。而在传统新闻报道形态中,这是无法想象的。正是由于Silver及其同道的工作,新闻业在理解、分析和呈现数据方面取得了长足的进步。[16]
其实,这个变化的趋势也可以在相关专业会议上看到苗头。调查记者与编辑协会的前任执行主席 Brant Houston就明确提到:“数据分析所呈现的模式、趋势和偏值能给予新闻报道更强的可信度。” [17]在美国,数据新闻领域知名的Philip Meyer新闻奖就专门授予在新闻报道中将社会科学方法使用得最好的新闻从业人员。在这样不断变化的语境下,传统的貌似客观而又千篇一律的“他说/她说”式报道已越发显得过时。[18]万维网的奠基人Tim Berners-Lee在谈及新闻记者角色时也说,新闻记者“不能再是在烟雾缭绕的酒吧里同人搭讪以获取新闻线索”,而应该具有“让自己学习分析数据的技能”,从而“帮助人们切实理解其周遭的现实”。[19]
2.数据开源
在数据驱动新闻或者数据新闻的早期实践者群体中,Nate Silver某种意义上不是主流,因为这个圈子里被许多人津津乐道的“开源”精神并不被他所待见。一直以来,由于对自己在分析数据过程中所使用的统计模型和推测流程的严格保密,他遭到新闻圈和IT圈的双重批评。
但尽管如此,“538”的成功在很大程度上也要得益于“数据开源”运动所形成的文化。在有关总统选举以及相关政治议题的预测报道中,无论是政府开源数据、民调公司公开数据,还是其他社会组织推进公开的数据,Nate Silver都可以信手拈来为己所用。以为“538”赢得巨大名声的2012年美国总统大选为例,从宏观层面的联邦政府数据(包括人口数据、劳动力分布数据、就业形态数据、医学数据、犯罪率数据等等),到具体而微的某些小选区的细节数据,Silver正是在大大小小的数据集和数据库中免费遴选、整理、分析、建模并形成自己的结论。
3.专业人士进入
著名博客Coddington曾撰文探讨Nate Silver这样的专业人士不断进入新闻圈的现象。在他看来,新闻业长期以来津津乐道的客观准则不仅是小心翼翼的中立,也不是故意表现得没有偏见。对于记者来说,这是他们在解释现实方面获得权威性的基础。这种客观的权威性深植于特定的工作流程。这个流程大致是这样的:新闻记者从官方优先获得某些信息,然后通过所谓的“新闻敏感”来评估、过滤信息并进而形成报道。而Nate Silver的工作在信息获取方面,完全没有任何优先性。同时,一般政治报道记者的信息是通过主观以及不可言说的专业性来评估的,他的评估是系统性的且具备科学基础。它虽然同样包含判断,但这个判断基于科学的过程,我们可以追溯他是如何利用这个判断来达致自己的结论。这种不同的思维方式不可避免地会产生不同的结论。[20]
也正是因为这个缘故,Silver不幸成为对统计学基本逻辑一无所知的传统媒体权威的攻击目标,他们认为Silver的工作迎合党派偏见(2008和2012年两次总统选举,Silver都事先预测奥巴马赢得选举的机会大大高于其对手)。[21]事实上,在开源数据爆发之后,对于数据专业人员的渴求将在新闻行业进一步加剧,因为开源数据爆发会产生很多噪音,这些需要有专门知识背景的人通过其专业的工作才能将信号从噪音中分离出来并提供有意义的观察。[22]与此直接相关的是,编程在新闻业中的地位会越来越高,尽管不是所有的记者甚至数据记者都需要编程,但正如Medill新闻学院的Rich Gordon所言,所有的记者都应该理解编程的意义。[23]
数据依然服务于故事
如前所述,报道形态的持续更新在新闻行业是可以预期的,但这并非意味着编辑记者不再珍惜他们的优良传统:讲述优美的故事。数据的大规模介入只是“讲故事”的方式,而不是取代故事。从这个意义上来看,“数据是一种资源,也是一种工具。它告知信息但不揭示信息”。[24]换句话说:数据是对信息数字化的记录,其本身并无意义;信息是指把数据放置到一定的背景下,对数字进行解释、赋予意义。[25]而在新闻行业,“讲故事”是传达信息最有效也是最古老的形式。
在美国,“538”的预测性报道是政治新闻领域所谓“赛马式新闻报道” [26]的典型表现。从这个意义上来看,其报道的可读性并不强。这也是为什么《纽约时报》的记者Sarah Cohen会说,“Nate Silver是为那些分析数据的人写作,我们其他人则需要将数据弄得更有趣更好理解”。[27]但尽管如此,Nate Silver也明白,对于新闻业来说,有趣的故事永远是根本,他在哥伦比亚大学演讲中曾提到:“我们最终追求的是故事。统计本身并不构成事实真相。” [28]在其新著中,他也一再强调:“基于数据的预测可能成功,也可能失败……在索取更多数据之前,我们需要索取更多的自我。” [29]
因此,在数据驱动新闻的实践中,对记者来说最大的挑战在于如何检视数据并从中找到有意义的点。《华尔街日报》的调查记者James Grimaldi说,“没有叙述,没有故事,数据本身并无意义”。[30]路透社的数据新闻记者Himanshu Ojha说,“数据集本身相当于丰盛的事实素材,而数据与数据之间的关系才能建构一个故事或者说一篇报道”。[31]
另外,对数据的有效利用往往是更深入的人的故事的起点,尽管囿于题材限制,“538”的报道尚达不到这一点,但在近年来的数据新闻报道中,类似案例并不鲜见。《华盛顿邮报》在调查当地枪支泛滥情形的深度报道时就是从检视枪支销售和犯罪数据开始的,这些数据是记者工作的起点——一旦他们找到华盛顿特区哪个区域的枪支使用最为泛滥,他们就需要花上数月的时间来和枪支犯罪受害者沟通,并进而写出更为深刻的人的故事。[32]
意义与启示
在互联网发展早期,搜索和信息过滤曾经是新闻业的核心机遇。显然,Yahoo以及随后Google的崛起说明传统新闻业错失了产业转型的好机会。今天,新闻行业的人们已经认识到数据的大规模引入会成为新的挑战和机遇,能否抓住这个机会可能会对新闻业的发展产生长远的影响。总体而言,美国新闻业在这方面的探索走在业内前沿,而对于面临同样挑战的中国新闻业而言,其所需要解决的问题可能更加迫切,这里略作小结,以供探讨。
1.记者与新闻机构组织面临角色转化要求
就“538”的诞生及其实践来看,它不仅在微观层面推动了新闻报道样态的更新,更在宏观层面对记者乃至整个新闻组织提出了角色转化的问题。本质上看,这是面对一个日益复杂化并且网络化的世界时,新闻业应当如何回应的问题。[33]事实上,这种挑战已经在传媒界蔓延开来,《赫芬顿邮报》(Huffington Post)和高客网(Gawker)这些先锋性新闻网站已经用数据而不是所谓记者、编辑的新闻敏感来决定新闻取舍。按照舍恩伯格的说法,“数据比有经验的记者更能揭示出哪些是符合大众口味的新闻”。[34]尽管对编辑来说,算法能解决读者兴趣这个事实是他们很难接受的。[35]与此同时,数据收集的成本前所未有的低,能够在分秒之间重组信息并生成报道的算法正在开发中,这些报道已经能够通过图灵测试(Turing test)[36]和人类撰写的报道几乎无异。[37]
这是为何那些具有前瞻性的媒体都在雇佣专业人士。这也是为什么媒体机构都在雇佣博客主。Nate Silver的“538”和《纽约时报》的合约将在2013年年中到期,其未来去向成为很多人关注的焦点。在诸多专业人士看来,在当前形势下,《纽约时报》比“538”更加需要对方。
2.新闻生产外部化、开源化若隐若现
新闻机构和新闻记者面临角色转化的同时,是传统新闻生产方式的巨大变革。《纽约时报》对外来户Nate Silver的接纳某种程度上也体现了这一点。事实上,还有更多的新闻组织在这方面的实践走得更远。深深扎根于开源社区和开放政府运动理念的程序员们为传统的新闻圈带来了完全不同的全新文化。[38]诸如《卫报》和ProPublica等新闻机构都已经开始使用原创的“众包”数据,可以说,“传统的、昂贵的、费时的”信息收集情形正在改变。[39]美联社记者Jonathan Stray说,构成新闻业的方方面面的工作既可以在编辑部内部完成,也可以在编辑部外部完成,可以是专业人士,可以是业余人士。[40]甚至民众也可以通过自己生成和分析数据的方式来提高对于政治事务的参与。[41]
3.数据开源要求政府有更加积极的作为
前文提到,尽管Nate Silver在算法开源问题上属于异类,但“538”的成功在很大程度上的确依赖于美国社会环境下丰富多元的数据来源。田溯宁在谈及大数据发展时曾指出,关键问题在于数据的“流动性”和“可获取性”。[42]在这方面,政府往往能够发挥特别大的作用,因为在很多行业中,“政府才是大规模信息的原始采集者”,[43] 2008年奥巴马上台之后,美国政府围绕data.gov大力推动数据开放运动。2009年,data.gov开始运作并设定一个原则:所有的政府数据都必须公开,并且能够以某种形式为公众所使用。前任美国联邦政府的首席信息官Vivek Kundra甚至力主通过立法来推动开源数据政策。[44]今天,众多政府数据门户不仅免费提供数据,而且相当一部分内容是以图表/地图等可视化形式提供的,使得记者能够更有效地完成数据驱动或者数据支持的报道。[45]相对而言,在中国语境下,政府在获取、整理数据方面的能力甚至比美国政府都更加强势,这也意味着在开放数据方面应该有更多的工作可以展开。
4.警惕数据独裁,行业呼唤透明性
前文分析主要聚焦在数据引入对新闻报道形态和组织重构方面的影响。事实上,数据本身并不是绝对客观的,用来处理数据的统计模型与相关数据挖掘技术更难以回避主观意图。哥伦比亚大学布朗媒体创新研究院院长Mark Hansen说,“数据包含了我们日常行为的方方面面。但是它们并非天然中立,我们用来解释这些数据的算法也不是天然中立的。从数据中抽离出来的故事往往不完整、不确定,包含了不同的可能性”。[46]
从这个意义上说,数据和算法同传统的新闻漫画以及新闻评论一样充满主观色彩,但由于专业门槛的缘故,大多数人对此都不甚了了。Nate Silver自己就对数据独裁的可能性有着清醒的认识:“大数据常常被视为万能药,正如上世纪70年代计算机被视为万能药一样……数字本身并不说话,是我们让数字说话的。我们赋予其意义。我们甚至可以按照对自身有利的方式解读它而完全背弃其客观现实。” [47]资深数据编辑David Donald说,“数据和数据集并非客观的;它们都是人类设计的产物”。[48]从这个角度来看,数据收集需要有透明性以及一整套的编辑准则的支撑。
现代世界的奥妙就在于它实现了规模极其庞大的相互联系。[49]具体到新闻行业来说,正如本文开始提到的《后工业时代的新闻业》报告所指出的,今天的新闻环境最让人兴奋的地方在于有着各种新型的合作、新的分析工具和数据来源,以及新型的信息传播方式。如何让未来的新闻传播受益于这种大趋势而不受其害,相关的探索才刚刚开始。■
(作者系上海理工大学出版印刷与艺术设计学院讲师。本文受“上海高校青年教师培养资助计划”项目和上海理工大学人文社会科学基金项目资助)
注释:
①[37][40]Anderson, C. W., Bell, E., & Shirky, C. (2012). Post-Industrial Journalism (pp. 1-126). Tow Center for Digital Journalism, Columbia Journalism School.
②Edgerton, K. (2013). A Conversation with Nate Silver. Retrieved from
http://web.mit.edu/comm-forum/forums/nate_silver.html
③[15]Scheiber, N. (2012). ‘The Signal and the Noise,’ by Nate Silver. The NewYork Times. Retrieved from
http://www.nytimes.com/2012/11/04/books/review/the-signal-and-the-noise-by-nate-silver.html?pagewanted=all
④[28]Silver, N. (2011). Journalism Day Henry Pringle Lecture. Retrieved from
http://www.journalism.columbia.edu/system/documents/478/original/nate_silver.pdf
⑤McBride, K. (2012). What Nate Silver’s success says about the 4th and 5th estates. Retrieved from http://www.poynter.org/latest-news/making-sense-of-news/194843/what-nate-silvers-success-says-about-the-4th-and-5th-estates/
⑥⑦Tracy, M. (2012). Nate Silver Is a One-Man Traffic Machine for the Times. Retrieved from
http://www.newrepublic.com/blog/plank/109714/nate-silver-the-times’-biggest-brand
⑧Tenore, M. (2011). FiveThirtyEight’s Nate Silver adjusts to New York Times, 6 months after joining the newsroom. Retrieved from http://www.poynter.org/latest-news/top-stories/120212/fivethirtyeights-nate-silver-adjusts-to-new-york-times-as-a-blogger-6- months-after-joining-the-newsroom/
⑨Lyons, D. (2012). Why Nate Silver Won, And Why It Matters. Retrieved from http://readwrite.com/2012/11/07/why-nate-silver-won-and-why-it-matters
⑩Zivkovic, B. (2012). Nate Silver and the Ascendance of Expertise. Scientific American. Retrieved from http://blogs.scientificamerican.com/a-blog-around-the-clock/2012/11/14/nate-silver-and-the-ascendance-of-expertise/
[11][13][24][34][42][45]维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》第2、12、75、149、180、247页,浙江人民出版社2013年版
[12][45]Akimoff, T. (2013). Big data: The new era of old data in the age of Nate Silver, open government and super computers. Retrieved from http://www.wbez.org/rising-tide-data-journalism-104947
[14][46]Bell, E. (2012). Journalism by numbers. CJR, September/October. Retrieved from
http://www.cjr.org/cover_story/journalism_by_numbers.php page=all
[16]Moser, W. (2012). Journalism in the Age of Nate Silver and Big Data. Retrieved from http://www.chicagomag.com/Chicago-Magazine/The-312/November-2012/Journalism-in-the-Age-of-Nate-Silver-and-Big-Data/
[17][23]Howard, A. (2012). In the age of big data, data journalism has profound importance for society. Retrieved from http://strata.oreilly.com/2012/03/rise-of-the-data-journalists.html
[18][27][39]Prakash, N. (2012). The Nate Silver Effect: How Data Journalism Can Predict the Future. Retrieved from http://mashable.com/2012/11/30/data-journalism-panel/
[19]Arthur, C. (2010). Analyzing data is the future for journalists, says Tim Berners-Lee. The Guardian, 22 November. Retrieved from http://www.guardian.co.uk/media/2010/nov/22/data-analysis-tim-berners-lee
[20]Coddington, M. (2012). Why political journalists can’t stand Nate Silver: The limits of journalistic knowledge. Retrieved from http://markcoddington.com/2012/10/31/nate-silver-journalism-politics-knowledge-epistemology/
[21]Nyhan, B.(2012). Pundits versus probabilities. Cjr.org. Retrieved from
http://www.cjr.org/united_states_project/pundits_versus_probabilities.php
[22][44]Kundra, V. (2012). Digital Fuel of the 21st Century: Innovation through Open Data and theNetwork Effect. Presented at the Joan Shorenstein Center on the Press, Politics and Public Policy.
[25]涂子沛:《大数据》第35页,广西师范大学出版社2012年版
[26]赛马式新闻报道是指在政治新闻报道特别是选举预测报道中,大量使用民调数据,反复强调各党派候选人在各个选区的起伏态势,而不是将报道重点放在各党派政策差异的分析和揭示。
[29][47]Silver, N. (2012). The signal and the noise: why so many predictions fail-but some don’t. The Penguin Press, New York. pp.9.
[30][32]Eklund, D. (2013). No Matter How Big Data Gets, it’s Still All About the Story. Retrieved from
http://flipthemedia.com/2013/03/no-matter-how-big-data-gets-its-still-all-about-the-story/
[31]Marshall, S. (2013). How big data is changing financial journalism. Retrieved from http://www.journalism.co.uk/news/-hhldn-how-big-data-is-changing-financial-journalism/s2/a551791/
[33]Stray, J. (2012). Data, uncertainty, and specialization: What journalism can learn from FiveThirtyEight’s election coverage. Retrieved from http://www.niemanlab.org/2012/10/data-uncertainty-and-specialization-what-journalism-can-learn-from-fivethirtyeights-election- coverage/
[35]Cukier, K. (2013). “We’re going to tell people how to interview databases”: The rise of data (big and small) in journalism. Retrieved from http://www.niemanlab.org/2013/03/were-going-to-tell-people-how-to-interview-databases-the-rise-of-data-big-and-small-in-journalism/
[36]图灵提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。
[38]Parasie, S., & Dagiral, E. (2012). Data-driven journalism and the public good: ‘Computer-assisted-reporters’ and ‘programmer-journalists’ in Chicago. New Media & Society, 0(0), 1-19.
[41]Daniel, A. & Flew, T. (2010). The guardian reportage of the UK MP expenses scandal: A case study of computational journalism. In: Paper presented at communications policy and research forum, Sydney, NSW, Australia, 15–16 November.
[48]Houston, B. (2013). Big Data in Need of Analytic Rigor by Journalists. Retrieved from http://gijn.org/2013/04/09/big-data-needs-analytic-rigor/
[49]马特·里德利:《理性乐观派:一部人类经济进步史》第201页,机械工业出版社2011年版