上一期
下一期
目录
  • 38页
  • 39页
  • 40页
  • 41页
  • 42页
放大 缩小 默认 上一篇 下一篇
网络虚假信息传播特点及治理
——基于2016年上半年的大数据分析
■杨丹
  【本文提要】随着社会化媒体、移动互联网的快速发展,网络虚假信息的传播以几何级数扩散,引起了社会的广泛关注。本文通过抓取微博、微信、新闻网站及手机客户端等多个来源的数据进行分析,汇总2016年上半年影响较大的虚假信息,梳理虚假信息的内容和传播特征,并在此基础上提出基于大数据技术的网络虚假信息治理策略。
  【关键词】网络虚假信息 内容特征 传播特征 大数据 
  【中图分类号】G201
  网络虚假信息指通过网络媒介传播的不以客观事实为依据,或无中生有,或添枝加叶,或偷梁换柱的信息。一旦被新闻媒体报道,则成为虚假新闻。例如2016年上半年影响很大的“九江地震”、“上海女孩逃离江西农村”等。为了深入系统研究网络虚假信息的传播特点,本文采用分布式爬虫技术,监测1000万个微博账号、40万个微信公众号,以及主要网络媒体和传统媒体客户端的内容,从媒体关注度、受众关注度、内容影响力等多个维度进行分析,研究网络虚假信息的传播。
  
一、热点网络虚假信息的内容特征
  根据大数据监测,2016年上半年,传播热度指数最高的虚假信息是“2016年养老金调整方案”,其次是民生类的“雷洋尸检结果”和 “上海女孩逃离江西农村”。(表1 表1见本期第39页)
  2016年上半年,网络虚假信息内容涉及的主题领域较为广泛,覆盖社会民生、公共安全、政策法制、国际关系等领域。其中,和人们生活相关的社会民生类、公共安全类占比较大,分别为41%和35%,其次是政策法制类,占10%(图1 图1见本期第39页)。
  与往年相比,政策法制类和国际关系类表现较为突出,尤其是政策法制类,有3个事件进入热点虚假信息前十。这些政策与人们的生活联系紧密,涉及养老保险、依法治理、娱乐文化等多个方面。为了吸引眼球,增加阅读量,政策法制类虚假信息的主要表现形式为偷梁换柱型和添枝加叶型。
  例如,“2016年养老金调整方案”属于偷梁换柱型,将“2014年”、“2015年”的信息改成“2016年”;“papi酱遭广电总局封杀”和“海淘新政:不管是旅游还是代购都要交税”属于添枝加叶型,广电总局要求papi酱下线整改而非封杀,海淘新政主要针对的是“天猫国际”、“网易考拉”等跨境电子商务网站的贸易性征税问题,而非个人的非贸易性税收。
  1.用户自制内容成为主要虚假信息源
  根据数据监测,用户自制内容成为主要的虚假信息源。虚假信息源主要来自社交媒体平台,微博和微信分别占比达到47.3%、37.8%;比较之下,具有把关人审核的网络媒体占比则相对较小,为14.9%。(图2 图2见本期第39页)但是经过部分网络大V,媒体官方微博、微信公众号转发扩散后,助推了社交媒体平台虚假信息的传播热度。例如,在“上海女孩逃离江西农村”虚假信息中,网民“想说又说不出口”发布相关信息后,环球时报微博在事件存疑,没有对其真实性进行查证的情况下,仍选择发表针对该事件的评论,并将话题讨论焦点提升到社会阶层价值观差异的高度,得到1558条转发、2235条评论、2503个点赞,成为事件发酵的开端。在微信平台上,自媒体传媒圈、评说、金融八卦女等自媒体账号,使用相同的素材,分别从上海姑娘教养、农村日常生活、阶层鸿沟等不同角度评说该事件,均得到了10万+的阅读量和上千的点赞量。
  2.网络虚假信息表现形式更具迷惑性
  网络虚假信息表现得越来越具有专业化特征,更具迷惑性。在内容表达形式上,有35.1%的虚假信息采用图文结合的形式,有24.3%的虚假信息将图片、视频、文字相结合,有25.7%的虚假信息采用了行业术语等专业表达方式,仅有14.9%的虚假信息使用了较为生活化、口语化的普通表述。(图3 图3见本期第40页)
  从虚假信息的内容表达来看,图片和视频等表达形式不仅具有很强的视觉冲击力,还使人具有“有图有真相”的现场感。例如,“中国游客泰国吃自助餐疯狂铲虾”配发了游客在自助餐厅用盘子铲虾的视频,“大妈碰瓷玩具车”配上了大妈在玩具车前倒地的照片等。一些虚假信息采用专业化表述,也大大增加了对受众的迷惑性。例如“2016养老金调整方案”、“papi酱遭广电总局封杀”等。
  研究发现,政策法制、国际关系、金融财经等涉及政治、经济领域的虚假信息使用专业术语的频率相对较高;而公共安全类、社会民生类的虚假信息则普遍使用视频和图片等多样化的传播形式,这往往使其真实性更难判断。
  3.民生、安全相关虚假信息的网民关注度较高
  从数据分析结果来看,网民对社会民生、公共安全类的虚假信息关注度相对较高,关注度得分分别为161.8和120.2,(图4 图4见本期第40页)远高于其他类型的信息。虚假信息涉及养老、住房、医疗、安全等社会热点问题时,网民在传播和评论时的盲从跟风概率就会有所提升。虚假信息的制作或传播者往往会充分利用信息传播的“沉默螺旋效应”,选择与民众思想倾向一致或者对立的角度来吸引用户参与传播或加入论战,从而提升信息的传播热度。例如,社会民生类的“雷洋案法医尸检结果”网民关注度最高,平均每篇信息的评论量为5698,排名第一,微信阅读量和微博互动量也相对较高。
  
二、网络虚假信息的传播特征
  1.虚假信息的传播路径
  2016年上半年网络虚假信息的传播路径较为复杂,但是最为主要的传播路径是“社交平台普通用户-意见领袖-商业网站-传统媒体”。例如在“最强大脑选手帮警方侦破悬案”传播过程中,3月11日,微博用户@未味第一次发布相关话题;3月23日,传统媒体人民日报官微发布相关信息,随后,@蒋大哥、@最强大脑等微博意见领袖转发,推动事件爆发(图5 图5见本期第41页);3月25日,新浪、网易等商业网站推送该信息,同日,该信息登上新华网、人民网等传统信息媒体网站。
  2.网络虚假信息传播的3天引爆期
  虚假信息的传播速度快,从信息出现到爆发的时间间隔变短。部分信息移动客户端、信息网站、社交媒体、自媒体平台等为了吸引用户,增加媒体平台的商业价值,经常来不及核实信息的真实性就快速转发,使得虚假信息可以在极短时间内迅速爆发。根据数据分析结果来看,在24小时内爆发的虚假信息占比达到29.7%,1~2天内爆发的占39.2%,3天以内的引爆比例达到了68.9%。(图6 图6见本期第41页)值得关注的是,公共安全类和国际关系类的虚假信息爆发速度最快,96.3%的公共安全类虚假信息会在2天内爆发,75%的国际关系类虚假信息会在24小时内爆发。
  3.网络虚假信息的1天证伪周期
  受网络虚假信息治理和网民媒体素养持续提升等因素的影响,网络虚假信息的证伪周期较短,从数据分析结果看,85.2%的虚假信息能够在2天内被证伪。其中,24小时内被证伪的虚假信息占54.1%,1~2天内被证伪的占31.1%。(图7 图7见本期第41页)
  从信息类型来看,证伪时间间隔较长的主要是社会民生类和政策法制类,分别占63.6%和27.3%。这两类虚假信息的表达形式大多以图文为主,内容专业化表述较多,网民鉴别起来有一定的困难。而且,这两类虚假信息的内容大多涉及民众关注度极高的住房、养老、税收、退休、道德等主题,内容的亲近性和煽动性极强,往往会促使网民更关注虚假信息的观点立场,而忽略了其内容的真实性。特别是政策法制类虚假信息,往往以“社会批判者”姿态进行评论,通过负面信息的传递来吸引网民关注,对政府形象造成了严重损害。
  
三、网络虚假信息危害的实证分析
  1.网络虚假信息的整体情感值为负
  为了获得时效性、最大点击率或者关注度,通过虚假信息吸引用户,可能致使用户产生负能量,对用户造成显著的误导。在“上海女孩逃离江西农村”事件中,涉及婚姻观、城乡差距、贫富差距、社会阶层固化等社会问题,整体的情感值为负2.3,负能量较大。其中,对婚姻产生的情感值为负3.1,对社会产生的情感值为负1.5。在剧情翻转后,有3.1%的受众明确表示浪费感情,感觉自己被耍着玩儿,对虚假信息深恶痛绝;也有4.3%的读者认为虽然事件是假的,却真实揭露了社会中存在但又被刻意隐藏的问题。
  2.虚假信息削弱媒体公信力
  由于新闻媒体在虚假信息传播中所起的关键作用,损害了媒体公信力。在2016年上半年虚假信息传播中,有11.3%的用户表示对媒体报道的真实性表示怀疑。尤其是在江西九江浔阳区发生6.9级地震的虚假报道中,对媒体表示失望的用户高达69.7%。
  3.网络虚假信息使政府陷入塔西佗陷阱
  网络虚假信息的传播一定程度上降低了政府部门的公信力,推动政府部门陷入“塔西佗陷阱”:无论说真话还是假话,做好事还是坏事,都会被认为是说假话、做坏事。在“雷洋尸检结果”事件中,@五岳散人、@大尸凶的漫画、@楊康令等微博大V明确表示对执法人员不信任,对政府不信任,并分别获得上千的转发。在该事件的评论中,有23.1%的用户认为警察在执法过程中滥用权力,有17.3%的用户担心官官相护。
  
四、基于大数据技术下的网络虚假信息标签化治理
  2015 年10 月,《纽约时报》提出研制“信息编码”(Particles Code),通过给信息内容加上可提取、可检索的编码,实现累积性,组织成链,以内容标签防范虚假信息。但是,该方法采用“串珠式”关联,比较简单缺乏语义和知识级的深层次关联。为了更好地治理网络虚假信息传播,我们认为,应利用大数据技术,实时抓取媒体、微博、微信、视频等非结构化数据,对海量内容进行有序整理,并结合政府机构、新闻工作者、网民等各方力量对网络信息加注“标签”,用户可以根据信息标签识别其真实性。(图8 图8见本期第42页)
  同时,利用大数据技术将深度挖掘、机器学习等技术,应用到虚假信息的真实性判定上。利用中文自然语言处理技术,判定发布的新消息与历史消息的相似度;利用图像处理技术,判别信息图片与历史舆情事件图片的相似度,综合语音和图像处理技术,判别视频内容与历史视频的相似度,从文字、图片、视频等维度综合判定信息的真实性,充分发挥技术力量在治理虚假信息传播方面作用。
  通过将非结构化的数据量化,利用布尔逻辑、向量空间、神经网络、深度学习等模型方法,结合历史虚假信息的传播特征,可以更好地预测虚假信息的传播导向、传播节点,实现虚假信息预警和跟踪,有效预警虚假信息的传播,降低虚假信息的负面影响■
  

注释:
①赵曙光:《社交媒体的使用效果:社会资本的视角》,《国际信息界》2014年第7期
②杨保军、朱立芳:《伪信息:虚假信息的“隐存者”》,《信息记者》2015年第8期
③李立威、王晓红:《网络虚假信息的来源、传播路径和治理机制》,《信息与传播研究》2011年第3期
④赵曙光:《消失的入口价值:从注意力竞争到产业链竞争》,《信息与传播研究》2014年第6期
⑤《3月十大假信息,全是坑!千万别信了》,“人民日报”微信公众号2016年4月8日
⑥马薇薇、华东:《网络虚假信息的传播模式》,《青年记者》 2009年9月上
  
杨丹/北京数太奇科技有限公司研究员。本文数据来源:数太奇新闻大数据监测平台、数太奇社交媒体大数据监测平台。
  
  
  
  
  
  
主管单位: 上海报业集团
主办单位: 上海报业集团      上海社会科学院新闻研究所