微信群的传播分析:节点、文本与社交网络
——以三个校园微信群为例
■禹卫华
【本文提要】本文从用户沟通、内容生产、网络构建等方面对三个微信群进行了分析。研究发现,微信群内部存在幂率分布,即少数用户生产了大多数的内容;内容交流符号主要是文本、网页链接、动画表情、图片,微信群的媒体属性比较明显;微信群的密度与中心度测量结果也印证了微信群沟通不平衡的特点;影响微信群活跃度的因素包括话题共识、社群结构、现实关系等。
【关键词】微信群 社会网络分析 社交媒体
【中图分类号】G206
目前,微信群既是用户获取信息的重要来源,也是社群生活的主要平台。随着时间的推移,用户对微信社群的使用黏性越来越高,社群生活成为人们真实生活之外最重要的活动领域之一。
技术的高速发展与理论研究的相对脱节造成了两个问题,一方面数据挖掘的方向不明确,导致研究者既不清楚微信群内信息的分布结构,也不清楚推动微信群内和群间信息传播的动力结构,研究一直停留在微信群的外围,并未深入到微信群内部。每年腾讯公司发布的微信群报告主要从整体的角度分析微信群,对微信群本身关注不多,原因是对微信群的研究不是对一个账号的研究,而是对几十乃至几百人的社群网络关系进行研究,所以,腾讯年度报告能够宏大叙事却未能解决微信群的社会网络的问题。
本文属于最早对微信群进行数据挖掘的学术研究之一,具有一定的探索性质,希望通过对相关微信群的数据挖掘,初步廓清微信群信息传播的分布形态与结构特点,为后续微信群研究提供一个参考。
一、研究设计
本研究结合微信群的特性以及社交网络的分析框架,提出以下三个研究问题:1.用户在微信群中交流的分布形态;2.微信群文本符号使用的整体分布;3.微信群用户社会网络的密度与中心度。
1.分析对象与特征。(1)C1群是上海某高校某院系毕业生群,500人群。有一定的现实社交关系作为支撑。(2)C2群是安徽某高中在沪校友群,500人群。有一定的现实社交关系作为支撑。(3)C3群是上海陆家嘴金融类实习生群,500人群。无明确的现实社交关系作为支撑。
2.选取时间段:2016年4月~2016年7月。
3.获取数据方式及数据格式。微信群的数据储存于手机的内置或外置存储卡内,微信本身提供数据导出的服务,每个用户均有此权限。无需特定工具,任何用户均可从微信上导出微信群的交流记录。数据字段包括:时间、节点账号名称、数量统计、状态(是否接收)、类型(系统消息、文本、视频、动画表情、图片、小视频等)、系统消息、文本内容等。
4.数据规范。本研究所有涉及个人隐私的数据均遵循“先匿名编号再计算”的原则,分析过程中不涉及任何个体用户的任何隐私。
二、研究结果
1.三个微信群成员互动传播的呈现形态:少数人主导了微信群的交流,用户生产内容(UGC)存在不平衡性
微信群互动交流的基本分布对了解社群在用户日常生活中发挥的作用具有重要意义。从实际情况来看,C1群的交流频率是:1%的人发言占比为18%;5%的人发言占比为48%;10%的人发言占比为68%。C2群的交流频率是:1%的人发言占比为20%;5%的人发言占比55%,10%的人发言占比为72%。C3群的情形:1%的人发言占比为25%;5%的人发言占比为61%,10%的发言占比为80%。
三种不同类别的微信群皆显示了“少数人的发言占据了微信群的主要交流量”的情形,这说明在三个微信群中,少数人决定了微信群的整体讨论,少数人生产了大多数的内容,微信群的其他参与者要么极少发言,要么从不发言。这种情形不符合社交媒体“人人自由分享交流”的精神。由此看来,尽管每个用户都有生产和分享内容的可能性,但大多数人不发言或者一次发言后就再也不出现的情形还相当普遍,这说明微信群的沟通是不均衡的。
微信群最大能够容纳500人,但实际上500人中的绝大部分是在默默“潜水”,这种情形与剧场表演类似,表演者虽有变动但总是那么几位,其他人也都有可能上台唱几句,不过,更多人还是选择在台下观看,或许可将这种情形称为社群交流的“舞台效应”。
2.微信群内交流的主要形式:文本、表情包、图片、网页链接
微信群被视为信息扩散的重要节点,包括三层含义:用户与社群沟通的平台;用户点对点沟通的空间;用户发布资讯的空间。从这个意义上讲,社群就是媒体。
用户在微信群里使用的交流符号与人际传播、大众传播都有不同。从整体上来看,C1群前四位沟通符号是文本、网页链接、动画表情、照片壁纸;C2群前四位的沟通符号是文本、网页链接、照片壁纸、小视频;C3群是文本、网页链接、照片壁纸、动画表情。
每个社群都有一些网页链接转发,所占比例较大。在C1、C2、C3的交流空间中,网页内容的占比排在文本之后,处于第二位,可见,微信群也是信息扩散的主要场域。除了C2较少使用动画表情外,C1与C3排在第三位的交流方式均为动画表情。动画表情是UGC生产的重要内容,也是社群交流的重要符号系统。虽然动画表情在表意上不及文字与网页链接,但在表达感情、活跃气氛上作用相当明显。从社群年龄结构上来看,年龄结构偏低的C1和C3使用动画表情的可能性更高。照片的使用量占比大主要得益于照片的生产与传输成本越来越低,用户可轻易完成照片的拍摄和转发。其他符号的使用情况相对较少,名片使用次数很少,语音使用次数最少。
3.微信群C1与C3的社会网络分析
研究微信群的社会网络结构需要构建点与点之间的关系,而后才可以构建社会网络图。从数据的整体情形来看,微信群中能够确认的点对点直接交流的方式为观察二者交流是否使用微信的@功能,即A与B在群中的点对点交流是通过@功能实现的,这种@功能可以直接确定二者之间的互动关系。
本文依据群中单个节点通过@功能与其他节点形成互动的两两关系构建节点之间的共现矩阵,输入Ucinet软件。基于中间中心度确定节点大小,用 NETDRAW 生成微信群节点直接的社会网络图。
(1)微信群C1的社交网络分析
表3与图1显示了在C1微信群中,A001至A010均为微信群中通过@功能与其他人交流的核心节点,每一次较为热烈的讨论大都与这几个核心节点有关。为了进一步分析社交网路的结构,本文引用社交网络的密度和中心性进行分析。
社交网络密度是指网络关系图中各个节点之间联系的紧密程度和互动程度,节点之间的联系越多、互动越频繁,该网络关系图的密度越大,表明网络成员之间的联系越紧密,互动越多。①微信群C1的密度是0.0885,标准差为0.7512,密度比较低,表明这个群分散交流多,单个节点跟其他节点的交流是有限的,主要的交流由中心性比较高的人控制。
中心性是用来了解网络中行动者的权力和影响力的,是度量整个网络中心化程度的重要指标。在网络中,处于中心位置的节点更容易获得资源和信息,拥有更大的权利和对其他节点更强的影响力。通过中心性分析得到的结果图中,节点的大小表示中心性,点越大越是中心。中心性反映了一个点在网络中居于核心地位的程度。
由于微信群内的交流为直接连接,而非间接连接,本文要衡量的标准是直接连接的强度而非间接连接的强度,所以,本文考量微信群交流的中心性(Centrality)未使用中介中心性(Betweeness)。在(图1 图1见本期第64页) 中,中心度最高的节点是A001、A002、A003、A004、A006等,验证了前文所述的微信群交流的不平衡性。
(2)微信群C3的社交网络分析
表4与图2显示了在C3微信群中,较为热烈的讨论大都与核心节点有关。中心度最高的节点是B001、B002、B003、B005、B004等,也验证了前文所述的不平衡性。C3微信群的交流相对集中在几个点上,而且群成员之间的关系更加松散,这可能与该群在现实中无相关社会关系支撑有关。
4.影响微信群活跃度的因素:话题共识、社群结构、现实关系等
社群的活跃度主要表现为群内交流的次数的增加,更多人员的参与,存在时间更久等,影响微信群活跃度的因素在三个案例中各有不同。微信群C1的影响因素主要和共同话题有关,除去加入毕业生群当天的数据比较多以外,共有四个讨论峰值。第一在4月18日,某高校校庆;第二在5月13日,雷洋事件成为热点;第三在6月14日,群内寻找国外读博士的同学;第四在6月30日,南方报业记者性侵实习生。
C2的成员有一些现实关系支撑,微信群讨论的热点主要和当地的信息变动有关,比如当地热点事件、七月洪灾、教育捐款等,只要有本群人事(特别是升迁)变动、本区域的信息变动,便会激起热烈的讨论。该群所具有的区域认同感是其他两个群所没有的。
C3的成员绝大多数没有现实中的任何关联,讨论的峰值都是在实习工资或者招聘信息发布后出现的,群中经常出现各类金融机构招聘实习生的宣传,各类讨论并不热闹,随着时间的推移,微信群整体的活跃度在下降。
三、研究讨论
从上述的研究结果来看,微信群C1、C2、C3都体现了一些共同特征。
在微信群中,少数参与者贡献了绝大多数的讨论量,沟通最多的节点往往是在信息获取、意见引领、话题设置、现实关系等方面有一定影响力的人。有一种情形需要深入观察,经常转发网页内容的用户可能并不经常发言,比如在C1群中,转发网页链接最多的一位成员参与各种讨论却不积极,同时,其他成员对其转发的内容也无积极回应。由此来看,在微信群中似乎也存在“沉默的螺旋现象”,只是这种现象背后的原因未必跟大众媒体时代一样,实名制、群体压力、倦怠感、社群过载等因素都有可能导致用户保持沉默,这种沉默也可能是因为根本没有时间打开社群账号阅读。
现实社交关系影响微信群的社交。如果微信群有一定的真实社交关系支撑则微信群的交流相对较为热络,比如微信群C1,群内的熟识度比较高,形成了以几位在校老师为核心的聊天结构,群内能够找到的共同感知是公共事件以及共同的校园生活,一旦共同感知时间缺失则活跃度下降。C2群内节点之间有一定的熟识度,对共同的地域话题与机构话题感兴趣,相对活跃度较高。微信群C3因为缺乏现实的社交关系的支持,讨论主要集中于各类招聘信息和租赁信息等内容,讨论的内容比较单一,活跃度不高。除此之外,影响社群活跃度的因素还有很多,包括社群话题、社群结构、关键人物等等。每一种因素发生效用的场景又不太相同,今后的研究可以深入研究社群活跃度的动力机制。
从实际生活来讲,用户手机端的微信群越来越多,社群“信息过载”和“社交焦虑”的情形也越来越突出,一方面社群的信息越来越多,另一方面由于各种原因,退群的压力也很大,一进一退之间,社交焦虑不可避免,因此,消除用户的焦虑也是一个研究重点。
最后需要指出的是,本研究虽然对三个微信群实现了社交网络挖掘,但仅选取了校园类的微信群,存在一定的样本局限。在内容分析过程中,由于微信群的交流形式多样,语言使用习惯与标准语言体系差异太大,以至于现有的分词工具无法实现有效分词,这也限制了本文在文本方面的研究深度。今后,研究者可以在更大范围选取不同类别的研究对象,综合运用图像识别和自然语言工具推动微信群的研究更加深入。■
注释:
①斯坦利·沃瑟曼、凯瑟琳·福斯特:《社会网络分析:方法与应用》,中国人民大学出版社2012年版
禹卫华/上海交通大学媒体与设计学院副教授。