当前位置:技术分享 > 技术参考 > 正文

美国大选Facebook舆情分析——基于R2016-12-20 11:20:40 | 编辑:hely | 查看: | 评论:0

为了从社交媒体这一渠道对两位候选人的竞选表现和粉丝基础有一个更为具体的了解。我们分析了一年多以来克林顿(大约360万粉丝)和特朗普(大约800万粉丝)的Facebook流量。
2016年7月27日,希拉里·克林顿顺利成为民主党总统候选人,这也意味着她将和之前成为共和党总统候选人的唐纳德·特朗普在11月份进行最终角逐。两位候选人在之前的五个月的网络口水仗,也使得各大社交平台异彩纷呈。为了从社交媒体这一渠道对两位候选人的竞选表现和粉丝基础有一个更为具体的了解。我们分析了一年多以来克林顿(大约360万粉丝)和特朗普(大约800万粉丝)的Facebook流量。

 


数据获取

用R包“Rfacebook”爬取了2015年5月1日到2016年5月31日的候选人Facebook官方主页的内容,获得了这段时间内所有的帖子和相应的评论(特朗普大约140万评论而克林顿大约120万评论)。然后用R的文本挖掘包和文本数据定量分析方法,基于LIWC的词条目录对每个评论(不含非英文内容)单独解析它的情绪和心理结构。最后,我们汇总成为日度数据进行分析。

情绪氛围

特朗普评论区相较克林顿表现得更为积极:数据显示特朗普的积极评论占比69.46%,消极评论占比30.46%;克林顿的积极评论占比65.94%,消极评论占比33.94%。而第二张图显示特朗普评论区的情绪分化现象更为显著:这里用百分比的变异系数来表示情绪分化程度,特朗普评论的百分比变异系数是122.23,而克林顿的是115.31,这确实很容易理解,特朗普自竞选以来发表了种种言论,要么引来狂热的追捧,要么被人诟病为疯子。

 

36大数据

 

 

36大数据

 

乐观程度

克林顿的拥护者相较而言对竞选前景表现得更为乐观(克林顿31.13%而特朗普是29.57%),并但是可以发现特朗普的评论区有一种向上的积极发展趋势。同样,特朗普评论区的乐观程度分化也更为显著,拥有130.12的变异系数,而克林顿只有126.11。

 

36大数据

 

拥护者群体的包容度

第四张图显示了评论区中,拥护者相互包容的的程度。比如说如果评论中更多的“我们”出现,则拥护者内部是更加包容和团结的;如果评论中更多的“我”出现,则拥护者内部是更加独立的。结果显示双方表达方式有很大不同,特朗普的拥护者表述的方式更加独立(36.12%),而克林顿的拥护者相对包容(30.38%),这可能意味着克林顿的拥护者能够更好地凝聚力量支持他们的选择。

 

36大数据

 

七月底民调结果显示克林顿的支持率首次被特朗普反超,但是紧接着由于特朗普的不当言论,克林顿重获优势,但无论下一任世界领袖的归属如何,最终决定这一结果的,还是数据。

文: Daniel Boller

上一篇:2016 年谷歌开源了这些超酷炫的项目 携程是如何把大数据用于实时风控的下一篇:

公众平台

搜索"raincent"或扫描下面的二维码