刘荣叁+张宇+王星
摘 要: 随着微博的高速发展,微博信息溯源成为信息内容安全管理的重要研究内容之一。此前的信息溯源研究中,事件数据纯度不高,且用户影响力涉及的因素考虑得不够全面,本文即针对以上问题进行研究。首先,由于微博信息采集过程中,得到的数据纯度较低,对大量的新浪微博数据进行事件聚类,得到某一具体事件的相关微博。接着,为了得到更合理的用户影响力数值,針对具体事件涉及到的用户,考虑多个因素,进行用户影响力分析,得到用户的影响力数值。最后,综合考虑微博的发布时间和用户影响力数值,使用Hacker News排序算法,对具体事件进行信息溯源。最终分析得出了事件传播过程中,发布时间较早,且用户影响力较大的一篇微博为事件源头。
关键词: 新浪微博;事件聚类;用户影响力分析;信息溯源
中图分类号:TP391.41
文献标志码:A
文章编号:2095-2163(2017)02-0094-05