面向微博可信度评估的辩论图模型

2017-10-13 15:23:44黄青松冯旭鹏付晓东刘利军
电子科技大学学报 2017年2期
关键词:辩论争议规则

黄青松,戴 丹,冯旭鹏,付晓东,刘 骊,刘利军



面向微博可信度评估的辩论图模型

黄青松1,2,戴 丹1,冯旭鹏3,付晓东1,刘 骊1,刘利军1

(1. 昆明理工大学信息工程与自动化学院 昆明 650500; 2. 云南省计算机技术应用重点实验室 昆明 650500;3. 昆明理工大学教育技术与网络中心 昆明 650500)

微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议间的主题情感和潜在逻辑关系定义规则可信度,并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度,递归进行辩论图演化,得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。

辩论; 争议节点; 有向图; 可信度

随着社交平台的快速发展,微博凭借其短文本、低门槛、实时性和传播迅速等特性吸引了大量忠实用户。信息在微博上快速传播与分享,但谣言也大量蔓延[1-2]。微博网络的复杂性,使谣言信息在不同群体中通过多级节点大面积扩散,频繁汇聚转发增加了其表面上的可信度。微博平台每天发表大量微博,如何提高判定其可信度的准确性成为亟待解决的问题。微博可信度研究在信息过滤、舆情监控和信息传播引导过程中发挥着积极的作用,且有助于微博社会化推荐、微博搜索引擎等方面的应用研究[3]。

目前针对微博信息的可信研究,主要根据用户行为特点进行特征分析从而设计分类算法。基于特征分类方法对微博信任评估具有较好效果,文献[1]通过2010年智利地震研究了Twitter用户发布博文的特征和信息传播的特点,发现谣言与新闻的传播方式不同,谣言在Twitter社区的讨论会逐渐被怀疑。文献[2]基于推文和转发微博行为特征(内容、用户、话题和传播特征)提出了自动评估可信性的方法。文献[4]通过大量调查发现,用户认为可信的与确切可信的信息存在不同的特征,并对不同特征(用户特征、话题信息、博文内容)进行比较实验。文献[5]为解决谣言探测问题提出了3种特征:基于内容、基于网络和正确定义谣言的微博具体模型。文献[6]通过半监督的推文可信度排序模型(TweetCred)来实时评估其信任值。

辩论是智能主体间为了消除信念不一致的一种基于言语的交互行为。辩论模型是对辩论推演过程的形式化描述,其研究内容包括辩论空间构造以及辩论结果生成算法[7]。辩论模型中影响力较大的有抽象辩论框架[8],Toulmin模型[9]IBIS(issue-based information system)模型[10]和基于以上扩展的模型[11-12]。文献[7]基于相关辩论模型的应用方面对辩论建模时考虑了不确定信息处理因素,并提出一种基于可信度的辩论模型。

针对微博信息量大、不确定和混杂特性,特征提取方法需大量人工标注,且都是静态数据的特征统计[13],缺乏理论依据的推断与支持,故本文提出基于辩论图的微博信任评估模型,以辩论为基本思想,以争议间的支持或攻击强度为权值来构建有向带权图,且递归辩论推演得到信息可信度。该模型更直观地体现出判别可信的过程及辩论间的推演关系。

1 辩论图框架

辩论图框架主要描述辩论结构间的关系。本文从争议节点、争议间的关系和最终结论出发构建辩论图模型。争议节点和结论为辩论图中的节点,争议间的主题情感和潜在逻辑关系为规则可信度,并将规则可信度设置为图中边上的权值。最后递归进行辩论推演,直观展示出可信度的判别过程。

1.1 框架基本表示

1.2 争议节点产生

算法1:判别结论与证据间的联系

输出:争议集

IF ( |RuleCentainty_Calulate()|>){

ELSE RETURN NULL}

算法2:争议节点产生

输出:争议节点集

//种子节点和结论节点不存在关联

IF(|RuleCentainty_Calulate()|>){

Continue

}ELSE{

} ELSE {

1.3 规则可信度

争议前提对结论存在着支持或攻击关系,此关系由规则可信度进行强度量化。规则可信度计算分为:争议间的主题情感相关度与潜在逻辑关系。主题情感相关度验证争议存在是否合理,前提与结论是否存在主题和情感相关。潜在逻辑关系包含蕴涵关系与矛盾关系,进一步考核争议内部是否真实相关,并体现出争议间支持或攻击关系强度。

1.3.1 主题情感相关度

微博的短文本性,故陈述也为短文本。本文模型采用潜在的狄利克雷分布(latent Dirichlet allocation, LDA)[14]和JS散度(Jensen-Shannon divergence)来计算争议中主题是否相关。根据LDA模型获得对应的争议主题概率分布和,其中,,为LDA模型中的主题数,和分别为第前提和结论的第个主题概率。则第个前提与结论的主题相似度计算为:

(2)

(3)

情感极性分析可以验证规则前提对结论是支持或攻击。此时,规则可信度随着情感分析而改变,若争议间情感为正极,规则可信度为正值,体现支持作用。若为负极,则为负值,表明攻击作用。争议前提的情感分析表示为。其变化如式(5)所示:

1.3.2 潜在逻辑关系

主题情感和潜在逻辑关系的综合值作为辩论图的权值,展示出争议间的防卫和攻击强度。规则可信度计算描述如下:

算法3:规则可信度算法

输入:争议间各节点的主题概率值

输出:争议间的规则可信度

RuleCentainty_Calulate(){

1.4 辩论图构建与推演

辩论图中,争议的规则前提和结论作为节点,规则可信度为它们间的联系边,通过以上的准备工作,对辩论图进行举例构建。假设有如下争议,,辩论框架由6个争议组合,对话集有。辩论图的初始构造如图1所示。

算法4:辩论图推演算法

输入:争议集

输出:递归推演的争议集和相关节点的可信度

ArgumentGraph_Deduce(Args){

FOR EACH node in Args{

//node为争议节点前提,Args为争议

RuleCentainty_Calulate()

//计算争议间的规则可信度

node is conclusion{

}ELSE {

ArgumentGraph_Deduce(node为结论的争议)}}}

对于不同争议的评价算法,分别根据文献[7]中对争议结论可信度计算、可信度合成、可信度传递情况来计算。辩论图1经争议、、演化后得到结论的可信度度值,又因结论为下一个争议的前提,故辩论推演过程如图2所示。

2 微博可信度评估

本文将辩论模型引入到微博可信度评估过程中,通过辩论图直观地表示在微博数据争议条件下信息可信度的推理过程,其流程如图3所示。

从图3可以看出,先由专家判定需要进行可信度分析的信息主题,并在微博平台上寻找相关主题的权威信息作为种子证据集,赋予对应的可信度。然后,通过新浪微博的API接口获得相关主题的微博作为论据库,再通过争议节点产生算法获得过渡证据和争议集,以争议间的主题情感和潜在逻辑关系,即规则可信度作为防卫或攻击强度。最后,以争议中的微博信息作为节点,微博争议数据间的规则可信度为边,根据辩论推演算法递归展示出可信度的演化过程,最终得到结论的可接受性值。

3 实 验

为体现辩论图模型对微博可信度评估的影响,实验总体设计分为以下3个部分:1) 实验数据准备及预处理工作;2) 辩论图模型中阈值、、主题数和不同潜在逻辑关系组合的设定实验;3) 对比分析以验证辩论图模型在可信度判别中具有较好的效果。

3.1 实验数据和预处理

本实验数据主要从微博开放API获得,通过2015年6月~2015年8月中旬间隔地采集微博数据,选取热点话题和相关信息如表1所示。对抓取到的微博语料进行清洗、去噪、分词等预处理工作,并由3名工作人员进行种子节点选取和人工标注赋值,种子节点选取和可信度赋值流程如下。

1) 专家判定需要进行可信度分析的信息主题。

2) 从微博平台上获取用户权威度高且与该主题相关的博文。权威度判别条件为其是否被新浪微博认证,如人民网、环球时报或华尔街日报等新浪微博认证公众号。

3) 通过政府网站、媒介等渠道对所选取的微博信息进行多方面求证,判断其可信度。

4) 可信度区域依据文献[18]分为非常可信、一般可信、不可信和不能决定,且依据克朗巴哈系数(Cronbach Alpha)给微博信息赋可信度值。若该微博非常可信,则可信度值为[0.8,1],一般可信为[0.7,0.8),不可信则小于0.7。

5) 对于每1条与主题相关的微博语料,若有2名工作人员给出相近且在同一区域的分值则取其平均值为其可信度值,若3名工作人员给出差异较大的分值则舍弃该条微博。

6) 本实验选取非常可信的语料作为种子证据。

根据以上步骤选取非常可信的微博作为种子证据并依次赋可信度值。

表1 实验语料信息表

实验选用的第三方工具:中文分词工具ICTCLAS、SVM算法工具包LibSVM、LDA主题建模工具Mallet。以上工具中,LibSVM设置使用径向基核函数(radial basis function, RBF),其余采用缺省值。由于准确率()、召回率()、值普遍作为分类实验评价的标准[5],所以本文也采用其作为试验标准。

3.2 参数设定与潜在逻辑关系影响

由于微博的短文本性,信息量少,所以设置不同主题数会对综合指标产生不同影响。实验在主题情感和潜在逻辑关系基础上(TSEC模型)进行不同主题数实验结果比较,主题数分别选取50、100、150和200,图5显示了准确率、召回率和综合指标随主题数的变化情况。

当主题数不一样时,准确率、召回率和综合指标也不相同,但能稳定在一定的区域间。通过实验对比结果看出,主题数为100时整体性能最好,因此,本模型实验采用主题数为100。

潜在逻辑关系分为主题Theme、情感Sen、蕴涵关系Entail和矛盾关系Contra这4个方面,主要考察潜在逻辑关系对辩论图模型的影响。本节设计Theme+Sen(TS模型)、Theme+Sen+Entail(TSE模型)和Theme+Sen+Entail+Contra(TSEC模型)3个比较实验,话题数设定为100,实验结果如图6所示。

图6展示出不同模型时得到的结果,可以看出辩论图模型只考虑主题情感比既考虑了主题情感又包含潜在逻辑关系获得的准确率、召回率和综合指标实验结果都较低。从实验对比结果可知,辩论模型中争议间的支持和攻击强度对实验结果存在着较大的影响,争议间的防卫和攻击强度不同,结论的可信度也不相同。

3.3 方法性能对比

为了验证辩论图模型的有效性,本文将TSEC模型分别与基于SVM的特征分类方法(SVM),基于用户特征、话题信息、博文内容分类方法(MCP)[4]及谣言探测模型(RDM)[5]进行实验对比,结果如表2所示。

表2 不同方法实验对比结果表

从表中可以看出,传统SVM分类方法的准确率、召回率和综合指标值约为0.70,而基于不同特征、谣言探测模型和辩论图模型均能有效地判别微博内容是否可信。由于文献[4-5]采用英文语料进行实验,本实验采用的为中文语料,故实验结果在一定程度上与原文有所偏差。相比其他方法,辩论图模型的3个指标均有所提升,体现出此方法能更准确地判别微博平台信息的可信度,对于微博可信度判别有很好的应用。

4 结束语

为了解决微博可信度评估问题,提出一种面向微博可信度评估的辩论图模型。该模型基于辩论思想,且以图来描述辩论推演过程。实验结果表明,本模型在准确率、召回率和综合指标上都取得较好的结果,证明了此辩论图模型的有效性。模型争议前提中可能存在相互包含关系,故下一步将考虑前提间是否存在合取和析取关系,防止争议间支持和攻击的重复化。

[1] MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis : Can we trust what we RT?[C]//Proceedings of the First Workshop on Social Media Analytics. New York: ACM, 2010: 71-79.

[2] CASTILLO C, MENDOZA M, POBLETE B. Information credibility on Twitter[C]//Proceedings of the 20th International Conference on World Wide Web. New York: ACM, 2011: 675-684.

[3] 蒋盛益, 陈东沂, 庞观松, 等. 微博信息可信度分析研究综[J]. 图书情报工作, 2013, 57(12): 136-142.

JIANG Sheng-yi, CHEN Dong-yi, PANG Guan-song, et al. Research review of information credibility analysis on Microblog[J]. Library and Information Service, 2013, 57(12): 136-142.

[4] MORRIS M R, COUNTS S, ROSEWAY A, et al. Tweeting is believing? understanding micoroblog credibility perceptions[C]//Proc of the 15th ACM Conf on Computer Supported Cooperative Work(CSCW12). New York: ACM, 2012: 441-450.

[5] QAZVINIAN V, ROSENGREN E, RADEV D R, et al. Rumor has it: Indentifying misinformation in Microblogs [C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh: ACL, 2011: 1589-1599.

[6] GUPTA A, KUMARAGURU P, CASTILLO C, et al. Tweetcred: a real-time web-based system for assessing credibility of content on twitter[EB/OL]. [2015-07-25]. http://arxiv.org/abs/1405.5490.

[7] 熊才权, 欧阳勇, 梅清. 基于可信度的辩论模型及争议评价算法[J]. 软件学报, 2014, 25(6): 1225-1238.

XIONG Cai-quan, OUYANG Yong, MEI Qing. Argumentation model based on certainty-factor and algorithms of argumentevaluation[J]. Journal of Software, 2014, 25(6): 1225-1238.

[8] DANG P M. On the acceptability of arguments and its fundamental role in nonmonotonic reasoning logic programming and n-person games[J]. Artificial Intelligence, 1995, 77(2): 321-357.

[9] TOULMIN S E. The uses of argument[J]. Ethics, 1959,10(1): 251-252.

[10] KUNZ W, RITTEL H W J. Issues as elements of information systems[D]. Berkeley: University of California, 1970.

[11] 熊才权, 李德华. 一种研讨模型[J]. 软件学报, 2009, 20(8): 2181-2190.

XIONG Cai-quan, LI De-hua. Model of argumentation[J]. Journal of Software, 2009, 20(8): 2181-2190.

[12] 陈俊良, 王长春, 陈超. 一种扩展双极辩论模型[J]. 软件学报, 2012, 23(6): 1444-1457.

CHEN Jun-liang, WANG Chang-chun, CHEN Chao. Extended bipolar argumentation model[J]. Journal of Software, 2012, 23(6): 1444-1457.

[13] 苑卫国, 刘云, 程军军, 等. 微博网络中用户特征量和增长率分布的研究[J]. 计算机学报, 2014, (4): 767-778.

YUAN Wei-guo, LIU Yun, CHENG Jun-jun, et al. Research on the user characteristics and growth rates distribution in microblog[J]. Chinese Journal of Computers. 2014, 37(4): 767-778.

[14] BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Research, 2003, 3(3): 993-1022.

[15] 贺飞艳, 何炎祥, 刘楠, 等. 面向微博短文本的细粒度情感特征抽取方法[J]. 北京大学学报(自然科学版), 2014, 50(1): 48-54.

HE Fei-yan, HE Yan-xiang, LIU Nan, et al. A microblog short text oriented multi-class feature extraction method of fine-grained sentiment analysis[J]. Acta Scientiarum Naturalium Universitaits Pekinensis, 2014, 50(1): 48-54.

[16] DAGAN I, GLICKMAN O. Probabilistic textual entailment: Generic applied modeling of language variability[C]// PASAL Workshop on Learning Methods for Text Understanding and Mining. Grenoble France: [s.n.], 2004.

[17] 刘茂福, 王月, 顾进广. 基于语义规则的中文矛盾关系识别方法[J]. 计算机工程与科学, 2015, 37(4): 806-812.

LIU Mao-fu, WANG Yue, GU Jin-guang. Chinese textual contradiction recognition based on semantic rules[J]. Computer Engineering& Science, 2015, 37(4): 806-812.

[18] GUPTA A, KUMARAGURU P. Credibility ranking of tweets duringhigh impact events[EB/OL]. [2015-07-25]. http://precog.iiitd.edu.in/Publicationsfiles/a2-gupta.pdf.2012.

编 辑 蒋 晓

Argumentation Graphical Model for Microblog Credibility Assessment

HUANG Qing-song1,2, DAI Dan1, FENG Xu-peng3, FU Xiao-dong1, LIU Li1, and LIU Li-jun1

(1. Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500; 2. Yunnan Key Laboratory of Computer Technology Applications Kunming 650500; 3. Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500)

Due to the mix and uncertainty of the microblog information data, the credibility assessment has difficulty to distinguish. An argumentation directedgraphical model for microblog credibility assessment is presented. From the point of view of argumentation, the model, the argument deduction process is described intuitively by graphical model. In the credibility assessment process, we create the argument node based on the relevant topic corpus, define the rule credibility by the thematic sentiment and potential logical relationship, set the weights on the edges, and represent the defense and attack strength between arguments for this reason. The conclusion credibility is achieved and the argumentation graphical with recursion is evolved according to the relevant algorithm. At last the distinguish information could get the credibility. Experimental results show that this model obtains an accuracy up to 6% in comprehensive indexmeasure compared to the traditional methods.

argumentation; argument node; directed graphs; reliability

TP391

A

10.3969/j.issn.1001-0548.2017.02.013

2015-08-26;

2015-12-24

国家自然科学基金(81360230,81560296,61462056, 61462051)

黄青松(1962-),男,教授,主要从事数据挖掘、自然语言处理等方面的研究.

猜你喜欢
辩论争议规则
撑竿跳规则的制定
数独的规则和演变
央行行长们就应对气候变化展开辩论 精读
英语文摘(2020年4期)2020-07-28 07:57:34
词典引发的政治辩论由来已久 精读
英语文摘(2019年5期)2019-07-13 05:50:28
如何赢得每一场辩论
英语文摘(2019年4期)2019-06-24 03:46:06
IBM推出可与人类“辩论”的计算机系统
英语文摘(2019年3期)2019-04-25 06:05:32
让规则不规则
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐败规则对我国的启示
争议光伏扶贫
能源(2016年10期)2016-02-28 11:33:28
争议一路相伴
中国卫生(2015年8期)2015-11-12 13:15:30