模糊概念图匹配的语用推理研究*

2017-09-18 00:28刘培奇
计算机与生活 2017年9期
关键词:概念图含义准确率

刘培奇,黄 苗+,封 昊,周 伟

1.西安建筑科技大学 信息与控制工程学院,西安 710055 2.陕西彩虹电子玻璃有限公司,陕西 咸阳 712000

模糊概念图匹配的语用推理研究*

刘培奇1,黄 苗1+,封 昊1,周 伟2

1.西安建筑科技大学 信息与控制工程学院,西安 710055 2.陕西彩虹电子玻璃有限公司,陕西 咸阳 712000

针对目前计算机在自动语用分析中不能解析出整个话语深层含义的问题,设计了基于模糊概念图匹配的关联推理算法。该算法针对汉语语用分析中的特定对话模式,用模糊概念图表示说话人的话语和认知语境知识,并从计算机学科出发进行关联推理,解决了话语深层含义的语用分析问题。经过实验分析,该算法准确率达78%。该算法已应用到舆情分析和IRC聊天室社会网络挖掘中,采用该算法对大量会话文本预处理,有效降低了基于多特征融合的Mutton方法和AdaBoost方法的漏报率和误报率,提高SBV极性传递算法的准确率,有效推出了对话者文本的深层含义。

语用分析;关联推理;模糊概念图;认知语境

1 引言

语用分析主要是分析话语在不同语境下的不同具体含义[1],以及语言的隐含意义。在双方交谈中,有时出于礼貌、幽默和委婉等原因,话语的意图没有直接说出来,话语真正传递的实际上是另外一种深层次含义[2]。例如:A说“你在网上买的电脑运行快不?”,B回答“跟蚂蚁爬一样!”,“蚂蚁爬”仅仅是B所说话语的表面含义,真正含义是“在网上买的电脑运行速度很慢”。如果在计算句子倾向性或仅用文本的表面含义,则会降低文本理解的准确率。因此,语用分析对理解话语深层含义具有十分重要的意义。

语用分析是自然语言理解的重要领域,国内外学者在这一方面展开了广泛研究。在国外,Grice的会话含义理论[3],首次对语用学进行了系统阐述和剖析,提出了语用分析的4个合作原则,但该原则存在模糊性和重叠性。后来,Horn把4个合作原则简化为两个[4]。Levinson指出Horn两原则的不合理性,并在总结多位语言学家研究的基础上概括出会话含义分析三原则[4],建立了新Grice会话含义理论基础。Sperber&Wilson在上述研究的基础上,提出了关联理论,构成了新Grice会话含义理论[2]。会话含义分析的基础是对话语的语用推理。近年,国外对会话语用推理进行了大量研究。在文献[5]中,为了便于非合作对话的理解,Brain Pluss从对话者语言的直接意义定义了DNC(degree of non-cooperative dialogue),提出非合作对话计算模型,便于对话者之间语言理解。但是在DNC中,仅计算语言表面词汇意义,没有涉及语言更深层次的意义。在文献[6]中,Franke 在有限理性模型基础上,针对博弈中双方信息(经过信息可靠性语用推理)的理解和响应问题,提出了IBR(iterated best respones)模型。但是IBR 模型是建立在会话者的意义聚焦假设和有限合理性假设下,一般情况下,这两个假设很难满足,因此推理效果有限。

与国外的研究相比,国内学者更倾向于语用学应用研究。国内最早引入语用分析的是沈家煊,他对关联理论进行了系统阐述和分析[7];熊学亮对语用分析进行了深入研究,细化了关联推理,总结了话语分析的关联推理模式[2];赵彦春将语用分析应用到翻译领域,创建了指导翻译的理论模型关联翻译[8]。但是他们仅从语言学或哲学角度进行理论研究,并没有从计算机科学方面研究语用分析与推理的算法和实现。由于语用分析中语境因素繁多而且是动态变化的,在计算机中很难设计语境库,并且不同话语很难和语境库中繁多语境信息匹配,因为计算语用学发展缓慢,相关文献相对较少。在现有文献中,刘根辉[9]对计算语用学进行了较完整研究,并构建了基于语境的自然语言理解模型,根据语境信息较好地解决了汉语中一词多义问题,但该系统并没有对整个话语的深层含义进行理解。文献[10]把语用信息用于关键字扩展、专利语料库构建、专利检索中,在一定程度上提高了检索答案的准确率,但该系统对语境信息考虑较少,仅仅涉及用户信息,没有做到对整个话语深层含义的解析。文献[11]提出了一个基于语用信息的候选答案排序模型,提高了问答系统的准确率,但该模型中涉及的语境信息也仅仅为答案提供者的信息和用户对答案提供者所提供答案的评价信息,也没有做到理解整句话的深层含义。

目前,在语用分析领域主要有Grice的会话含义理论和Sperber&Wilson的关联理论,其中关联理论是对Grice会话含义理论的继承和批判,是为推导出交际意图而寻找能满足[新信息+关联信息]组合的相关假设,并且在特定的场合中推导出话语的深层含义。关联理论主要涉及会话分析、传媒话语、文学、翻译和言语幽默等领域,本文主要讨论话语分析问题。

在计算机的话语分析中,模糊概念图知识表示方法既有准确而严格的语义定义,又能表示深层语义知识和实现多种匹配推理。本文在模糊概念图表示话语和认知语境基础上,设计了基于模糊概念图匹配的关联推理算法(relevance inference algorithm based on fuzzy conceptual graph matching,RIAFM),解决了特定对话模式(即对话者A是一个问句,而回答者B对A没有正面回答)的语用推理问题,推导出对话者B话语的深层含义,并对A的问题进行正面回答。本文以QQ聊天记录中对话为基本数据,对RIAFM算法理解对话的正确性进行了实验分析,对话语理解的准确率得到明显提高。最后,将本文算法应用于句子倾向性计算和聊天室社会网络挖掘中,本文算法明显提高了计算句子倾向性分析和社会网络挖掘的准确率。

2 基本理论

2.1 模糊概念图

概念图(conceptual graph,CG)是美国计算机科学家Sowa提出的一种基于语义分析的知识表示方法[12-13]。由于概念图具有表示形式直观,表达能力强,推理简单,语言功能强等优点,目前已成为一种理想的知识表示方式。

定义1概念图是由概念节点、关系节点、有向弧组成的有向连通图,即:

其中,Concept={C1,C2,…,Cm}为概念节点集,表示实体、动作、状态和事件等;Relation={R1,R2,…,Rn}为关系节点集,表示概念节点间的关系;F=(Concept×Relation)⋃(Relation×Concept)为有向弧集[14]。

在概念图的线性表示中,用方括号表示概念节点,用圆括号表示关系节点。例如,语句“A dog eats the meat with the paw.”可线性表示为:

为了表示和处理模糊知识,Morton和Wuwongse等人结合模糊数学理论,研究了模糊概念图[15-16]。

定义2设Le为实体子类,I为标记集合,则概念C的模糊度 ρ:Le×I→[0,1],模糊概念C可表示为[t:x|ρ]。其中 t=type(C);t∈Le,x=referent(C),x∈I。如果ρ为1,则可以省略[17]。

定义3由模糊概念集合、关系集合和有向弧组成的有向二分图,称为模糊概念图。

例如,一个年轻的女孩为Lucy的可能性为0.8可表示为:

2.2 概念图匹配

在概念图中,匹配算法主要包括完全匹配、投影匹配和最大连接匹配。

定义4设概念节点C1,C2∈C,若C1≤C2,则称C2是 C1的概化,C1是 C2的特化[18]。

定义5如果概念节点C1和C2有最大公共子类C3,即对任意的概念节点C,若C≤C1,C≤C2,都有C≤C3,则称概念节点C1和C2相容[19]。

定义6对于概念图u、v和w,若w中的关系是u和v的并集,w中的概念是u和v中相容概念,则称w是u和v的最大连接概念图,记为w=u⋈v[18]。

例如:

则u和v的最大连接概念图w为:

定义7对于模糊概念图u、v和w,如果w中的关系是u和v的并集,w中的概念是u和v中相容的概念集合,且w中相容概念的模糊度为u和v中相容概念模糊度最小值,则称w是u和v的最大连接模糊概念图,记为w=u⋈v。

2.3 关联推理模式

关联推理的本质是语言交际者对交际意图的表达和识别。本文通过关联推理模式对特定对话模式进行推理。

定义8关联推理模式就是在理解交际者话语的过程中,搜索满足[新信息+关联信息]组合的相关语境假设[20],即:对话者A和对话者B谈话时,当B说完话时,A对B的话语有关联期待,就值得A花费努力去加工和推理B所说的话语,即B所说的话语会激活A大脑中原有的相关知识结构(对A话语的各种假设)和推理,然后在具体的交际场合内互动。

2.4 认知语境知识库

通过对语境因素的研究,包罗万象的语境归纳成为物理语境、语言语境、认知语境三大范畴[20]。认知语境库作为心理构建体,和心理学上的构建一样,都强调主体基于原有的知识与经验对新信息意义的构建,它是新输入的信息与大脑中已有信息相互作用、相互整合而凸显的结果[21]。本文的认知语境知识库(cognitive context knowledge library,CCKL)是专家通过训练大量该特定对话模式样本,总结并建立很多特定主题词的各种相关假设。由于人与人所处的物理环境不同,记忆能力和认知结构也明显不同,他们大脑中认知语境信息则不一样。当两个人处在同一个语境中,受到相同的明示刺激,他们做出的反应与激活的认知语境知识块也不同。正因为这种不存在“共有知识”,交际一方对另一方所说话语的理解,充其量只是给交际的成功提供了可能,但绝对无法保证交际双方达到百分之百的准确理解[20]。在本算法中,认知语境知识库中每个主题词的相关知识都用模糊概念图集合表示,其中每一条相关知识的假设为集合中一个模糊概念图,该模糊概念图标注了该种假设成功交际的可能性。每一条相关知识假设都有一个模糊度,该模糊度是通过训练大量谈话事件,从中找出提问和回答都一样的谈话记录,并记录回答者涉及该谈话的实际情况。设某特定的相同提问和回答的谈话记录有m对,实际结果为第一种情况的有n个,为第二种情况的有k个,则该相关知识假设的模糊度α为:

实际上α是一种先验概率,表示对于某个特定的回答,而最终是某个特定实际情况的概率。

3 模糊概念图关联推理算法的设计与分析

根据人们理解话语的思维过程,决定了语用推理的过程就是对话双方话语的模糊概念图和认知语境知识库中模糊概念图的匹配过程。根据以上思想,本文设计了RIAFM算法。

3.1 算法流程

设对话者A的话语生成的模糊概念图为u,回答者B的话语生成的模糊概念图为v,w中概念节点集合为Cw,w中概念节点个数为k,与Cwt相连的关系节点集合为Rwtc,在CCKL中关于Cwi的主题词的模糊概念图集合为Q,q∈Q中概念节点集合为Cq,与Cqt相连的关系节点集合为Rqtc。RIAFM算法流程如图1所示。

3.2 算法设计

算法RIAFM

输入:u,v,谈话双方话语生成的模糊概念图;

CCKL,认知语境知识库;

Cu0,概念图u中模糊度为0的概念节点。

输出:Cu0∙ρ,概念图u中模糊度为0的概念节点的新模糊度。

Begin

1.w=u⋈v;

2.Cw={Cwi|Cwi为w中概念节点};

Rw={rwi|rwi为w中关系节点};

3.(∀Cwi)Cwi∈ Cw;Cwi∙ρ=0;

4.foreach(Cwiiscontainof(CCKL)){//判断 CCKDB 中主题词是否包含概念节点Cwi

5.Q=search(Cwi)//在CCKL中主题词c的模糊概念图集合为Q

Fig.1 Flow chart of RIAFM algorithm图1RIAFM算法流程

6.(∀Qi)Qi∈ Q

7.q=Qi;

8.Cq={Cqi|Cqi为q中概念节点};

Rq={rqi|rqi为q中关系节点};

9.Cqt=Cwt=Cwi;Cq=Cq-Cwi;temp1=1;temp2=1;

10.while(∃(r)r∈Rw∧CwtrCwj∧Cwt,Cwj∈Cw∧r∈Rq∧CqrrCqj∧Cqt,Cqj∈Cq){

11.if(Cwj=Cqj∨CwjisHomonym(Cqj)){//如果 Cw和 Cqj相等或互为近义词

12. if(Cwi∙ρ=0){temp1=Cqi∙ρ}

13. else{temp2=min(Cwi∙ρ,Cqi∙ρ)}}

14. if(Cq!=null){

15. Cq=Cq-Cqi;

16. if(Cq!=null){Cwt=Cwj;Cqt=Cqj;

free(Cwj,Cqj);重复执行(10);}

17. else{Cu0∙ρ=temp1*temp2;return;}}}

18.elseif(CwjisAntonym(Cqj)){//如果 Cw和 Cqj互为反义词

19. if(Cwj∙ρ){temp1=-Cqj∙ρ}

20. else{temp2=-min(Cwj∙ρ,Cqj∙ρ)}

21. if(Cq!=null){

22. Cq=Cq-Cqi;

23. if(Cq=null){Cwi∙ρ=temp1*temp2;break;}

24. else{break;}}}

25.else{break;}

26.Cu0∙ρ=min(Cwi∙ρ)(i=1,2,…,n)//n 为 w 中概念节点数}

End

3.3 算法分析

在RIAFM算法中,输入是谈话双方话语生成的模糊概念图u、v,认知语境库中相关主题的概念图集合和概念图u中模糊度为0的概念节点Cu0;输出是概念图u中模糊度为0的概念节点的新模糊度。从第3步开始,循环u和v的最大连接概念图w中的概念节点,设w的概念节点数为m;从第5步开始,为w中概念节点Ci搜索认知语境库中关于Ci主题词的概念图集合Q,设认知语境库中主题词数为n;从第6步开始,循环Q中每个概念图q,Q中概念图数为h;从第10步开始,w和Q中概念图q进行匹配,只有q中的所有概念节点都与w中概念图匹配时,算法匹配成功,而temp1×temp2的值才能正确地赋给Cu0。因此算法最多执行m×n×h次,最坏情况下时间复杂度为O(mnh)。

RIAFM算法空间复杂度为存储模糊概念图u、v、w和CCKL主题词索引占用的空间,再加上临时变量占用空间,因此该算法空间复杂度为| Ru|+| Rv|+|Rw|+| Cu|+| Cv|+| Cw|+h| Rq|+h| Cq|+n+3。对 二 元 关 系的模糊概念图,算法近似存储空间大约为2(| Ru|+|Rv|+| Rw|)+2h| Rq|+n+3,因此该算法总的空间复杂度为O(n)。

3.4 算法示例

例如:

A:Tom个头高吗?

B:Tom以前是篮球队的!

步骤1经过命题充实后,生成模糊概念图为:

u:[人:Tom|1]→(PART)→[个头|1]→(ATTR)→[高|0].

v:[以前|1]←(TIME)←[篮球队|1]←[CONS]←[人:Tom|1].

步骤2w=u⋈v。

w:[以前|1]←(TIME)←[篮球队|1]←[CONS]←[人:Tom|1]→(PART)→[个头|1]→(ATTR)→[高|0].

步骤3w中概念节点只有[篮球队]在认知语境知识库中的“篮球队”主题词的概念图集合Q中概念图 q匹配成功,则 Cu0∙ρ=temp1×temp2=0.9×1=0.9,q的概念图如下:

[篮球队|1]←[CONS]←[队员|1]—(PART)→

[身高|1]→(ATTR)→[高|0.9].

步骤4w和q匹配后,输出Cu0为[高|0.9],再用Cu0替换u中对应概念节点,最后得出u的概念图为:

u:[人:Tom|1]→(PART)→[个头|1]→(ATTR)→[高|0.9].

从u中得出,对话者B的意思为:Tom个头高的可能为0.9。

4 实验结果与分析

本文主要研究针对特定对话模式的话语自动关联推理,推导出对话者B话语的深层含义,即对A的正面回答。本文实验中,在Intel Core i5计算机Windows 7环境下用Java语言设计了RIAFM程序,并从QQ聊天软件中收集到的10 372对聊天记录中人工筛选出172对符合该特定模式的对话记录进行了实验分析。

首先,实验选取172对该特定模式的对话记录进行测试,部分原始数据对话记录测试结果见表1。

Table 1 Experimental results of partial raw data表1 部分原始数据实验结果

表1中,人工标注结果一栏为测试实验结果的准确性而人工表示的正确结果,实验结果一栏表示RIAFM算法运行的结果。实验中,当人工标注的模糊度为+1而实验结果标注的模糊度为正数时,或人工标注的模糊度为-1而实验结果标注的模糊度为负数时,实验结果正确;当人工标注的模糊度为+1而实验结果标注的模糊度为负数时,或人工标注的模糊度为-1而实验结果标注的模糊度为正数时,实验结果错误。总对话数S=172对;正确的对话数T=134对;错误的对话数F=9对;未识别对话数U=29对,则准确率、错误率和未识别率如下:

实验中前50条的运行结果如图2所示。

Fig.2 Partial experimental results and error values图2 部分实验结果及其误差值

通过实验分析,本系统对对话者B的话语文本较长或B与A的话语关联性不大的文本的匹配成功率不高。究其原因:其一是本文算法中话语模糊概念图和认知语境知识库中模糊概念图匹配规则过于严格,降低了匹配成功率;其二是认知语境库中相关知识不全面,需进一步建设认知语境知识库。

算法的可靠性可通过标准误差计算,在实验中,匹配成功的对话总数目为n,人工标注结果的模糊度为a,实验结果的模糊度为b,则标准误差σ为:

在本实验中,除去匹配不成功的31对对话,对129对实验结果正确的对话和12对实验结果错误的对话进行计算,标准误差为0.298。

5 算法的应用

5.1 RIAFM在舆情分析方面的应用

搜集新浪微博关于某公司的6 000多条评论,其中“手机”主题1 683条、“赠品”主题1 257条、“物流”主题1 039条、“客服”主题953条和“假货”主题1 117条。先用SBV极性传递算法对该素材进行计算,计算出未经RIAFM预处理的SBV算法准确率。然后使用RIAFM计算出句子深层含义并替代原文本,再使用SBV极性传递算法计算句子倾向性,得出经过RIAFM预处理的SBV算法准确率。两个准确率对比如图3所示。

Fig.3 Accuracy comparison图3 准确率对比图

从图3中可以看出,经过RIAFM对评论文本预处理后的SBV算法的准确率高于未经过RIAFM对评论文本预处理的SBV算法的准确率。经过RIAFM预处理后的SBV算法的平均准确率为85.3%,未经RIAFM预处理后的SBV算法的平均准确率为74.5%,经过RIAFM预处理后的SBV算法的平均准确率高出未经RIAFM预处理后的SBV算法11个百分点,说明经过RIAFM对文本预处理后能有效提高SBV极性传递算法的准确率。

5.2 RIAFM在聊天室社会网络挖掘方面的应用

在IRC聊天室的社会网络挖掘中,使用RIAFM进行文本预处理,明确对话者B的话语隐含义,用基于多特征融合的Mutton方法和AdaBoost方法挖掘社会网络[22]。在该程序中,寂静时间阈值ST=120 s,响应时间阈值RT=20 s,时间跨度阈值SPT=180 s,序列长度阈值SN=5,相似度阈值SimT=0.2,时间片阈值TS=17 min。为了进行量化分析,经过人工分析得出社会网络的数目为N,程序推断出社会网络的数目为M,程序挖掘出正确的社会网络数目为TM,则漏报率和误报率表示如下:

在IRC聊天室中,将每50 000条聊天记录作为一篇文档,收集了2 000篇文档,将多特征融合的Mutton方法和AdaBoost方法,同使用RIAFM算法进行文本预处理后得出隐含义,并用隐含义替代原聊天记录后再用基于多特征融合的Mutton方法和AdaBoost方法进行比较,其漏报率和误报率如图4和图5所示。

Fig.4 Missed alarm rate图4 漏报率

Fig.5 False alarm rate图5 误报率

从图4中可以看出,经过RIAFM预处理过的Mutton方法漏报率下降了16.1%,经过RIAFM预处理过的AdaBoost方法漏报率下降了10.2%。从图5中可以看出,经过RIAFM预处理过的Mutton方法的误报率下降了7.4%,经过RIAFM预处理过的Ada-Boost方法的误报率下降了3.8%。实验结果表明,经过RIAFM预处理过的基于多特征融合的Mutton方法的漏报率和误报率都有明显的下降。

6 结束语

本文从自然语言理解语用分析的角度,利用计算机对特定对话模式自动进行语用分析,并设计了基于模糊概念图匹配的关联推理算法RIAFM,解决了用计算机自动推导出整个话语深层含义的问题。经过试验分析,准确率达78%,标准误差为0.298,具有较好的可靠性。RIAFM在SBV极性传递算法的倾向性文本计算中,有效地提高了文本倾向性计算的准确率。最后,将RIAFM应用于基于多特征融合的Mutton方法和AdaBoost方法的聊天室社会网络分析中,有效降低了漏报率和误报率。本文首次将计算语用学和模糊概念图的知识应用到网络聊天软件的对话分析、微博评论文本的倾向性分析和聊天室的社会网络挖掘中,对其他领域的话语深层次理解也有一定的参考价值。

[1]Leech G.N.Principles of pragmatics[J].Journal of Linguistics,1983,21(2):459-470.

[2]Xiong Xueliang.Inferences in language use[M].Shanghai:Shanghai Foreign Language Education Press,2007:51-60.

[3]Qin Shanshan.The study of the pragmatic reasoning of Grice's theory of conversational implicature[D].Chongqing:Southwest University,2014.

[4]Jiang Wangqi.My view on pragmatic inference[J].Modern Foreign Languages,2014,37(3):293-302.

[5]Pluss B.Towards a computational pragmatics for non-cooperative dialogue[D].Milton Keynes,UK:The Open University,2009.

[6]Franke M.Semantic meaning and pragmatic inference in non-cooperative conversation[C]//LNCS 6211:Proceedings of the 2008 International Conference on Interfaces:Explorations in Logic,Language and Computation,Hamburg,Germany,Aug 11-15,2008.Berlin,Heidelberg:Springer,2008:13-24.

[7]Yao Jigang,Wang Zhe.Mr.Shen Jiaxuan's academic studies for thirty years[J].Journal of Foreign Languages,2015(1):97-106.

[8]Zhao Yanchun.Relevance theory and the nature of Translation:a relevance theoretic interpretation of translation default[J].Journal of Sichuan International Studies University,2003,19(3):117-121.

[9]Liu Genhui.A study on computational pragmatics:theories and application[D].Wuhan:Huazhong University of Science and Technology,2005.

[10]Wu Liping.The Chinese patient retrieval system based on pragmatic information[D].Beijing:Beijing University of Posts and Telecommunications,2011.

[11]Sun Yueping.Comprehensive information based community question answering system[D].Beijing:Beijing University of Posts and Telecommunications,2014.

[12]Sowa J F.Conceptual structures:information processing in mind and machine[M].Addison-Wesley Publishing Company,1984.

[13]Sowa J F.Conceptual graphs for database interface[J].IBM Journal of Research&Development,1976,20(4):336-357.

[14]Liu Peiqi,Fan Xing,Duan Zhongxing.The research of conceptual graphs filtering technology for tendency text[J].Journal of Microelectronics and Computer,2012,29(12):84-87.

[15]Morton S.Conceptual graphs and fuzziness in artificial intelligence[D].Bristol:University of Bristol,1987.

[16]Wuwongse V,Manzano M.Fuzzy conceptual graph[C]//LNCS 699:Proceedings of the Conceptual Graphs for Knowledge Representation,Quebec City,Canada,Aug 4-7,1993.Berlin,Heidelberg:Springer,1993:430-449.

[17]Liu Peiqi,Zhang Linye.Study and implement of the knowledge representation of fuzzy conceptual graph[J].Journal of Microelectronics and Computer,2010,27(11):25-29.

[18]Liu Peiqi,Li Zengzhi,Zhao Yinliang.Knowledge representation of extended production rule[J].Journal of Xi’an Jiaotong University,2004,38(6):587-590.

[19]Liu Peiqi,Li Zengzhi.Research on knowledge representation and inference mechanisms about fuzzy conceptual graphs[J].Journal of Application Research of Computers,2010,27(6):2119-2122.

[20]Xiong Xueliang.Concise pragmatics tutorial[M].Shanghai:Fudan University Press,2008:76-95.

[21]Huang Huaxin,Hu Xia.Construction of cognitive context to explore[J].Journal of Modern Foreign Languages,2004,27(3):249-254.

[22]Zhang Wei,Cao Xianbin,Yin Hongzhang.Chat room socialnetwork mining based on multi-features fusion[J].Journal of University of Science and Technology of China,2009,39(5):540-546.

附中文参考文献:

[2]熊学亮.语言使用中的推理[M].上海:上海外语教育出版社,2007:51-60.

[3]秦姗姗.格莱斯会话含义理论的语用推理研究[D].重庆:西南大学,2014.

[4]姜望琪.语用推理之我见[J].现代外语,2014,37(3):293-302.

[7]姚吉刚,王喆.沈家煊先生学术研究三十年[J].外国语:上海外国语大学学报,2015(1):97-106.

[8]赵彦春.关联理论与翻译的本质-对翻译缺省问题的关联论解释[J].四川外语学院学报,2003,19(3):117-121.

[9]刘根辉.计算机语用学基础理论及其应用研究[D].武汉:华中科技大学,2005.

[10]武丽平.基于语用信息的中文专利检索系统[D].北京:北京邮电大学,2011.

[11]孙月凭.基于全信息的社区问答系统研究[D].北京:北京邮电大学,2014.

[14]刘培奇,凡星,段中兴.倾向性文本的概念图过滤技术的研究[J].微电子学与计算机,2012,29(12):84-87.

[17]刘培奇,张林叶.模糊概念图知识表示方法的研究与实现[J].微电子学与计算机,2010,27(11):25-29.

[18]刘培奇,李增智,赵银亮.扩展产生式规则知识表示方法[J].西安交通大学学报,2004,38(6):587-590.

[19]刘培奇,李增智.模糊概念图知识表示及其推理机制研究[J].计算机应用研究,2010,27(6):2119-2122.

[20]熊学亮.简明语用学教程[M].上海:复旦大学出版社,2008:76-95.

[21]黄华新,胡霞.认知语境的建构性探讨[J].现代外语,2004,27(3):249-254.

[22]张卫,曹先彬,尹红章.基于多特征融合的聊天室社会网络挖掘方法[J].中国科学技术大学学报,2009,39(5):540-546.

刘培奇(1959—),男,陕西西安人,博士,西安建筑科技大学教授,主要研究领域为人工智能,数据挖掘,模式识别,计算机网络。发表学术论文50余篇,其中EI检索16篇。

HUANG Miao was born in 1989.She is an M.S.candidate at Xi'an University of Architecture and Technology.Her research interests include machine learning and data mining.

黄苗(1989—),女,河南嵩县人,西安建筑科技大学硕士研究生,主要研究领域为人工智能,数据挖掘。

FENG Hao was born in 1994.He is an M.S.candidate at Xi'an University of Architecture and Technology.His research interests include machine learning and data mining.

封昊(1994—),男,陕西榆林人,西安建筑科技大学硕士研究生,主要研究领域为人工智能,数据挖掘。

ZHOU Wei was born in 1980.His research interests include industrial automation and process control.周伟(1980—),男,甘肃景泰人,电气工程师,主要研究领域为工业自动化,过程控制。

Research on Pragmatic Inference of Fuzzy Conceptual Graph Matching*

LIU Peiqi1,HUANG Miao1+,FENG Hao1,ZHOU Wei2
1.School of Information and Control Engineering,Xi'an University of Architecture and Technology,Xi'an 710055,China 2.Shaanxi Caihong Electronic Glass Co.,Ltd.,Xianyang,Shaanxi 712000,China

Focused on the issue that computer cannot automatically carry out a pragmatic analysis of the deep meaning of whole discourse at present,this paper designs the relevance inference algorithm based on fuzzy conceptual graph.In the algorithm,aiming at the specific dialog mode of Chinese pragmatic analysis,the discourses of speakers and the knowledge of cognitive context are expressed in fuzzy conceptual graph,and the relevance inference is conducted from computer science.The problem that computer automatically deduces the deep meaning of whole discourse is resolved.Through the experimental analysis,accuracy can reach 78%.In addition,the algorithm has been applied in analyzing public opinion and mining social network.After the preprocessed discourses of speaker by this relevance inference algorithm based on fuzzy conceptual graph,this algorithm can reduce the missed alarm rate and false alarm rate of Mutton and AdaBoost methods based on multi-features fusion and increase the accuracy of SBV polar transfer algorithm.The algorithm can deduce the deeper meaning of answerer's discourse at specific dialog mode.

the Ph.D.degree from Xi'an Jiaotong University.New he is a professor at Xi'an University of Architecture and Technology.His research interests include artificial intelligence,data mining,pattern recognition and computer network.He has published more than 50 papers,including 16 papers indexed by EI.

2016-06, Accepted 2016-10.

A

TP181

+Corresponding author:E-mail:690765865@qq.com

LIU Peiqi,HUANG Miao,FENG Hao,et al.Research on pragmatic inference of fuzzy conceptual graph matching.Journal of Frontiers of Computer Science and Technology,2017,11(9):1513-1522.

10.3778/j.issn.1673-9418.1606027

*The National Natural Science Foundation of China under Grant No.51178373(国家自然科学基金);the Natural Science Foundation of Shaanxi Province under Grant No.2014JM2-6114(陕西省自然科学基金).

CNKI网络优先出版: 2016-10-31, http://www.cnki.net/kcms/detail/11.5602.TP.20161031.1650.002.html

Key words:pragmatic analysis;relevance inference;fuzzy conceptual graph;cognitive context

猜你喜欢
概念图含义准确率
Union Jack的含义和由来
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
概念图在护理领域的应用现状
初中物理教学中运用概念图
五星红旗的含义
概念图策略在生物复习课中的应用