徐健 黄雨馨 王唯一等
DOI:10.3969/j.issn.1008-0821.2021.09.017
[中图分类号]G254 [文献标识码]A [文章编号]1008-0821(2021)09-0167-10
当前,论辩挖掘研究已引起人工智能、知识管理、逻辑学和语言学等学科研究者的普遍关注,是一个典型的多学科交叉领域,分析的文本包括新闻、政治演讲、学术论文、法院判例等体裁。论辩挖掘建立在观点挖掘的基础上,对观点的支撑性论据和论证过程进行分析,可视作前者研究的延伸和扩展。论辩挖掘最初起源于计算论辩(Computa-tional Argumentation)的概念,旨在将论辩理论(Argumentation Theory)与信息推理技术相结合,借助自然语言处理和机器学习的方法自动化地解析文本中的论辩结构,有助于实现对文本的深度理解和细粒度分析,提高信息智能化处理水平。随着越来越多的论辩性文本,包括学术论文、议论性评论、法律条文与判例等的数字化发展,相关数据的可获得性和可机读性也越来越高,为论辩挖掘研究的产生、发展提供了数据支撑。与计算论辩更关注方法不同的是,论辩挖掘研究更倚重数据和应用场景,如何从中发掘出有效信息、辅助决策是论辩研究的重点。
当前,人工智能和计算机语言学领域较多国际会议举办了多次论辩挖掘主题讨论会,例如贝蒂诺罗国际信息学中心举办的AT&NLP边界与联系研讨会(BiCi ArgNLP)、苏格兰信息与计算机联盟论辩挖掘研讨会(SICSA Workshop on AM)等。本文主要对2014—2020年分别在巴尔的摩、丹佛、柏林、哥本哈根、布鲁塞尔、佛罗伦萨、巴塞罗那举办的论辩挖掘研讨会(ACL Workshop on AM)进行系统阅读整理,共计获得文献121篇。通过对文献进行系统的梳理,明确该领域核心概念内涵,介绍相关理论、技术和方法,将相关应用研究按照场景进行分类,总结各方面研究不足并对未来发展进行展望,以期为认知计算、知识组织等相关领域研究提供参考与借鉴。
1相关概念与理论基础
1.1基本概念
Argumentation作为一种行为,是指用一定证据来支持或驳斥一个观点,以达到说服受众的目的。例如,在经典的三段论案例中,通过“人会死”和“亚里士多德是人”两个命题来论证“亚里士多德会死”这个论点,其中蕴含的论辩结构由论辩部件和论辩关系组成。
1)论辩部件
论辩部件(Argument Component)是论辩结构的基本组成单位,也有学者称其为Argumentative Discourse Unit(ADU)、Argument Unit。论辩部件具有判断性(Declarative)和可证伪性(Falsifi-ability)两大特征,与逻辑学中命题(Statement或Proposition)概念相对应。其中,判断性是相对记叙性(Narrative)、描述性(Descriptive)而言的,可证伪性是指在逻辑上要存在一個或多个与该部件相冲突的命题或判断的可能性。Walton D提出论辩结构包括一系列前提、一个结论及其之间的支持与攻击关系。此处,前提(Premise)和结论(Con-clusion)均可视为一种论辩部件,两者在推理过程中承担的角色不同,结论的正确性要建立在证据正确的基础之上。需要注意的是,一个论辩部件可能同时具有前提和结论两种角色,比如前一个论点的结论可作为后一个论点的前提。
前提是指对论点起支撑作用的证据,也称论据。对应的英文词汇有Evidence、Proof、Premise等。现有研究主要关注证据的类型划分问题。例如,Aharoni E等将论据分为研究类、专家类和轶事类3个类型。其中,研究类是指通过定量分析论证,专家类是对个人或组织的观点进行引用,轶事类是用事例对论点进行作证。Walker V R等将论据分为证词、案例报告、法律条文等类型。可以看出,现有研究对论据的划分均与具体的场景有关,缺少整体层面的划分维度和框架,同时对不同类型论据的特征分析与可信度评估也应在后续研究中不断完善。
结论,是指某人对一件事情、物体静态属性和动态发展趋势的判断,也叫论点、观点、论断、断言或主张等。与论据相比,论点更强调判断的主观性,对应的英文词汇有Opinion、Argument、Per-spective、View、Viewpoint、Claim、Assertion。在论辩挖掘中,一般Claim(Declarative Sentence)表示论点,用Argumentation表示论辩。需要注意的是,观点具有多重含义,相关研究应辨别其与情感、视角概念的边界和关联。
2)论辩关系
论辩关系就是指论辩部件间的论证关系,包括微观和宏观两个层面。微观层面论辩关系是指“Premise-Conclusion”推理和论证关系。论辨对应英文单词Justification、Validation、Verification、Rea-soning等。在拓扑结构方面,代表性模型有Moch-ales R等提出的链式论证模型,Freeman J B提出的组合一收敛论证模型,Eemeren F V等提出的多重—并列复合论证。在论辩方法上,主要有三段论(Syllogism)和演绎—归纳模型(Induction-Deduction),其中具体的Argument Schema包括例证、引证、推理等。目前,宏观层面的论辩关系主要有“支持—攻击”(Support-Attack)模型,前者是相互印证的支撑关系,而后者是相互对立关系。
1.2论辩挖掘相关理论
论辩挖掘研究的理论基础多来自哲学、逻辑学领域。在计算机语言学的方法和技术涉足论辩挖掘任务前,论辩分析多采用专家手工绘制论证图(Argument Diagram)的方式开展。相关理论主要包括图尔敏模型(Toulmin Model)、修辞结构理论(Rhetorical Structure Theory)和论证块模型(Argu-mentative Zoning,简称AZ)。
图尔敏模型(Toulmin Model)最早于1958年被提出,共包括主张(Claim)、数据(Data/Grounds)、担保(Warrant)、佐证(Backing)、限定词(Qualier)、反驳(Rebuttal)6个组成成分。在此基础上,Freeman J B借鉴了美国哲学家波洛克(John L.Pollock)的观点,将反驳分为消解反驳(Undercutting Defeater)和直接反驳(Rebut-ting Defeater),可视为图尔敏模型的改良版本。
修辞结构理论(Rhetorical Structure Theory,简称RST)也叫作修辞关系。该理论于1988年提出,将文献单元间关系界定为对比、例证、详述等24种。在此基础上,IMRC、IMRD、BIM-RCD等语步模型也被广泛地应用于文本功能的识别与组织。从概念上来说,论辩结构是修辞结构的一种类型。因此,也有部分学者研究如何在修辞树的基础上抽取论辩结构。
论证块模型(Argumentative Zoning,简称AZ)最早由Teufel S于1999年在其博士论文中提出,并在科学论文上进行了标注。之后,Teufel S在上一版本的模型基础上进行改进,提出了15种句子功能类型对科学文献中句子的修辞与论证功能进行界定。AZ模型来源于对科技论文内容的标注,被认为是论辩挖掘研究重要的理论基础。
可以看出,图尔敏模型和论证块模型都是对句子或文本单元的功能进行刻画,而修辞结构理论(Rhetorical Structure Theory,简称RST)则更多关注文本功能单元之间的联系。这些理论模型对论辩挖掘方法和应用研究的开展具有重要的启发和指导意义。
2论辩性文本识别及其关系判定方法
目前,论辩挖掘在方法层面主要聚焦于论辩性文本及其间论辩关系的识别两个方面。前者包括论辩句子识别与边界的划分,后者包括对论辩单元间微观关系和宏观关系的识别。
2.1论辩性文本识别
論辩性文本(Argumentative Text)是指在文本中具有推理和判断功能的文本块,其目的在于提高话语的可信性和说服力,在学术论文、法律判定与条款、辩论稿等类型文本中广泛存在。对论辩性文本进行识别与分类是对论辩结构进一步分析和挖掘的基础。
1)论辩性句子识别
论辩性句子识别工作起始于对语料的获取与标注工作,对于标注过程和结果的分析是现有研究的一个热点。Reed C等、Stab C等和Eckle-Kohler J等分别对法律判决和学生撰写议论文进行论辩结构标注,Kappa指标常被用于评估人员标注结果的一致性,其值与标注难度呈负相关关系。相关工作形成的语料库为论辩性文本的自动识别提供了数据基础。
在非监督学习方面,Petasis G等发现抽取式摘要技术在论辩性文本识别中有着正向影响。Levy R等提出一种基于检索查询的论断句识别方法。Jo Y等提出了一个瀑布模型(Cascade Model),不仅对陈述句进行识别,对疑问句、祈使句中的隐性论点也做了识别,并对论点中的指代消解问题做了研究。在监督学习方面,Palau R M等、Palau R M等、Moens M F等在Arau-caria数据集上训练包括最大熵、朴素贝叶斯、支持向量机等分类器,各种词汇、句法特征的识别效果也得到了全面的分析验证,相关研究通过句子二元分类已取得比较好的识别效果。近年来,深度学习方法在论辩性文本识别中也得到了应用。例如,Spliethover M等通过实验否定了注意力机制在论辩部件识别中的效果。
2)论辩部件边界识别
Habernal Ⅰ等发现并非所有论辩部件都以句子形式呈现,还存在一对多、多对一情况。李永泽等提出应用句子关系分析和边界识别的方法对论辩部件进行准确的抽取。研究多使用序列标注的方式对句内词汇进行是否为边界词的判断,Park J等、Sardianos C等、Petasis G使用CRF(条件随机场)、LSTM-CRF方法进行论辩部件边界的识别。在非监督学习方面,Ferrara A等提出了一种基于主题模型论辩部件边界识别方法。在论辩部件分类方面,大多将识别的论辩部件分为Conclusion和Premise两类。Oraby S等将论辩信息分为事实性(Factual)和情绪性(Emotional)两种。Hidey C等在此两类的基础上,进一步对结论和前提的语义类型进行了标注。
由上可知,论辩性文本识别通常作为一种句子二元分类问题来处理的,现有研究主要关注在分类器特征的选择上,缺乏对论辩性文本判断标准的研究。识别效果的评估也依赖数据标注质量,缺少具体应用场景中的评估。目前,学者们大多关注句子内部论辩部件边界识别(Argument Boundary Detec-tion)问题。对跨多句论辩部件识别的研究相对较少,这也是未来应重点突破的研究方向。
2.2论辩性文本间关系判别
论辩性文本间关系判别是论辩挖掘的重要任务。相关研究可分为微观和宏观层面关系的识别。其中,前者常见于独白型文本或篇幅较短的评论信息中,后者多见于对白型文本或多文档间关系的分析中。
1)论辩文本间的微观关系
论辩文本间的微观关系旨在识别论辩性功能部件(Argumentative Components)间的推理关系。Tre-visan B等总结了论辩性文本中表示推理关系的提示词。Carstens L等通过句子间的支持和论证关系来识别论辩性句子,探索出一条论辩文本及其关系综合识别的方法。Stab C等在对论辩部件分类的基础上,采用SVM分类器来判定给定的“前提—结论”二元对是否为支持关系。LawrenceJ等提出一种基于主题模型的论据和论点间推理关系判断方法。近年来,深度学习方法在论辩性文本关系识别方面得到越来越多的应用。例如,Ko-reeda Y等基于蒯嵌入技术,通过带有注意力模型的循环神经网络(RNN)识别论据与断言之间的支撑与攻击关系。Deguchi M等将神经网络和文本秩技术结合,对论辩性功能部件间的关系进行识别。
2)论辩文本间的宏观关系
论辩性文本间宏观关系包括论点间的语义关系和对比关系。语义关系主要可分为攻击性(At-tack)与支持性(Support)关系两类。Palau R M等提出一种基于上下文无关语法(Context-Free Grammar,CFG)法律文本中论点间关系判别方法。Bohui F等采用文本蕴涵分析(Text Entailment Analysis)方法推断论坛帖子间的关系。对比关系主要对观点的可信性进行比较,Potash P等从二元对的角度提出了论辩性文本说服力比较算法。相关方法对论点的影响力预测和说服力评价具有借鉴作用。
论辩文本间的关系是多元和复杂的。现有研究模型在微观和宏观层面还存在较多不足。具体来讲,微观层面仅关注论点与论据间的推理关系,对论点一子论点间的包含关系研究较少。在宏观层面,缺少相同、相似、对立、竞争性关系的识别,这些类型关系的识别在观点查重、查新和评估方面也有重要的价值。未来相关研究应重点关注论辩部件的内部组成结构,在更深层次和细粒度的层面研究论辩部件及其关系的结构化表示问题。相关研究有助于实现对论辩性信息的组织,实现论辩性文本的深度理解。
3论辩挖掘应用研究
论辩挖掘应用场景主要包括法律场景、在线辩论和学术场景等。各场景涉及的文本均具有论辩性的特征,但在体裁、文本长度、修辞结构方面有着各自的特点。
3.1法律场景
法律过程和法律文本具有规范性和严谨性的特点,非常重视证据和推理过程。因此,法律场景是论辩挖掘应用最早和最成熟的领域,相关文本涵盖判决书、法律条文、案例报告等。主要分析法律场景下的事实推理和量刑论证问题,以期辅助判案过程。目前,该方向学者已经探索了英文、希腊文、日文、葡萄牙文、西班牙文等语言的法律文本的挖掘研究。该领域影响较大的语料库有Araucari-aDB、ECHR(European Human Right Court)、疫苗注射论辩等。Palau R M等使用文本分类方法,从欧洲人权法院判决文中对论辩性文本进行自动抽取。Savelka J等标注了法庭判决文本中对术语的解释性语句,并构建了此类句子的识别特征。Fierro C等标注智利国民在2015年新宪法制定过程中生成的政治观点,对观点中的核心概念进行分类,并将这些观点分为政治、事实和价值3类。Walker V R等把对美国退伍军人伤残索赔裁决文本中句子的语义分为证据、推理、事实3大类,并对其中证据类型做了进一步划分。YamadaH等以民事法庭判决为例,将其按照一定主题划分,对论点层次结构(Argument、Sub-argument)进行标注。
对法律文本中的论辩结构进行识别并以友好的方式进行展示可以提高相关人员的阅读效率。然而,不同国家和地区的司法体制并不相同,可分为大陆法系和英美法系,相关研究需要专业的法律背景知识。当前,相关研究主要集中在英文、日语和西班牙语等语料的研究中,而汉语场景下的法律论辩挖掘研究甚少,可参考语料库数目不多。在未来的研究中,可以借鉴国外相关研究,开展面向中文法律语料的标注与论辩挖掘分析研究。
3.2社交媒体场景
随着Web技术的发展,用户越来越倾向于在互联网上发表自己对某事件的理解、看法和意见,而不局限于被动地接受信息。在该场景中,使用论辩挖掘方法具有增强论点说服力、发现对方观点漏洞、总结整体结论等功能。目前,该场景下已形成Idebate、Convinceme、Createdebate等与论辩挖掘有关的语料库与平台,为相关研究的开展提供了数据基础。相关应用集中于争议性观点识别、观点影响力与可信性评估、观点的检索与呈现3方面。
在争议性观点识别方面,Cabrio E等从De-batepedia等网站上对有争议性帖子进行标注。Aha-roni E等选择了维基百科中有争议的话题,对各方论点和论据进行标注。Mao F等抽取了在讨论是否对争议性百科词条删除讨论中的祈使句。Peldszus A等对文本中相互对立的论断进行了标注。Bilu Y等提出了一种基于规则的自动生成对立性观点的算法。Reisert P等提出一种基于图尔敏模型和知识库的自动生成支持正反双方辩论话语的模型。
在观点影响力和可信性評估方面,学者多从语言和受众两个方面研究说服机理。Mao F等提出观点对网民影响可以从显著性、来源、维持和偏差4个方面体现。Wei Z等对在线辩论语料中的驳论策略、立论策略、辩论质量开展了标注。在此基础上,有关学者对观点的可信性和说服力水平进行了评估。Park J等对用户评论中命题的被论证情况进行了标注。Ng L等对多种类的语料进行了论辩质量的标注。Passon M等利用论辩挖掘技术对商品评论的有用性进行评估。Gu Y等通过对评论的说服力进行自动识别,发现隐性的主题特征有助于提高识别效果。Kotonya N等利用论辩挖掘方法对新闻的真实性进行评估,进而识别出虚假新闻。
在观点检索和呈现方面,Wachsmuth H等研究网络观点检索问题,包括获取、查询、评估、索引、排序和呈现等环节。Le D T等使用开发了一个基于检索的可与用户讨论有争议话题的对话系统。观点呈现主要以代表性观点抽取和总结的方式开展,Barker E等提出了一种以问题为中心的观点聚类方法,对新闻评论中的意见进行总结。Chris R等使用语义文本相似性(Semantic Tex-tual Similarity)对论点进行聚类进而识别出在线辩论中的代表性论点。在多文档层面,Carlebach M等研究对于新闻报道的多视角聚合方法。
由上可知,社交媒体场景下的论辩挖掘研究主要对在线辩论、贴吧、评论、维基百科、新闻社评等类型文本进行分析。相关研究与观点挖掘(O-pinion Mining)存在一定重合,两类研究均以主观性文本信息的度量与分析为目标,前者研究情感分类、情感词典构建及其极性强度计算方法;后者则更关注所持立场和观点的原因。与法律和学术场景相比,该场景的语料存在规范性差、表达随意的问题。论辩挖掘的理论并不完全适用该场景的语料,需要对数据进行质量评估与筛选,在此基础上开展舆情分析等深层次的研究。
3.3学术场景
在学术场景中,合理的论辩结构有助于说服同领域的读者。因此,论辩挖掘在学术领域有着广泛的应用前景。例如,人文社会科学研究通过论辩挖掘的方法可更全面地分析学术论著中蕴含的论点和思想。自然科学则可以使用论辩挖掘的方式对知识的论证过程进行评估,从而提高学术信息传播与交流效率。目前,相关研究聚焦于学术论文论辩结构标注、学术观点知识表示和学生撰写文章分析3个方面。
在学术论文论辩结构标注方面,Lawrence J等对比了人工标注和论辩挖掘的方法在心理学著作论辩结构识别效果的差异。Graves H等分析了生物医学领域期刊论文标题中论辩性观点出现情况,研究发现时态动词有助于观点识别。Faiz S Ⅰ等提出一种基于规则的关系抽取方法,并对生物学中反映实体间因果关系的句子进行了识别。Mayer T等对医学随机对照类论文中的论据进行了标注和自动识别。Accuosto P等对学术论文中的观点及其论证进行了分析,并据此预测会议论文的接受程度。Lauscher A等构建了一种细粒度的学术论文论辩挖掘工具ArguminSci,提供命令行、Web等使用方式。
在学术观点表示方面,Green N最早研究使用修辞关系和论辩理论研究论文中认识重构问题。随后,Green N探索了使用语义实体及其关联的方式对生物学期刊论文中学术观点的表示问题。王晓光等提出了科学论文的论证本体SAO(Scien-tific Paper Argumentation),并以图书情报和生物医学领域论文论证区域进行标注实验。Blake C提出一种对医学论文研究发现的论点框架,研究发现,摘要中出现的论点仅占总数的7.8%,所以需要对全文中的论点进行识别。
对学生撰写文章进行论辩结构与质量评估也是当前论辩挖掘研究中的研究热点。Lugini L等将学生课堂讨论转为文字,提出一种语篇特征、主题模型和机器学习融合的方法以识别命题间的论辩关系。Stab C等对文章中反方观点缺失情况进行识别。在此基础上,学者开始对学生撰写文章质量水平进行评估。例如,Ong N等使用基于规则的方法对本科生论文中论辩要素进行识别,发现其与专家文章评分的相关性。Song Y等和Kleban-ov B B等使用回归分析的方法,利用论证结构对文章质量进行预测。
随着数字学术出版物的爆发式增长,研究者面临着学术信息爆炸与知识匮乏的困境。当前,信息检索和文本处理技术已为用户提供了信息筛选和呈现工具。然而,学术论文的最大贡献在于其提出的创新学术观点,其与论辩结构仍需学者阅读和梳理文献才能获得,该工作不仅需要花费时间和精力,还需要一定经验,这对于新进入一个领域的学者而言更加困难。相较于另外两类应用情景,学术场景内论辩性文本具有规范性强的特点,但也存在篇幅长和标注门槛高的缺点,使得目前该场景研究要少于另外两类场景。此外,不同领域的学术研究有不同的研究范式,未来可对各领域在论辩方法和结构上的特点开展分析,为用户提供更细致和专业的服务。
4当前研究存在的不足与面临的挑战
论辩挖掘旨在从非结构化文本中抽取出结构化的论辩结构,识别出论辩部件并明确其间逻辑推理关系。相关研究对于实现论辩性文本信息的深度理解并进一步开展认知计算具有非常重要的意义。目前,该领域研究文献的数量逐年增多。然而,现有研究在整体上还存在一些不足之处,同时也面临着一些挑战。
4.1研究缺乏系统性和整体性
论辩挖掘研究是一个复杂、多样的研究范畴,涉及多种应用场景、处理环节、文本体裁。目前,相关研究缺乏系统性和整体性。主要体现在:①学科间合作和交叉不紧密。主要表现在逻辑学领域、人工智能领域相关研究团队缺乏深入的合作。究其原因,主要是逻辑学和人工智能分属人文、理工门类,两者重点关注的对象、问题、解决思路和效果评估等研究范式方面存在差异,导致跨学科合作存在困难。随着新兴学科的不断涌现,各领域边界被打破,学科间合作也会不断深入;②不同场景下论辩性文本的语言特征、结构特点的识别存在较大差异。目前,大多数研究仅关注具体领域和单一环节,对多任务、环节类联合建模研究比较少,更缺少不同体裁、场景间差异化的对比与关联分析;③相较于国外,国内论辩研究整体上处于起步阶段,导致以中文为语料的论辩挖掘还比较少。然而,作为一种广泛使用的语言,中文在词法、句法和修辞语步上与英语、德语等语言存在巨大差异,这需要引起国内相关领域研究人员的重视。
4.2语料库构建规模与规范方面的不足
目前,各类论辩挖掘研究已经构建了多种类型、体裁的语料库。这在某种程度上给论辩结构的分析和抽取提供了宝贵的数据资源。然而,该领域语料库构建还存在如下不足:①除Debater等少数语料库外,大部分语料库存在规模较小的问题,主要是由于数据获取还存在一定壁垒。受制于数据规模,目前无论是论辩部件识别,还是微观和宏观层面论辩结构的抽取,各类方法、模型的准确性、召回率还存在一定提升空间。一些依赖大规模训练语料的深度学习模型效果还不如传统的机器学习算法。此外,各方法的鲁棒性均不强,存在过适应性的问题。在大数据环境下,更多的论辩性数据将以非结构化文本的形式呈现在互联网上,这些语料可能包含大量不规范信息,这给语料库的收集、处理和更新带来挑战;②目前,对语料库中数据的标注工作主要通过人工的方式开展,该过程比较消耗人力与时间。由于理论与观察之间存在的差异,大部分研究者均针对各自语料的特点制定了具体的标注规则。对不同标注者,尤其是对缺乏逻辑学、法学背景的标注人员间标注结果进行一致性评估时,发现当前研究人员对于论辩结构的认知存在较大差异。这说明,当前论辩挖掘领域语料标注还缺少统一的规范。
4.3研究深度不足
论辩在人类交流过程中起着增强语言说服力的重要作用。论辩性文本信息广泛地出现在法律、政治和学术等各个场景中。对于论辩自身而言,其机理、结构具有变化丰富、差别细微等特征。当前,论辩挖掘主要是利用机器学习技术对论辩部件及其間关系进行自动化标注,研究深度还存在不足。主要体现在:①论辩挖掘研究中,无论是论辩部件的识别还是论辩结构的抽取,仍然是以句子或连续字符串为单位进行处理。较少深入论辩部件内部,就其组成要素和构成结构进行建模。此外,论辩性文本中广泛存在的指代、语态语气、省略、间接、反讽、引用等修辞手法,也加大了论辩结构抽取的难度;②各研究团队对前提、论断也缺乏细粒度分类与表示,论辩单元间关系也主要以攻击和支持等推理关系表示,这种方式虽然可以满足单篇独白型或对白型文本中论辩结构的抽取,但在多文档或语料库层面论辩结构抽取上,仍然需要从语义对比关系入手研究,将论辩单元使用结构化语义模型进行表示,从语义、主题、功能等多个角度对论辩单元间关系进行建模。
5未来研究展望
当前,大数据、云计算、人工智能等技术的蓬勃发展对论辩挖掘方法的革新、应用均具有一定推动作用,为相关研究提供更全面的数据资源、更强大的处理能力和分析工具。同時,跨学科研究的兴起也为论辩理论和文本挖掘技术的进一步融合提供了保障。未来研究应朝如下方向努力:
5.1推动论辩挖掘应用研究
论辩挖掘的主要目的是从非结构化文本中抽取论辩结构,在此基础上可以面向实际应用场景提供更精准的信息服务。未来可以开展的应用主要包括:①论辩性信息检索,其本质是一种特殊化的信息检索任务,包括对论据、论点和论证方法的查询,相关技术涵盖论辩信息的收集、索引、去重、排序和呈现过程,旨在满足各种场景下的信息查询需求;②文本说服力分析和评估,是指对论点的文本特征与其论证合理性间关系进行回归建模分析,主要包括对论证策略、论据充实程度进行评估。这两类任务的本质都是对论辩性文本语料的深入挖掘,旨在减轻有关论辩信息需求者阅读负担。
5.2提升语料库构建质量
作为一种文本挖掘研究,语料库的构建在论辩挖掘研究中起着非常重要的基础性资源作用。现有的语料库多以特定场景为依据,缺乏通用性,其构建规模和质量也存在不足。未来语料库构建应朝如下两个方向努力:①保证全面性、规模性要求。其中,全面性是指各个领域和体裁的文本都应当进行收集和分析,而规模性是指语料要有一定的覆盖范围,可随语料发展进行更新,借鉴众包的方式开展大范围的标注;②提升标注质量。研究者应对标注者标注结果间的差异及其原因进行归纳、分析和深入探讨,形成统一的标注规范。此外,应改进标注过程,更多地采用专家标注、增加标注轮次以提升标注质量。按照实用性原则制定和优化论辩挖掘语料库评估指标,采用目标导向的方式提升语料库构建质量。
5.3从论辩理解向论辩生成过渡
随着自然语言处理、深度学习等技术的进一步发展,未来论辩挖掘研究应从目前对文本论辩结构的抽取转向文本论辩结构的自动生成。也就是说,计算机对于论辩不仅应有理解能力,还应具有一定判断、分析和表达能力。例如,面向一个有争议的问题,根据问题描述和知识经验生成对问题的论断,依托各类事实、数据等证据,利用归纳、演绎等推理方式,自动分析原因,形成对策,为决策提供充足的论据。当前,人工智能还处于弱智能阶段,还需深入理解和模拟人类认知、思考和语言表达过程,才可能真正实现论辩内容生成与自动论辩。