刘秉权,徐 振,刘 峰,刘 铭,孙承杰,王晓龙,2
(1. 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001;2. 哈尔滨工业大学 深圳研究生院,广东 深圳 518055)
面向问答社区的答案摘要方法研究综述
刘秉权1,徐 振1,刘 峰1,刘 铭1,孙承杰1,王晓龙1,2
(1. 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001;2. 哈尔滨工业大学 深圳研究生院,广东 深圳 518055)
社区问答系统(Community-Based Question Answering Portal,CQA)的兴起,不仅为用户提供了信息获取与知识分享的平台,同时也积累了大量的问答资源。近年来对于问答社区中的问题匹配、专家发现、用户满意度分析、答案质量评价等方面的研究也逐渐加深,特别是答案质量研究已经从通过答案质量评价改善用户体验,逐步过渡到使用答案摘要提升答案质量。该文阐述了答案摘要对于社区问答系统中问答对资源再利用的重要意义,概括了答案摘要的主要任务,分析了答案摘要和多文档自动文摘的异同点,对答案摘要国内外的研究现状进行了概述,并且总结了答案摘要中需要进一步解决的关键技术问题。
答案摘要;问答社区;问句分类;文本语义相似度
随着互联网的普及和以用户为中心的Web2.0技术的快速发展,人们获取信息的重要途径——问答系统也从传统的结构化数据问答系统进入了基于问答对知识库的问答系统时代。在基于问答对的问答系统中以Yahoo!Answer*http://answers.yahoo.com/和百度知道*http://zhidao.baidu.com/为代表的社区问答系统发展最为迅速。社区问答系统以用户为中心,充分发挥用户的交互作用,使得用户从单纯的信息获取者转变为信息的提供者。它不仅为用户提供了一个问题搜索、答案获取和信息分享的平台,而且克服了传统搜索引擎在交互方面的不足(传统的搜索引擎返回结果通常是问题相关的链接,答案需要用户根据链接去寻找;对于复杂问题传统搜索引擎通常无法给出有效相关信息),为开放型复杂问题提供了更加直接和有效的解决方式。
在社区问答系统中,用户的广泛参与加快了信息的传播速度,同时也在“提问-回答”的交互过程中积累了大量的问答对资源。这些问答资源具有巨大的应用价值,一方面,这些问答对资源为问答对知识库构建奠定了基础,给用户获取信息提供了一个更加直接的途径;另一方面,由于社区问答系统中的问题和答案是通过社区用户交互产生的,这些问答对资源也充分反映了用户的真实语言习惯、用户知识面、兴趣爱好等信息,给自然语言处理、用户行为分析等研究提供了充足的资源。然而问答社区中大量的问答资源却存在自身质量和用户使用方面的问题,(1)社区问答系统中的问答对属于用户生成数据(User Generated Content,UGC),存在着冗余度大、可信度低、不完整等质量问题[1-2]。近年来学者们在答案质量评价上做了很多研究,然而答案质量的研究局限于单一答案,没有考虑复杂开放型问题的答案不唯一、用户知识水平差异和用户主观性等因素[3],导致获取的答案存在片面和不完整问题。而复杂开放型问题在问答社区中占有很大比例,Liu[4]等统计发现Yahoo!Answer四个目录(Computer&Internet,Entertainment&Music,Health,Society&Culture)中开放型和意见型(open,opinion)两类问题比例在56%以上,答案的不完整是在问答社区中普遍存在的问题;(2)在问答社区中同一问题通常对应多个答案,一一浏览致使人们获取信息的效率降低。在Yahoo!Answer中平均每个问题有5~10个答案,一个问题最多对应41 108个回答者的答案*http://answers.yahoo.com/question/index?qid=20111003024220AAavzyB,一一浏览基本不可能;这些问题导致问答社区中问答资源不能直接分享和再利用。因此在社区问答系统中急需类似于多文档自动文摘的方法对于答案集合进行处理,获取完整答案,同时避免用户一一浏览,提高信息获取的效率。
CQA答案摘要试图从问题对应的答案集合出发,通过对答案集合中多个答案的整合,获取正确、完整、高质量的答案。答案摘要不仅能解决上述答案片面不完整的问题,同时能提高人们获取信息的效率。因此CQA答案摘要的研究不仅能够抽取高质量问答对,提高用户体验,同时有利于问答社区中海量问答资源的再利用。
本文其余章节结构如下: 第二节系统阐述了CQA答案摘要的主要任务,对比了答案摘要和多文档自动文摘的差异;第三节详细概述了答案摘要的国内外研究现状;第四节给出了答案摘要中需要进一步解决的关键技术以及这些关键技术的研究热点;第五节中总结了答案摘要研究的难点和未来的研究方向。
很多研究指出CQA答案摘要可以看作多文档自动文摘问题[4-6],其中问题对应于文档集合的主题,若干答案被视为文档集合[7]。Wang[8]给出了答案摘要的初步定义: 答案摘要是以解决不同用户面对同一问句时由于主观性和知识约束造成的单一答案的片面性问题为目的,将同一问题的不同侧面的答案融合为一个全面的高质量答案的答案级的文摘过程。Tomasoni[5]给出了答案摘要的最终目标: 高可信度、用户意图相关、高覆盖度、低冗余。我们结合现有的答案摘要定义和摘要的最终目标,给出如下答案摘要问题的定义: 答案摘要是对于一个问题及其对应的多个答案,通过分析问题和答案之间的关系(答案和问题必须相关)、答案之间的关系,将多个答案进行整合得到一个可信的、正确的、低冗余的、完整的答案的过程。答案摘要与问题相关的多文档自动文摘[9-11]目标上存在一定的相似,但答案文摘却与多文档自动文摘有着很大的不同,不同点如下:
(1) 作为一种典型的用户生成内容(UGC),社区问答系统中答案的文本长度通常比较短,与多文档文摘所处理的网页正文(如新闻、博客)相比,答案在语言信息上显得极为稀疏,这种语言信息的稀疏表现为短文本中去除停用词后有意义的词语比较少。然而稀疏语言信息却包含丰富的语义信息,多文档自动文摘中基于统计和规则的语言处理技术很难捕获短文本的丰富语义信息。与此同时网络社区中的语言使用习惯和通常的网页正文也存在着很大差异,致使现有的自然语言分析工具对其处理效果不佳。
(2) 从生成过程看,答案摘要着重于对答案集合中各个不同观点的覆盖力,是一个信息整合过程。然而问题相关的多文档自动文摘重点是去除冗余信息,使用简洁的文摘概括多文档集合,是一个信息压缩过程[9,11]。信息整合过程中不仅需要考虑答案之间的关系,同时还需要注意整合的顺序、缺失信息补足等问题,明显比信息压缩过程更难操作。从最终摘要结果上看,答案摘要是多个答案融合到一起,通常比单一答案要长,而多文档自动文摘通常比单一文档要简短。
(3) 与多文档集合相比,社区问答系统中不仅包含问题、答案等文本信息,同时存在大量的社区信息(最佳答案率、答案支持数等),这些社区信息可以从一定程度上反映答案的可信度等质量问题,因此可以指导答案摘要过程获取高质量的答案。
通过从研究对象、生成过程和最终摘要结果以及社区信息等几个方面的对比,可以发现答案摘要研究的技术重点和多文档自动文摘不同。答案摘要以答案为研究对象,然而答案大多数以短文本形式表现,现有的自然语言处理技术对短文本的处理效果不佳;并且除了文本信息之外,还有大量的社区信息,如何充分利用社区信息指导答案摘要过程也是难点。这些都给自然语言处理的研究提出了新的挑战。
2005年起陆续出现了新浪爱问、搜搜问问、百度知道和Yahoo! Answer等社区问答系统,针对社区问答系统的研究同时也拉开了帷幕,近年来针对社区问答系统中的问题匹配[12]、专家发现、答案质量评价[13]等问题的研究都取得了很好的研究成果。答案质量评价通过使用文本特征和社区信息特征预测答案质量,进而推荐最佳答案,从一定程度上提高了问答对的质量。Liu[4]等详细分析了问答社区中答案质量问题以及出现质量问题的原因,发现问答社区中开放型问题占有很大比例,开放型问题答案不唯一、用户的主观性和用户知识水平受限等因素导致单一答案往往不全面。为了进一步提高答案质量,必须从同一问题对应的答案集合出发,通过对答案集合进行答案摘要获取完整的高质量答案。答案摘要的研究2008年才由Liu[4]等人首先提出,是社区问答系统研究中一个较新的问题,目前其研究处于探索阶段。国内外对于答案摘要的研究主要有两种思路: 一种是将传统的自动文摘技术移植到答案摘要中;另一种是针对答案这种短文本的特点,从答案表示角度更好地捕获答案的语义信息。
3.1 基于多文档自动文摘的方法
答案摘要和多文档自动文摘尽管存在很多不同点,但是它们有着相似的目标,因此有的研究者就将多文档自动文摘的方法进行改进应用到答案摘要过程中。Liu[4]等提出了使用多文档自动文摘技术进行社区问答系统答案文摘的方法,对于开放型问题通过将同一问题的答案进行聚类,在每个簇中提取名词短语,然后计算名词短语与聚簇的相关度,根据最高相关度名词短语从每个簇中选取关键答案,然后排序关键答案得到答案文摘。该方法没有充分考虑普通文档和问答社区中答案的区别、问答社区的答案语言信息稀疏等问题,语义相似度计算过程也存在较大困难,答案聚类效果难以保证,同时也忽略了答案与问题的相关性和问答社区中的社区信息。He[7]针对问答社区中“Yes/No”类型的问题进行答案摘要,将“Yes/No”类型问题的答案摘要看作对主观/客观答案的分类问题。他们提出一种对于非对称文本(问题和答案,它们特征空间差别很大)的相关性计算方法,同时使用特征函数将相关性和意见得分结合对答案进行分类,从而达到对答案集合进行摘要的目的。Tao[14]等提出了中文社区问答系统中的列表型和方法型两类问题的答案摘要算法,特别是在方法型问题的答案摘要算法中对答案中语句的逻辑顺序进行判别,并且根据逻辑顺序的优劣选取答案作为摘要。以答案为单位进行操作,使得到的答案摘要保留了已有的逻辑结构、语言流畅便于人理解,但选取的关键答案之间经常会出现语义上的交叉重叠,答案摘要的冗余度较高。
以答案为操作对象的摘要算法通常冗余度较高,因此,很多研究都以句子为单位进行操作来降低冗余度。Li[15]等使用词的层次依赖关系抽取句子的特征对句子进行建模,然后以句子为单位聚类,从每个簇中选取最短的句子组成摘要。Wen[16]等使用条件随机场将摘要句抽取问题转化为序列标注问题,通过融合四种上下文因素对句子的文本和社区信息(最佳答案,回答者等级等信息)特征建立模型,获取高质量低冗余的摘要句。Li[15]和Wen[16]通过句子特征抽取与建模从一定程度上改善了语言信息稀疏的问题,更好地进行了答案语义信息的理解,以句子为单位得到的答案摘要的冗余度明显降低;不同点在于Li[15]进行句子建模是为了进行相似度计算进而提高聚类效果,Wen[16]则是直接使用句子的特征建立句子抽取模型。Pande[17]将句子作为图的顶点,用文本和非文本特征描述句子,然后通过结构化行列式点过程(SDDP)选取摘要句。由于短文本语言信息稀疏使得建模很困难,目前大多数答案摘要都是基于多文档自动文摘的方法。
3.2 基于答案表示的答案摘要方法
传统的文档包含大量的语言信息,这些语言信息可以很好地反映文档的语义,而问答社区中的答案属于用户生成内容,语言信息很少,语义信息的表达就比较困难,导致信息融合结果不佳。因此有些答案摘要研究中一个关键问题就是答案的表示,答案的正确合理的表示可以有效地反映语义信息,答案表示或者描述的研究对于答案摘要有很重要的作用,研究者通过答案表示获取充分的语义信息,进而利用语义信息进行答案摘要。Liu[6]以答案中比句子粒度更小的语言元素短语作为顶点建立图,同时在顶点之间相似度计算的过程中加入用户权威度,然后通过随机游走算法获取顶点的权重,进而选取摘要句。Tomasoni[5]使用若干词语或者词组(Basic Element,BE)描述问答对中的主要概念,这些概念能够体现文本的语义,克服语义鸿沟,同时利用这些概念量化句子的覆盖能力、答案与问题的相关性以及摘要的新颖性(Novelty),进而构造句子打分函数,最后使用整数线性规划方法选取摘要质量最高的句子构成答案摘要。除此之外,这些概念还描述了同一问题答案之间的信息重叠关系。Wang[8]将答案摘要视为各个答案的主题的合并和去重过程,通过深度学习技术生成答案的子主题,使用主题词描述答案得到答案摘要的主题词集合,然后使用主题词集合选取句子构成答案摘要。Tomasoni[5]和Wang[8]使用更小粒度的答案表示方法进行答案摘要,分别使用概念要素和深度学习的方法减小语义鸿沟,而且这种小粒度表示可以很好的反映同一问题答案之间的关系。
尽管答案摘要研究处于起步阶段,仍然有许多相关领域的研究值得借鉴。邮件和产品评论均与问答社区的答案在语言表达和文本长短上相近。邮件摘要[18]和评论摘要[19]已有一定的研究基础,很多方法可以指导答案摘要的研究。意见性问题在问答社区中占有很大的比例,现有的意见挖掘[20]对于这类问题的答案摘要有很多可借鉴的方法。此外对于社会化文本的内容摘要[21](Social Content Summarization,如twitter,新浪微博)研究开始兴起,而且在文本信息和社区信息联合建模方面取得了一些成果,这对于答案摘要如何充分利用社区信息有一定的指导作用。
自动摘要的评价方法通常有两种,一种是外部评价方法,通过自动摘要对其他任务的完成质量的贡献度来判断;另一种是通过与人工摘要的结果进行比较来判断。目前不管是多文档自动文摘还是答案摘要主要采用后一种评价方法,Lin和Hovy[22]提出基于N-gram的自动文摘系统评价系统ROUGE,是自动摘要评价最常用的方法。在问答社区答案摘要中,Liu[4]等通过人工方法来评价答案摘要的可读性和内容丰富度,Li[15]提出了准确率和召回率,Wang[8]使用准确率和冗余度评价答案摘要的质量,其他大多使用ROUGE评价答案摘要。上述的答案摘要评价方法存在一个共同问题: 人工摘要的效率较低,无法实现大规模的评价。目前,Liu,Tomasoni和Wen利用Yahoo!Answer的资源构建了答案摘要的测试集,可以通过电邮的方式申请获取。
根据国内外研究现状,我们将答案摘要涉及的关键技术问题概括如下: 首先,从第三节的国内外研究现状可以看出,现有的答案摘要的研究针对不同类型的问题提出答案摘要方法,Liu[4]对于开放型和意见型问题设计了摘要算法, He[7]针对Yes/No类型的问题进行了答案摘要, Tao[14]介绍了中文问答社区中列表型和方法型问题的摘要方法,Li[15]提出调研类问题的摘要方法,Wen[16]和Pande[17]提出了复合问句的摘要方法,因此问答社区的问题分类是答案摘要中首先需要解决的问题;其次,答案摘要最终获取的答案是与问题相关的[23],问题对应的答案集合中通常存在和问题不相关或者相关性较弱的答案,所以问题和答案的相关性也是答案摘要中一个很重要的问题;然后,Li[23]和Wang[8]指出答案之间的关系识别对于答案摘要有很好的指导意义,答案之间的逻辑关系可以帮助设计更好的摘要算法;此外,由于句子通常可以表达完整语义、容易理解,现有的答案摘要方法大都通过抽取句子形成摘要,因此摘要句的抽取和排序也是答案摘要的主要问题之一;最后,在进行答案摘要的过程中通常需要进行答案之间或者句子之间的相似度计算,而答案和句子通常都是短文本,所以短文本语义相似度计算也是答案摘要的一个重要问题。
综上所述,我们将答案摘要的关键技术总结为如下五个方面: 问题分类、问题与答案的相关性识别、答案之间的关系识别、摘要句抽取与排序以及短文本语义相似度计算。
4.1 问题分类
Liu[4]研究发现问答社区中约48%的问题有唯一答案,也就是说这部分问题不用进行答案摘要就可以获得完整答案。如果对所有类型的问题和答案都进行融合,将导致处理问题缺乏针对性,而且不同类型问题的答案摘要方法也存在差异,因此问答社区中合理的问题答案分类体系对于答案摘要具有很重要的意义。
问题分类体系在传统事实问答系统和信息检索领域都有很多研究,在问答系统中UIUC分类体系建立了一个两层问题分类体系,包括六个大类和50个小类,但是大多数是针对事实问题[24-25];在信息检索领域Rose[26]提出了一种面向用户搜索目标的问题分类体系。2008年,Liu[4]等在Rose的工作基础之上提出一种面向问答社区的三层问题分类体系,并且将其应用在答案摘要任务中,但是这种三层的问题分类体系很难实现自动分类。Fan[27]等提出了一种基于功能的单层问题分类体系,并且引入马尔科夫逻辑网络(Markov Logical Network,MLN)实现了自动分类,但是分类的效果较差。Zhou[28]和Chen[29]对于问答社区中主观性问题和客观性问题分别进行了研究,但是分类效果都徘徊在75%左右。
我们认为面向问答社区答案摘要的问题分类体系应具备如下特点: 区分哪些问题需要进行答案摘要;对于答案摘要算法设计有一定的指导作用,例如,方法型问题的答案摘要算法需要考虑答案的步骤顺序;容易实现自动分类,并且有较好的分类效果。Fan等提出的基于功能的问题分类体系是非常适合答案摘要任务的,因此对基于功能的问题分类体系进一步完善,探索更好的分类模型提升分类效果对于CQA问题匹配和答案摘要都有很大的意义。
4.2 问题与答案相关性识别
在社区问答系统中存在着大量的噪声,有些答案与问题并不相关,因此在答案摘要过程中,首先要确定问题和答案之间的相关性,这样才能保证答案摘要的正确性。正确识别问题和答案的相关性是社区问答系统中一个很重要的问题,问题和答案使用语言的方式差别很大,问题一般只有一句话,通常由疑问词和相应的实词组成;而答案通常比问题长,使用的词语也相对丰富,这就导致了问题和答案之间存在很大的词汇鸿沟,很难通过传统的词袋模型计算它们之间的语义相似度。Lee[30]引入了统计机器翻译的方法进行问题和查询的相关性识别,从一定程度上减小了问题和查询之间的词汇鸿沟。Wang[31]使用深度学习方法学习答案和问题的深层表示,进而计算问题和答案的相关性,取得了很好的效果。近来机器翻译和深度表示学习的研究都有很大进展,因此使用机器翻译方法或者深度表示学习方法是问题与答案相关性识别中很有意义的研究方向。
4.3 答案之间的关系识别
同一问题答案之间的关系识别可以更好地理解问题对应的答案集合,对于答案摘要过程具有很好的指导作用。根据答案之间的关系对答案集合中的答案进行筛选,同时答案之间的关系可以指导答案摘要方法的设计。目前,大多数研究者采用关键词或者主题识别答案之间的关系[5,8](如两个答案之间的重叠关系、相似关系等比较简单的关系),并且将这种关系应用到答案摘要中,指导答案摘要过程。Hikaru[32]等人根据文档逻辑关系提取了答案之间的逻辑关系,包括等价、详述、包含、概括、重叠、矛盾以及不相关等,同时在答案关系识别中引入了马尔科夫逻辑网(MLN),加入一些逻辑公式来分析答案之间的关系。对于相似性的关系,在答案摘要的过程中只需要保留两个答案中的一个即可,矛盾关系在观点问题中表明两个答案有不同的观点需要都保留。Li[23]通过HITs模型识别答案之间的关系进而对答案进行排序来获取意见型问题的合理答案。在现有的知识库如WordNet中定义了很多种词语关系(如相关关系、反义关系),如何将已有的知识库引入答案关系识别中值得探讨。
4.4 摘要句抽取和排序
由于目前摘要还是以抽取式为主,而且句子通常可以表达完整语义并且容易理解,现有的答案摘要方法大多还是以句子为单位形成摘要。问题与答案的相关性和答案之间的关系识别从答案层面对答案集合进行了过滤和分类,形成答案子集合;为了获取简洁的答案摘要需要从答案子集合中抽取若干句子表示答案子集合的观点,然后将各个子集合中抽取的句子合理地排序形成一个完整的答案。现有的句子抽取方法如下: (1)抽取句子特征,对句子进行建模,使用聚类方法选取句子[4,15];(2)将句子的各种特征进行量化(与问题的相关度、覆盖能力等),然后使用最优化方法选取句子使答案摘要质量最好[5,16]。由于社区问答系统答案的语言表达特点,语言信息较少,使得句子的抽取比较困难,尤其在语义相似度计算方面。Li[15]根据聚簇的大小对句子进行排序,很多其他摘要方法根据句子质量得分进行排序。这些排序方法通常没有考虑语言的指代、承接等问题,得到的摘要可读性较差。在很多自然语言处理任务中,都存在文本抽取和重组的问题,例如事件抽取[33],现有的方法通常采用模板解决可读性问题[34],因此,我们认为构造不同类型问题的答案摘要模板,将答案集合中的主题进行组合可以得到信息丰富、可读性较好的答案摘要。
4.5 短文本语义相似度计算
由于问题和答案在社区问答中大多是以短文本的形式出现,所以问题与答案相关性识别和答案之间的关系识别都与短文本的语义相似度计算有着密切联系。从某一角度来说,这两个问题都可以通过短文本语义相似度予以解决,一般来说问题和答案语义相似度越大,那么它们的相关程度越高;答案之间的语义相似度也反映了答案之间的关系,两个答案的语义相似度足够大说明两个答案语义相近,在答案摘要中这两个答案只要保留一个即可。虽然可以通过现有的语义知识库进行语义相似度计算,但是知识库中很多词语都不出现在知识库中,导致得到的相似度与实际相似关系存在很大的偏差。在上述两个问题中都用到了短文本语义相似度,由于处理的对象有差别,问题和答案处于两个不同的语言表达空间[7-8],它们计算语义相似度面临的困难也不同,因此相似度计算方法也存在着较大的差异。答案之间的语义相似度最大的问题就是语言信息稀疏,而问题与答案的语义相似度计算还存在着严重的词汇鸿沟。除此之外,在摘要句抽取过程中通常也需要通过句子之间的语义相似度去除冗余的句子,获取高质量答案摘要。基于语料库和知识库的文本相似度计算方法取得了较好的效果[35],但短文本的语言元素较少导致相似度计算困难,因此,采用表示学习进行文本深层语义挖掘是短文本相似度计算的一种重要途径[8,31]。
社区问答系统中存在着巨大的问答对资源,CQA答案摘要可以有效提升答案质量,对问答社区的问答资源重用具有重要意义。目前,CQA答案摘要的处理框架已经比较清晰,在问题分类、问题与答案关系识别等主要问题上需要进一步完善。同时由于短文本处理技术限制,答案摘要的效果不佳,因此短文本处理技术的进一步发展对于答案摘要有很大作用。答案摘要是获取完整答案的主要方法,很多研究者从不同的角度对CQA答案摘要进行研究,但现有的方法主要是抽取式摘要,致使问答社区的很多质量问题也转移到了答案摘要中;随着自然语言生成技术的不断发展,根据答案集合的语义信息生成答案摘要是未来的主要发展方向。
[1] J Jeon, W B Croft, J H Lee, et al. A framework to predict the quality of answers with nontextual features [C]//Proceedings of the 29th annual international ACM SIGIR conference on research and development in information retrieval. ACM, 2006: 228-235.
[2] X J Wang, X Tu, D Feng, et al. Ranking community answers by modeling question-answer relationships via analogical reasoning [C]//Proceedings of the 32nd international ACM SIGIR conference on research and development in information retrieval. ACM, 2009: 179-186.
[3] L A Adamic, J Zhang, E Bakshy, et al. Knowledge sharing and yahoo answers: everyone knows something [C]//Proceedings of the 17th international conference on World Wide Web. ACM, 2008: 665-674.
[4] Y Liu, S Li, Y Cao, et al. Understanding and summarizing answers in community-based question answering services [C]//Proceedings of the 22nd International Conference on Computational Linguistics. ACL, 2008: 497-504.
[5] M Tomasoni, M Huang. Metadata-aware measures for answer summarization in community question answering [C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. ACL, 2010: 760-769.
[6] X Liu, Z Li, X Zhao, et al. Using concept-level random walk model and global inference algorithm for answer summarization [J]. Information Retrieval Technology. Springer, 2011: 434-445.
[7] J He, D Dai. Summarization of yes/no questions using a feature function model [J]. Journal of Machine Learning Research-Proceedings Track, 2011, 20: 351-366.
[8] 王宝勋. 面向网络社区问答对的语义挖掘研究. 哈尔滨工业大学, 2013.
[9] 秦兵, 刘挺, 李生. 多文档自动文摘综述. 中文信息学报,2005, 19(6):13-20.
[10] D Das, A F Martins. A survey on automatic text summarization[R].Literature Survey for the Language and Statistics II course at CMU, 2007, 4: 192-195.
[11] A Nenkova, K McKeown. A survey of text summarization techniques [C]//Proceedings of the Mining Text Data. Springer, 2012: 43-76.
[12] 熊大平, 王健, 林鸿飞. 一种基于 LDA 的社区问答问句相似度计算方法. 中文信息学报, 2012, 26(5): 40-45.
[13] 孔维泽, 刘奕群, 张敏, 等. 问答社区中回答质量的评价方法研究. 中文信息学报, 2011, 25(1): 3-8.
[14] H Tao, Y Hao, X Zhu. Answer generating methods for community question and answering portals[C]//Proceedings of the Natural Language Processing and Chinese Computing. Springer, 2012: 249-259.
[15] S Li, Z Li. Answer summarization via term hierarchical structure [C]//Proceedings of the Fuzzy Systems and Knowledge Discovery (FSKD). IEEE, 2010: 2349-2353.
[16] W Chan, X Zhou, W Wang, et al. Community answer summarization for multi-sentence question with group L1 regularization [C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics. ACL, 2012: 582-591.
[17] V Pande, T Mukherjee, V Varma. Summarizing answers for community question answer services [C]//Proceedings of the Language Processing and Knowledge in the Web. Springer, 2013: 151-161.
[18] B Wang, B Liu, C Sun, et al. Adaptive maximum marginal relevance based multi-email summarization [C]//Proceedings of the AICI, 2009: 417-424.
[19] F Jin, M Huang, X Zhu. Guided structure-aware review summarization [J]. Journal of Computer Science and Technology. 2011, 26(4): 676-684.
[20] X Huang, W B Croft. A unified relevance model for opinion retrieval [C]//Proceedings of the CIKM, 2009: 947-956.
[21] Z Yang, K Cai, J Tang, et al. Social context summarization [C]//Proceedings of the 34th international ACM SIGIR conference on research and development in Information Retrieval. ACM, 2011: 255-264.
[22] C Y Lin. Rouge: A package for automatic evaluation of summaries [C]//Proceedings of the Text Summarization Branches Out: Proceedings of the ACL-04 Workshop. ACL, 2004: 74-81.
[23] F Li, Y Tang, M Huang, et al. Answering opinion questions with random walks on graphs [C]//Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP. ACL, 2009: 737-745.
[24] X Li, D Roth. Learning question classifiers [C]//
Proceedings of the 19th international conference on computational linguistics. ACL, 2002: 1-7.
[25] Z Yu, L Su, L Li, et al. Question classification based on co-training style semi-supervised learning [J]. Pattern Recognition Letters, 2010, 31(13): 1975-1980.
[26] D E Rose, D Levinson. Understanding user goals in web search [C]//Proceedings of the 13th international conference on World Wide Web. ACM, 2004: 13-19.
[27] F Bu, X Zhu, Y Hao, et al. Function-based question classification for general qa [C]//Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. ACL, 2010: 1119-1128.
[28] T C Zhou, X Si, E Y Chang, et al. A data-driven approach to question subjectivity identification in community question answering [C]//Proceedings of the AAAI: 2012.
[29] L Chen, D Zhang, L Mark. Understanding user intent in community question answering [C]//Proceedings of the 21st international conference companion on World Wide Web. ACM, 2012: 823-828.
[30] J T Lee, S B Kim, Y I Song, et al. Bridging lexical gaps between queries and questions on large online q&a collections with compact translation models [C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing. ACL, 2008: 410-418.
[31] B Wang, X Wang, C Sun, et al. Modeling semantic relevance for question-answer pairs in web social communities [C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. ACL, 2010: 1230-1238.
[32] H Yokono, T Hasegawa, G-i Kikui, et al. Identification of relations between answers with global constraints for community-based question answering services [C]//Proceedings of the IJCNLP. IJCNLP, 2011: 920-928.
[33] N Chambers, D Jurafsky. Template-based information extraction without the templates [C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. ACL, 2011: 976-986.
[34] 赵军, 刘康, 周光有, 等. 开放式文本信息抽取. 中文信息学报, 2011, 25(6): 98-110.
[35] A Islam, D Inkpen. Semantic text similarity using corpus-based word similarity and string similarity [J]. ACM Transactions on Knowledge Discovery from Data (TKDD), 2008, 2(2): 10.
A Survey of Answer Summarization on Community Question Answering
LIU Bingquan1, XU Zhen1, LIU Feng1, LIU Ming1, SUN Chengjie1, WANG Xiaolong1,2
(1. School of Computer Science and Technology, Harbin Institute of Technology, Harbin, Heilongjiang 150001, China; 2. Shenzhen Graduate School, Harbin Institute of Technology, Shenzhen, Guangdong 518055, China)
Community-Based Question Answering Portal (CQA) has been very popular recently, which provides a platform for users to share knowledge or to seek information and accumulated abundant QA (Question and Answer) pairs. Recently, there are many achievements in question search, expert finding and content quality evaluation of CQA. Especially the research of content quality transforms from answer quality evaluation to answer summarization, which can promote answer quality from the aspect of integrity. This paper surveys the motivation and task of answer summarization, reviewing the most relevant approaches and principal techniques of answer summarization.
answer summarization;community question answering;question classification; text semantic similarity
刘秉权(1970—),博士,副教授,主要研究领域为自然语言处理、问答系统、知识挖掘。E⁃mail:liubq@insun.hit.edu.cn徐振(1989—),博士研究生,主要研究领域为社区问答、答案摘要、短文本对话。E⁃mail:zxu@insun.hit.edu.cn刘峰(1983—),博士研究生,主要研究领域为社会网络中链接预测方法。E⁃mail:fengliu@insun.hit.edu.cn
1003-0077(2016)01-0001-07
2013-07-10 定稿日期: 2014-04-10
国家自然科学基金(61572151,61300114,621272383);国家高技术研究发展计划(863计划)(2015AA015405)
TP391
A