
2020-12-28 11:53李伯涵李红莲
电脑知识与技术 2020年31期

李伯涵 李红莲

摘要:基于注意力机制的编码-解码模型的神经网络具有很好的生成文本摘要能力。但是,这些模型在生成过程中很难控制,这导致在生成文本中缺少关键信息。一些关键信息,例如时间,地点和人物,对于人类理解主要内容是必不可少的。本文提出了一个基于多任务学习框架的用于生成文本摘要的关键信息指南网络。主要思想是以端到端的方式自动提取人们最需要的关键信息,并用其指导生成过程,从而获得更符合人类需求的摘要。在本文提出的模型中,文档被编码为两个部分:普通文档编码器的编码结果和关键信息的编码,关键信息包括关键句和关键词。引入了多任务学习框架以获得更先进的端到端模型。为了融合关键信息,提出了一种多视角注意指南网络,以获取源文本和关键信息的向量。另外,向量被合并到生成模块中以指导摘要生成的过程。本文在CNN 与Daily Mail数据集上评估了模型,实验结果表明此模型有重大改进。


中图分类号:TP391.1


Abstract: The neural network of the encoding-decoding model based on the attention mechanism has a good ability to generate text summaries. However, these models are difficult to control during the generation process, which leads to the lack of key information in the generated text. Some key information, such as time, place, and people, is essential for humans to understand the main content. This paper proposes a key information guide network for generating text summaries based on a multi-task learning framework. The main idea is to automatically extract the key information that people need most in an end-to-end manner, and use it to guide the generation process, so as to obtain a summary that is more in line with human needs. In the model proposed in this paper, the document is coded into two parts: the coding result of the ordinary document encoder and the coding of key information. The key information includes key sentences and keywords. A multi-task learning framework is introduced to obtain a more advanced end-to-end model. In order to fuse key information, a multi-perspective attention guide network is proposed to obtain the vector of source text and key information. In addition, vectors are incorporated into the generation module to guide the process of abstract generation. This paper evaluates the model on the CNN and Daily Mail datasets, and the experimental results show that this model has significant improvements.

Key words: key information;multi-task learning;text summary;key information guide network














关键词标签生成。要获取关键词,需要去除参考摘要中的停用词,然后将其余部分[rw=rwii]用作关键字正确数据标签。对于关键句子正确数据标签[rs=rsii],测量文本中每个句子的信息量,并选择关键句子[11]。为了获得正确数据标签,首先通过计算句子和参考摘要之间的ROUGE-L得分,来测量文章中每个句子的信息量。其次,根据信息量对句子进行排序,并按信息量从高到低的顺序选择句子。最后,获得了正确数据标签并通过最小化损失函数来训练提取器。方法类似于[11],该方法旨在提取文章的最终摘要,以便使用ROUGE F-1得分来选择句子。在本文提出的模型中,使用ROUGE得分来获得尽可能多的参考摘要信息。







这里使用CNN /Daily Mail数据集[4,25],并且以与[8]相同的方式处理数据。对于全局单词编码器和句子编码器,使用三个300维LSTM,并使用一个5万词的词汇表。在训练和测试过程中,将单词编码器的输入设为400个词汇,并将摘要的长度设为100个词汇。使用Adagrad算法[15]以学习速率0.15和初始累加值0.1来训练模型。一次训练样本数设置为16,关键词和关键句子的数量分别为40和10。共同训练这三个任务,并设置[λ1=1]和[λ2=λ3=0.5]。本文采用的主要评估指标是ROUGE的F得分。





表1表明本文模型的基线模型(称为关键信息指南网络)(如图1所示)比具有指针机制的Seq2Seq模型获得更好的分数,分别为+1.3 ROUGE-1,+0.9 ROUGE-2和+1.0 ROUGE-L。借助指针机制(如图1所示),关键信息指南网络(KIGN + Prediction-guide)再次取得了更好的分数,分别为+2.5 ROUGE-1,+1.5 ROUGE-2和+2.2ROUGE-L。而具有多任务学习框架的关键信息指南网络(如图2所示)获得了最佳分数。并且,如果给出了关键词和关键句子,则结果会更好,这也证明使用关键信息指导文本摘要生成是合理的。


为了证明本文的方法获得关键信息的能力,图4显示了特定文本的处理结果。原始文本列在图4的上半部分,并对关键信息加粗处理。接下来是给出的原本摘要和两个模型的输出。原始文字是关于在Android手机上的Google手写输入和一些功能介绍,关键信息是“goole claims”,“read anyones handwriting”,“android handsets can under 82 languages in 20 distinct scripts”和“works with both printed and cursive writing input with or without a stylus”可以观察到,具有指针机制的基线模型的输出仅涉及“google have cracked the problem of reading handwriting”,然而本文的模型总结了几乎所有关键信息。




