一种利用对抗样本提高抽取式阅读理解模型效果的方法

2024-06-01 13:16何东于晓昕叶子铭于中华陈黎
关键词:阅读理解

何东 于晓昕 叶子铭 于中华 陈黎

摘 要: 抽取式閱读理解是自然语言处理的重要任务,需要机器在阅读理解自然语言文本的基础上,从中抽取给定问题的答案(输入文本中的片段),并在问题不可回答时拒绝回答. 这种不可回答情况的存在使机器阅读理解更具有挑战性,特别是在输入文本含有似是而非文本片段时,现有模型很容易将这样的片段混淆为问题答案,进而错误判断问题的可回答性. 为了进一步提高抽取式机器阅读理解模型的效果,本文将SQuAD 2. 0 数据集中的似是而非答案看成对抗样本,将其既作为答案文本片段抽取的正例,也作为问题可回答性的负例,在现有模型答案交叉熵损失的基础上增加排序损失. 在SQuAD 2. 0 上进行的实验表明,本文方法可以提高现有模型的阅读理解能力,明显提升可回答性判断及答案文本片段抽取的效果.

关键词: 阅读理解; 不可回答问题; 对抗样本

中图分类号: TP391 文献标志码: A DOI: 10. 19907/j. 0490-6756. 2024. 022001

猜你喜欢
阅读理解
教师评讲英语试卷阅读理解题研究
浅谈初中语文阅读理解解题思路与技巧
浅析初中文言文中的古今异义现象
影响学前幼儿图书阅读理解的因素分析及指导策略
提高初中生英语阅读理解能力的方法
新高考改革下如何提高学生的阅读理解能力
微课在英语阅读教学中的导学探究
高中学生英语阅读理解能力提升的途径探析
如何提高高中学生英语阅读理解的做题能力
刍议英语阅读理解讲评课