基于Tri-Training的事件关系分类方法研究*

2015-04-18 08:11丁思远,洪宇,朱珊珊
计算机工程与科学 2015年12期



基于Tri-Training的事件关系分类方法研究*

通信地址:215000 江苏省苏州市苏州大学计算机科学与技术学院Address:School of Computer Science and Technology,Soochow University,Suzhou 215000,Jiangsu,P.R.China

丁思远,洪宇,朱珊珊,姚建民,朱巧明

(苏州大学江苏省计算机信息处理重点实验室,江苏 苏州 215006)

摘要:事件关系分类是一项研究事件之间存在何种逻辑关系的自然语言处理技术。针对事件关系分类任务中训练语料不足的问题,提出了基于Tri-Training的事件关系分类方法。该方法首先根据已标注的语料训练三个不同的分类器,以多数投票的方式从未标注集中抽取置信度较高的样本对训练集进行扩充,然后利用新的训练集重新训练分类器,反复迭代,不断完善分类模型,最终达到提升事件关系分类性能的目的。实验结果表明,以F1值为评价标准,基于Tri-Training的事件关系分类方法在四大类事件关系上的分类性能为64.36%。

关键词:事件关系;框架语义;半监督学习;Tri-Training

doi:10.3969/j.issn.1007-130X.2015.12.023

中图分类号:TP391

文献标志码:A

基金项目:国家自然科学基金资助项目(61003152,61272259,61272260)

收稿日期:修回日期:2015-11-03

文章编号:1007-130X(2015)12-2345-07