一种高稳定性词汇共现模型

2009-07-31 04:55乔亚男
西安交通大学学报 2009年6期

乔亚男 齐 勇 侯 迪

摘要:针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型,借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围,在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型,实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性。

关键词:项场;词汇共现;窗口内稳定性;数据集稳定性

中图分类号:TP391文献标志码:A文章编号;0253-987X(2009)06-0024-04