任华新
(辽宁对外经贸学院,辽宁 大连 116052)
随着文本信息处理技术的发展,在计算机和网络技术进行多目标的文本信息挖掘,提高对文本数据的检测和识别能力.文本数据包含的数据集规模较大,语义特征的关联性较高,对多目标文本数据的挖掘难度较大,需要对多目标文本数据进行有效的关联特征定位,结合语义关联性检测和数据挖掘方法,进行多目标文本数据的自动挖掘和特征提取,提高多目标文本数据的优化挖掘和数据分析能力,研究多目标文本数据的关联特征定位方法,在数据挖掘和特征检测中具有很好的应用价值,相关的多目标文本数据关联定位方法研究受到人们的极大关注[1].
通过对海量多目标文本数据关联特征定位和抽取,提高多目标文本数据的检测和智能语义分析能力.传统方法中,采用模糊语义特征提取算法进行多目标文本数据关联特征定位,结合模糊减法聚类的方法进行多目标文本数据库的语义信息关联特征定位算法,实现多目标文本数据索引和关联特征定位,提高多目标文本数据库的检测性能,但上述方法进行模糊度较大[2],计算开销较大,对此,本文提出基于RSSI改进算法下的多目标文本数据关联特征定位方法.构建多目标文本数据的关联结构分布模型,采用模糊关联规则匹配方法进行多目标文本数据的特征匹配和语义相关性检测,采用RSSI改进算法进行多目标文本数据关联特征寻优,采用相关性检测技术进行多目标文本数据的集成滤波,结合模糊聚类方法进行多目标文本数据特征分类处理,根据分类结果实现RSSI改进算法下多目标文本数据关联特征定位和挖掘.最后进行仿真实验分析,展示了本文方法在提高多目标文本数据关联特征定位能力方面的优越性能.
为了实现多目标文本数据关联特征定位挖掘,首先采用基于语义本体模型和关联特征检测方法进行多目标文本数据的模糊信息调度和自适应检测,提取多目标文本数据的语义规则性特征量[3],进行多目标文本数据的优化挖掘和自动检测设计,采用指向性特征检测方法,分析多目标文本数据的数据结果模型,在多目标文本数据的语义本体分布结构模型中,多目标文本数据的分布结点表现为
基于特征的分类识别和文本的关键内容检测方法[5],采用三元组形式构建多目标文本数据关联的语义本体模型为:
文本摘要关联特征定位的数据结构分布模型用一个二元组表示为:
其中:fij—多目标文本数据词汇i出现的频率;ni—多目标文本数据的特征检测次数.fik—多目标文本数据中词语i在文档分布概率,对k次出现的文本进行关联规则挖掘,以N为文档数目,得到多目标文本数据关联特征定位自适应加权函数表达式为:
其中:coff1表示IDF1编号,设定多目标文本数据语义固定系数;coffcosnt表示IDFconst的关联特征分布固定系数.结合多源特征分布式检测方法,进行多目标文本数据的关联规则挖掘和特征定位检测[6].
对挖掘的多目标文本数据信息资源进行语义特征空间重构,构建多目标文本数据的资源分布集,在模糊聚类空间中,采用关联特征检测方法,构建多目标文本的传输信息流,采用线性回归分析模型进行多目标文本数据的语义相关性检测[7],给定多目标文本数据定位的关联特征分布模型,相关性稀疏分别是a1,a2,…,ak,在多目标文本数据空间分布集中,以β为边界条件,得到多目标文本数据的信息资源融合模糊特征集Mβ:
在追求全局最优解过程中,通过语义相关性检测得到正常和异常子空间中多目标文本数据关联特征定位的模糊函数为:
计算多目标文本数据的模糊关联度特征,采用语义相关性检测,进行多目标文本数据的融合处理,采用梯度投影非负矩阵分解方法进行定位过程中的自适应寻优,得到优化的模型可表达为:
在上述构建多目标文本数据的关联结构分布模型并进行语义相关性检测的基础上,进行多目标文本数据关联特征定位的优化设计,提取多目标文本数据的语义模糊性定位信息,采用RSSI改进算法进行多目标文本数据关联特征寻优[9],多目标文本数据的关联主题信息分布的有限集合为:
结合不同指标熵的计算方法进行差异性特征挖掘,得到多目标文本数据定位的离散信息源分布为:
充分利用多目标文本数据的时间和空间相关性下,多目标文本数据信息的关联特征汇中汇聚了大量的相关性特征量,得到相关性特征映射描述为:
设多维熵矩阵满足β∈[0,T],表示多目标文本数据的分布相似度信息,将关联指标参量加载到信息处理模块,
利用抽象语义(AMR)图来预测多目标文本数据摘要子图的优先级属性,可以表示为P(ni)={pk|prkj= 1,k= 1,2,…,m}.利用深度语义检测方法,得到多目标文本数据关联特征定位的分组关系为:
采用RSSI改进算法进行多目标文本数据关联特征寻优,采用相关性检测技术进行多目标文本数据的集成滤波得到资源信息流为:
上式中,q表示语义摘要分布信息流集合,nq表示无关紧要的虚词语义负载,多目标文本数据的关联特征提取输出:根据图节点间语义结构特征进行分组样本检测和回归分析,结合模糊相似度融合方法,实现对多目标文本数据的关联特征提取.
结合模糊聚类方法进行多目标文本数据特征分类处理,根据分类结果实现RSSI改进算法下多目标文本数据关联特征定位和挖掘,当多目标文本数据分布聚类中心的相对语义摘要分布满足||C(l) -C(l- 1)||<ξ,得到多目标文本数据的聚类迭代式为:
设(sk,ak)和(sl,al)为多目标文本数据的模糊贴近度矢量,利用ILP的方法对重要语义节点进行特征重组,提取多目标文本数据信息的关联规则特征量[10],采用词性过滤的方法得到多目标文本数据信息资源属性分类评估约束因子为:
对每句话解析生成相应的样本集,在特征分布的相空间中,得到多目标文本数据语义图模型描述为:
其中,sc(t)表示多目标文本数据的各个AMR图的概念根节点,由此提取多目标文本数据信息的关联规则特征量,基于RSSI改进算法,实现多目标文本数据关联特征定位,定位输出保留节点之间对应的边属性系,得到了语义节点集合.改进算法的实现流程如图2所示.
为了测试本文方法在实现多目标文本数据关联特征定位中的应用性能,进行仿真实验,实验据分析软件为Excel 2007 和SPSS19.0,对多目标文本数据关联特征采集的样本数为2 000,训练样本集为20,其它仿真参数设定为:关联稀疏cr=2,语义相似度μ1=μ2=0.01,语义文本分布密度ρ1=ρ2=0.01,自相关特征量δ= 0.8,多目标文本数据的初始采样频率f1= 2.1Hz,根据上述仿真环境和参数设定,进行多目标文本数据关联特征采集和定位,得到原始的多目标文本数据的采集结果如图3所示.
以图3的数据为研究样本,进行多目标文本数据的关联特征定位,得到定位输出如图4所示.
分析图4得知,采用本文方法能有效实现多目标文本数据关联特征定位,特征定位的匹配能力较好,测试不同方法进行多目标文本数据关联特征定位的精度,得到对比结果如图5所示,仿真结果表明,本文方法进行多目标文本数据关联特征定位精度较高,特征匹配能力较强,提高了文本数据挖掘的准确性..
对多目标文本数据进行有效的关联特征定位,结合语义关联性检测和数据挖掘方法,进行多目标文本数据的自动挖掘和特征提取,提高多目标文本数据的优化挖掘和数据分析能力,本文提出基于RSSI改进算法下的多目标文本数据关联特征定位方法.采用RSSI改进算法进行多目标文本数据关联特征寻优,采用相关性检测技术进行多目标文本数据的集成滤波,结合模糊聚类方法进行多目标文本数据特征分类处理,根据分类结果实现RSSI改进算法下多目标文本数据关联特征定位和挖掘.研究得知,本文方法进行多目标文本数据关联特征定位的精度较高,数据挖掘性能较好,提高定位的特征匹配性.