基于模糊聚类的养生旅游资源信息检索方法

2020-04-17 07:42姚启芳
关键词:信息检索特征提取检索

姚启芳

(合肥职业技术学院,安徽 合肥 238000)

0 引言

近年来,人们对养生旅游的热衷程度不断提升,在进行养生旅游资源开发过程中,需要结合养生旅游资源信息的大数据特征分布进行异构重组,建立养生旅游资源的大数据信息分析模型,采用信息融合和资源优化调度的方法进行养生旅游资源的优化调度和特征提取,建立养生旅游资源的优化检索模型,提高养生旅游资源开发和调度能力[1]。

当前,对养生旅游资源信息检索方法主要有KMeans 法、网格区域检索方法、粒子群检索方法等,建立养生旅游资源信息的特征提取和大数据分析模型,采用相关的特征分布式检测方法,实现养生旅游资源信息检索[2]。传统方法进行资源检索存在计算开销较大和实时性不好的问题,对此,本文提出基于模糊聚类的养生旅游资源信息检索方法。采用异构有向图分析方法进行养生旅游资源信息存储结构设计,对提取的养生旅游资源信息特征量进行模糊聚类处理,采用模糊C 均值聚类方法进行养生旅游资源信息的网格分区聚类和属性分类识别,实现资源信息检索优化,最后进行仿真实验分析。

1 养生旅游资源信息模型构建与特征分析

1.1 养生旅游资源信息检索的节点模型

为了实现基于模糊聚类的养生旅游资源信息检索,需要首先采用异构有向图分析方法进行养生旅游资源信息存储结构设计,构建资源检索的节点分布模型[3],在大数据背景下进行养生旅游资源信息在线检索优化设计。假设养生旅游资源信息检索节点图模型属性集为X={x1,x2,…,xn} ,进行养生旅游资源信息检索节点图模型设计,得到检索节点的分布如图1所示。

图1 养生旅游资源信息检索节点分布

采用语义本体模型构造的方法,在领域知识(Domain knowledge)本体之间进行养生旅游资源信息检索的相关性提取和模糊决策[4],通过自相关特征匹配方法,分析两组相似的养生旅游资源信息的相对贴近度φ1,定义为:

1.2 养生旅游资源信息特征分析

采用有向图模型构建养生旅游资源信息的检索节点分布结构模型,在养生旅游资源信息库中进行资源信息特征提取,设是养生旅游资源信息的二元语义特征分量,采用异构有向图分析方法进行养生旅游资源信息存储结构设计,结合特征空间重组技术进行养生旅游资源信息结构重组[6],提取养生旅游资源信息的关联信息特征量,得到资源信息检索的优化加权系数为采用统计分析方法进行养生旅游资源的量化评估,得到养生旅游资源的关联性本体结构模型为:

对资源数据进行模糊处理,构建养生旅游资源的自适应调度参数∇2F(x),建立养生旅游资源信息检索的模糊决策矩阵:

将养生旅游资源信息检索的特征提取问题转化为一个二元语义决策问题,养生旅游资源信息检索的模糊特征匹配评价指标集为采用主体词匹配的方法,分析X的相似度函数,得到资源特征的模糊隶属度函数为:

重构养生旅游资源信息的递归图模型,采用相空间重构的方法,实现养生旅游资源检索的模糊特征信息采样,得到权重向量vi,养生旅游资源信息的相关特征分布矩阵表示为:

其中,c为养生旅游资源信息检索的搜索步数,μik为语义关联度决策系数。根据上述分析,进行养生旅游资源信息的特征分析和优化调度[7],得到聚类中心为di,计算描述养生旅游资源关联特征向量vi,vi= ((w1,t1),(w2,t2),…(wj,tj)),结合模糊相关性融合的方法,得到资源在线检索准则为:

2 养生旅游资源信息检索方法优化

2.1 特征提取和模糊C均值聚类

本文采用异构有向图分析方法进行养生旅游资源信息存储结构设计,在结合特征空间重组技术进行养生旅游资源信息结构重组的基础上,进行养生旅游资源信息检索算法的优化设计,提出基于模糊聚类的养生旅游资源信息检索算法,描述养生旅游资源定量评价的约束参量记为:

采用相关性的统计分析方法,得到养生旅游资源共享度为:

根据共享度水平,进行养生旅游资源定量评价集构造[8],得到养生旅游资源定量评价的空间规划模型描述为:

用Ui,j(t)表示养生旅游资源定量评价的模糊度函数,特征提取和模糊C均值聚类函数为:

分析养生旅游资源模糊C均值聚类的最优解表示为:

根据最优模糊聚类分析,避免陷入局部最优,提高旅游资源的优化检索能力[9]。

2.2 资源信息检索输出

采用有向图模型构建养生旅游资源的信息检索模型[10],构造养生旅游资源信息检索的约束规划模型为:

由此得到养生旅游资源信息检索的最优评价集记为L1,…,Ln和P1min,…,Pnmin,养生旅游资源的优化聚类模型为:

其中,cosinij→x(dij,dxv)为养生旅游资源的融合聚类特征集,根据上述分析,实现旅游资源的优化检索。

3 仿真实验与结果分析

为了验证该方法在实现旅游资源信息检索中的应用性能,进行实验测试分析。采用C++和Mat⁃lab 7 混合编程进行养生旅游资源信息检索的算法处理,在Hadoop 云平台中构建养生旅游资源信息数据库结构模型,养生旅游资源大数据分布的初始样本规模为2000,量化分布测试集为80,自适应学习的迭代步数NP=30,各组资源的相似度为0.87,根据上述仿真参数设定,进行养生旅游资源信息检索,得到各个旅游景点的描述性统计分布如图2所示。

提取养生旅游资源信息的关联信息特征量,采用语义相关性融合的方法进行养生旅游资源信息特征提取和自适应调度,得到养生旅游资源信息的时域分布如图3所示。

以图3的数据为依据,进行资源检索,测试查准率和查全率,得到测试结果如图4 所示,分析图4 得知,采用本文方法进行养生旅游资源信息检索的查全率和查准率较高。

4 结语

图2 各个旅游景点的描述性统计分布

图3 养生旅游资源信息的时域分布

图4 性能对比

为建立养生旅游资源的大数据信息分析模型,采用信息融合和资源优化调度的方法进行养生旅游资源的优化调度和特征提取,本文提出基于模糊聚类的养生旅游资源信息检索方法。采用有向图模型构建养生旅游资源信息的检索节点分布结构模型,采用相关性的统计分析方法,得到养生旅游资源共享度水平,提取养生旅游资源信息的关联信息特征量,实现养生旅游资源信息的优化检索。仿真分析得知,采用本文方法进行养生旅游资源信息检索的查准率和查全率较高,提高了养生旅游资源信息共享和检索调度能力。

猜你喜欢
信息检索特征提取检索
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
医学期刊编辑中文献信息检索的应用
在网络环境下高职院校开设信息检索课的必要性研究
专利检索中“语义”的表现
基于神经网络的个性化信息检索模型研究
基于MED和循环域解调的多故障特征提取
公共图书馆信息检索服务的实践探索——以上海浦东图书馆为例
国际标准检索