王倩
摘 要: 针对在云计算环境下海量音乐资源挖掘的定位检索准确性不高的问题,对云计算环境下海量音乐资源的定位挖掘方法进行改进设计,提出基于自适应级联检索控制的海量音乐资源的高精度定位挖掘方法。首先对海量音乐资源库的数据信息按关键词和音乐类型进行语义特征分割和时间序列状态空间重构,然后进行云计算环境下海量音乐资源的自相关特征提取,以提取的自相关特征为信息素导引进行高精度定位挖掘,采用自适应级联检索控制模型进行挖掘精度控制。最后进行仿真分析,结果表明,该方法能提高音乐资源的定位挖掘精度,提高资源利用率和检索的数据查准率。
关键词: 云计算环境; 海量音乐资源; 定位挖掘; 检索控制
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)12?0019?03
Abstract: As the location retrieval accuracy of mining massive music resources in the cloud big data environment is not high, positioning mining method of massive music resources in cloud computing environment is improved, and a high?precision positioning mining method of massive music resources based on adaptive cascade retrieval control is proposed. The semantic feature segmentation and time series state space reconstruction of data information in massive music resource database are conducted according to the key words and music types, and then the self?correlation feature extraction of massive music resources in cloud computing environment is carried out. The extracted self?correlation features are taken as the pheromone guide to make high?precision positioning mining. The adaptive cascade retrieval control model is used to control the mining accuracy. The simulation analysis results show that this method can improve the positioning mining accuracy of music resources, resource utilization and data precision ratio.
Keywords: cloud computing environment; massive music resources; location mining; retrieval control
隨着大数据信息技术和云计算技术的发展,大量的音乐资源通过Deep Web数据库的形式存储于网络空间中,提供给网络用户进行有偿或者免费的下载[1]。对海量音乐资源的高效优化管理能提高音乐欣赏用户的体验,提高对音乐播放软件的认可度,海量音乐资源信息库是搜集、整理、收藏音乐资源并供人下载和播放的数据库,结合音乐播放软件实现音乐共享和传播。在云计算环境下,需要对海量音乐资源进行高精度定位,对云计算环境下海量音乐资源进行优化配置和访问控制,提高云计算环境下海量音乐资源的管理和检索效率;因此研究音乐资源在云计算环境下的高精度定位挖掘方法具有重要意义。
1 海量音乐资源信息预处理
1.1 音乐资源信息语义特征分割
为了实现对云计算环境下海量音乐资源的高精度定位挖掘,需要进行语义特征分割,降低资源定位挖掘的计算开销,采用自适应特征分割模型进行海量音乐资源库的存储音乐信息的数据特征重构和特征分割,去除冗余的信息特征[2?3]。音乐资源存储区域按音乐的歌词的关键词和音乐类型进行语义特征分割。音乐类型的存储本体特征通过自适应均衡分割方法被分为若干个(K个)数据子集,为云计算环境下海量音乐资源的语义特征并查集,满足:。根据音乐的播放环境和流行程度,进行资源分布区间的网格模型构建,使得音乐资源存储的状态分布结构满足,其中且。由此,采用决策树模型构建音乐资源信息检索和挖掘的特征访问控制模型。在进行音乐资源信息语义特征分割中需要首先创建一个空节点root作为根节点,在匹配节点的父节点处创建语义特征分割的分支结构模型[4],并通过规则数据集匹配的音乐资源的存储空间,进行节点匹配,搜索节点为root节点,以叶节点B:0.7为起始节点进行语义特征分割。在匹配节点的父节点处得到候选数据项为: ,以节点C:0.8中的BC为搜索节点,得到语义特征分割的自适应概率分布为0.7×0.8=0.56,由此构建压缩的UF?tree决策树模型,实现对云计算环境下的音乐资源信息存储空间的语义特征分割如下:
式中:表示待匹配本体的关系模型;为到当前数据项在TID集的概率分布。云计算环境下海量音乐资源库中的特征空间采样数据集,根据音乐资源信息语义特征分割结果,进行了分布式特征重构分析。
式中,为云计算环境下的音乐资源检索的统计频次参量。通过自适应级联检索控制,挖掘音乐资源的候选项集和产生频繁项集,提高对音乐的准确检索和定位挖掘能力。具体算法描述如下:
输入: 音乐资源搜索节点初始化参数,音乐资源定位挖掘的概率向量,候选集AllCandidate
输出:音乐资源挖掘的繁项集和规则集FrequentItems
(1) group?dependen=new MapReduce framework (Null);
(2) parallel closed frequent T in DBgid
(3) LocalFPtree.insert_tree(T,LocalFPtree.root,G?List);
(4) file management item in nowGroup
//闭频繁项集特征分解
{ Heap HP= Parallel FP?Growth ();
LocalFPtree.FPGrowth(mining large data.,item, HP);
//遍历每条事务数据
Support=0.0f;
Add(candidateItem,FrequentItems)
End}
3 实验测试分析
对海量音乐资源的定位挖掘仿真实验建立在Hadoop云计算平台上。仿真的硬件CPU为Intel? CoreTM i7?2600。采用Matlab仿真工具进行数学仿真,结合酷狗、QQ音乐软件进行音乐资源的嵌入式访问接口设计和兼容性数据库存储,音乐软件通过100 MB以太网相连在互联网中。对音乐资源进行语义特征分割的尺度为1.45,音樂资源的数据信息流采样样本长度为1 024,频带2~30 kHz、时宽3.6 ms,对DeepWeb数据库中的海量音乐资源进行信息采样和挖掘定位仿真。根据上述实验环境设定,进行音乐资源的定位挖掘,以挖掘精度为测试评价指标,进行10 000次挖掘实验,采用不同方法进行对比,得到挖掘精度对比结果如图2所示。图3为数据查准率对比。
据查准率对比
图3给出了以酷狗音乐软件为访问接口,采用本文设计的音乐资源定位挖掘方法和传统的挖掘方法进行音乐资源检索的查准率对比。分析上述仿真实验结果得知,采用本文方法进行云计算环境下海量音乐资源的定位挖掘的精度较高,信息检索的查准率高于传统方法,实现高精度的定位挖掘。
4 结 语
本文研究了在云计算环境下的音乐资源定位挖掘和优化检索问题,提出基于自适应级联检索控制的海量音乐资源的高精度定位挖掘方法。并进行了实验对比分析,从结果可知,采用本文方法对音乐资源进行挖掘时,器挖掘精度较高、检索性能较好。
参考文献
[1] 南洋,陈琳.基于客观权重确定的数据中心网络性能评估方法[J].计算机应用,2015,35(11):3055?3058.
[2] 汪中才,黎永碧.基于数据挖掘的入侵检测系统研究[J].科技通报,2012,28(8):150?152.
[3] KARLSSON J, ROWE W, XU L, et al. Fast missing?data IAA with application to notched spectrum SAR [J]. IEEE transactions on aerospace electronic systems, 2014, 50(2): 959?971.
[4] BARNICH O, VAN D M. ViBe: a universal background subtraction algorithm for video sequences [J]. IEEE transactions on image processing, 2011, 20(6): 1709?1724.
[5] MOGHADAM A A, KUMAR M, RADHA H. Common and Innovative visuals: a sparsity modeling framework for video [J]. IEEE transactions on image processing, 2014, 23(9): 4055?4069.
[6] 曹玖新,陈高君,吴江林,等.基于多维特征分析的社交网络意见领袖挖掘[J].电子学报,2016,44(4):898?905.
[7] 刘经南,方媛,郭迟,等.位置大数据的分析处理研究进展[J].武汉大学学报(信息科学版),2014,39(4):379?385.