任高举,白亚男(平顶山学院 计算机学院,河南 平顶山 467000)
多媒体智能教学系统中特定数据挖掘方法研究
任高举,白亚男
(平顶山学院 计算机学院,河南 平顶山467000)
对多媒体教学系统中特定关键数据进行准确挖掘,可以提高多媒体智能教学系统的信息兼容和数据访问能力。传统方法采用经验模态特征分解方法进行数据挖掘,当多媒体智能教学系统数据规模的扩大、信息融合度的提高时,数据挖掘的准确度下降。提出一种基于尺度仿射变换和特定数据信息流相空间重构的数据挖掘算法,首先建立多媒体智能教学系统的数据分布结构模型,采用尺度仿射变换对数据进行信息融合处理,对融合后的数据信息流进行相空间重构,在重构的高维相空间中提取多媒体智能教学系统中特定数据的高阶矩特征,实现对特征数据的准确挖掘。仿真结果表明,采用该方法进行数据挖掘的准确识别概率较高,抗干扰性能较强。
多媒体;教学系统;数据挖掘;相空间重构
数据挖掘包括数据特征提取和数据采集,是通过数据特征提取方法对用户所需信息进行检索识别,达到数据高效利用的目的。多媒体智能教学系统中大数据包含课程的分类信息、多媒体图像信息、教学内容信息等,对多媒体智能教学系统大数据中的特定数据和关键信息进行准确挖掘,可以提高教学系统的使用效率和数据调度访问能力,具有重要意义,受到相关专家学者的普遍重视。
传统算法对多媒体智能教学系统中特定数据的特征提取和挖掘主要采用基于时频分析的数据挖掘算法、基于经验模态分解的多媒体智能教学信息数据挖掘算法、基于谱特征提取的多媒体智能教学系统特定数据挖掘算法等[1-3],这些方法通过建立多媒体智能教学系统中特定数据的特征提取模型,在此基础上进行时频特征、经验模态特征和高阶谱等特征信息的提取和抗干扰分析。但传统算法进行数据挖掘时,将数据信息流看作一组严平稳的线性时间序列,忽视了数据信息流中的非线性特征,导致数据挖掘中受到的干扰较大,降低了挖掘的准确性[4-5]。因此,相关文献进行了算法的改进,其中,文献[6]提出一种基于多传感组网时频特征盲分离和高斯级联滤波的多媒体智能教学系统中特定数据挖掘和特征提取算法,通过提取多媒体智能教学系统中特定数据时频特征,通过子空间降维实现数据挖掘和数据库的优化访问,但该算法计算开销较大,收敛性差;文献[7]提出一种基于分数阶傅里叶变换和高阶累积量后置聚焦的多媒体智能教学系统中特定数据挖掘算法,采用双门限能量挖掘进行多媒体智能教学系统中特定数据的波束特征提取,提高数据挖掘的指向性,但该方法挖掘精度较差;文献[8]采用经验模态特征分解方法进行数据挖掘,但当多媒体智能教学系统数据规模的扩大、信息融合度的提高时,数据挖掘的准确度下降[9-10]。
针对上述问题,本文提出一种基于尺度仿射变换和特定数据信息流相空间重构的数据挖掘算法,并通过相关实验进行了性能测试。
1.1多媒体智能教学系统的数据分布结构模型建立
为了实现对多媒体智能教学系统中特定数据的挖掘,首先需要进行数据结构分析和数据融合预处理。本文研究对象为跨平台网络环境下的多媒体远程教学系统,以该系统用户在所有终端和位置的服务器的高速运算和数据管理结果为依据,对模型内的数据结构进行分析,假设代表模型中多媒体智能教学系统中数据感知层中任一节点,即v∈V,e代表多媒体教学系统的应用业务层的任一连边,e∈E,多媒体智能教学系统中特定数据源就是采用连边-节点的形式分布在系统的数据管理阵元中,其中数据传输的节点帧分为N×N单位线列阵,信道带宽为Ts=KbTf。假设VMj代表嵌入式多媒体智能教学系统数据库中信息流矢量长度,E{[X-E(X)][YE(Y)]}为模糊分类随机变量X与Y的协方差,记为Cov(X,Y),对多媒体智能教学系统中的数据存储模型属性权重进行自适应学习,在多层矢量自回归特征空间中构建数据库中的特定数据分布的矢量场X,在多媒体智能教学系统中,局部离群点会产生交叉型数据集,通过公式(1)建立特定数据挖掘中的局部离群点信息流模型:
其中,wu,v表示多媒体智能教学系统的网络簇内节点u 和v之间的权值,|S|指无向图 S中的数据特征交叉性结点数。本文利用上述离群点信息流模型,构建一组有交集的稠密子图,用来反映多媒体智能教学系统中的交叉型数据集特征,并提取多媒体智能教学系统中特定大数据信息流的时间序列{x(t0+iΔt)},i=0,1,L,N-1,假设A={a1,a2,…,an}代表多媒体智能教学系统特定数据特征矢量的模糊聚类中心,利用模糊聚类中心对特定数据的差异属性进行分类,建立跨平台网络应用支撑层下的多媒体智能教学系统中的数据分布结构的无向图模型G=(V,E),即多媒体智能教学系统的数据分布结构图模型,如图1所示。
1.2数据的信息融合处理
在上述数据结构分析的基础上,文中采用尺度仿射变换对数据进行信息融合处理,具体步骤如下:
采用连续小波变换对上述模型中分布的特定数据进行经验模态特征分解,得到一组表征多媒体智能教学系统中特定数据内部细节特征的时间尺度a和时间平移b的二维函数,利用公式(2)在二维投影面上对多媒体智能教学系统中特定数据进行概率特征分解:
图1 多媒体智能教学系统的数据分布结构图模型
假设,rk(v+1)为采集的多媒体智能教学系统中特定数据非线性时间序列,parity(qp(z))代表数据采样的母小波,当采集的多媒体智能教学系统中特定数据x(k)=s(k)+w(k)为准平稳随机信息流时,利用公式(3)获取特征数据在教学系统数据库分布的边缘子带层位信息:
利用公式(4)计算随机选择k个均匀分布在边缘子带层位的多媒体特定数据分布概率:
根据多媒体特定数据分布概率,对分布概率较大的数据进行尺度仿射变换,建立有限的信噪比下数据挖掘的信息融合模型:
其中,U(a,b)是多媒体智能教学系统中特定数据的时域部分的分数阶Fourier变换,因子保证了该分数阶Fourier变换的能量归一化,通过上述处理,实现了对多媒体智能教学系统中特定数据的信息融合。
在上述分析了多媒体智能教学系统的数据分布结构模型,采用尺度仿射变换对数据进行信息融合处理的基础上,进行数据挖掘算法改进设计,通过对多媒体教学系统中的特定关键数据进行准确的信息特征提取和挖掘,提高多媒体智能教学系统的信息兼容和数据访问能力。文中提出一种基于尺度仿射变换和特定数据信息流相空间重构的数据挖掘算法,实现步骤如下:
假设多媒体智能教学系统中的特定数据融合最优权系数β、惩罚因子C,利用公式(6)构建特定数据前馈增益调节均方差函数:
多媒体智能教学系统中的数据管理通多分布式数据库模型而实现,在分布式数据库集成了大量的云数据,需要利用前馈增益调节均方差函数对多媒体智能教学系统中分布式数据库中的云数据进行结构优化,提高数据信息挖掘的准确性和效率,并利用公式(7)的相空间重构方法进行特定数据流信息高频成分的衰减特性分解:
在完成高频成分的衰减特性分解后,利用多媒体智能教学系统中特定数据的多维相空间的指向性波束特征,利用公式(8)获取多媒体智能教学系统中特定数据幅频响应特征的非均匀采样输出:
其中,τ为特定数据信息流的相空间重构采样时延,ck为相空间重构的嵌入维数,φ为采样间隔的相位差,bk为空间指向性增益调节系数。在非均匀采样输出结果中,假设y(k)为多维参量混合估计后得到的多媒体智能教学系统中特定数据的近似统计平均,根据高斯随机线性分离特定数据的不变特性,在高维相空间中对特征数据进行特定数据不变特征挖掘,提高信号的频域聚焦能力,利用公式(9)获取多媒体智能教学系统中特定数据的时移不变特性和频移不变性特征:
其中,x(t)为原始数据的奇异值分解结果,t0为初始采样时间点,Wy(t,v)为观测向量,v0为特定数据的功率谱密度,v为教学系统中数据受到干扰的强度,通过上述分析,利用公式(10)在时间尺度上对特定数据的时移不变特性和频移不变性特征进行迭代求解:
奇异值进行分解后,可以利用公式(12)对重构的高维相空间中提取多媒体智能教学系统中特定数据的高阶矩特征:
其中,多媒体智能教学系统中特定数据的高阶矩特征可以很大程度的反映特定数据特征,通过对高阶矩特征的定位,即可实现实现多媒体智能教学系统中特定数据挖掘。
为了测试本文算法在实现多源多媒体智能教学系统中特定数据的特征提取和挖掘中的性能,进行仿真实验。仿真实验的硬件环境采用个人PC机,配置参数为:CPU 3.0G,12G内存,操作系统为Windows 7。采用Matlab 7数学仿真语言进行算法设计与实现,多媒体智能教学系统中特定数据样本测试集采集于某大型远程多媒体教学系统。多媒体智能教学系统的样本数据的采集过程中,测试样本集合的平均采样率为fs=10*f0Hz=10 kHz,多媒体智能教学系统中特定数据的训练样本长度为1 024,对多媒体智能教学系统数据库的访问次数为189 283次,自适应迭代步长参数u=0.000 2,教学系统中其他数据的干扰为n(k)=nr(k)+jni(k),全局迭代次数为500次,干扰数据信息的离散样本数为990,通过上述数据采集结果进行多媒体教学系统中的数据信息模型构建,得到多媒体智能教学系统中特定数据采样的带宽B=1 000 Hz,相空间重构的嵌入维数m为30,时延为12,根据上述仿真环境,得到多媒体智能教学系统中数据训练样本采集的频域图如图2所示。
图2 多媒体智能教学系统中数据训练样本采集的频域图
采用尺度仿射变换对数据进行信息融合处理,对融合后的数据信息流进行相空间重构,得到相空间重构后的数据分布时频图如图3所示。
图3 融合后的数据信息流相空间重构结果
通过上述仿真结果可见,数据融合后的数据信息流相空间频谱特征指向性明显,旁瓣抑制性能较高,通过相空间重构,提高了特定数据在高维空间中的频谱分解和抗干扰能力,在重构的高维相空间中提取多媒体智能教学系统中特定数据的高阶矩特征,实现数据挖掘。为了对比算法性能,采用本文方法和传统方法,以数据挖掘的准确度为测试指标,得到仿真对比结果如图4所示,从图可见,采用本文算法进行数据挖掘的准确识别率较传统方法高很多,展示了较好的性能。
图4 数据挖掘准确识别率
对多媒体智能教学系统大数据中的特定数据和关键信息进行准确挖掘,提高教学系统的使用效率和数据调度访问能力。文中提出一种基于尺度仿射变换和特定数据信息流相空间重构的数据挖掘算法,对融合后的数据信息流进行相空间重构,在重构的高维相空间中提取多媒体智能教学系统中特定数据的高阶矩特征,实现数据挖掘优化。仿真结果表明,采用该算法进行数据挖掘的准确性好,收敛度较高,展示了较好的应用价值。
第三,通过完善“互联网+”的建设,使基础信息数据具有整合性的特质,从而保证数据的方向型传输。进而使数据的收集、数据的运用、数据的储存能在校园数据库中进行整合、分析和处理。特别是需要根据“互联网+”的功能分层做出相应调研,使教学、管理和信息的传递功能不会因数据的混乱而造成整合发生偏差。
[1]张萌,张沪寅,叶刚.延迟时间和嵌入维数联合优化的网络流量预测[J].计算机工程与应用,2014,50(4):103-109.
[2]徐晓斌,张光卫,孙其博,等.一种误差可控传输均衡的WSN数据融合算法[J].电子学报,2014,42(6):1205-1209.
[3]吴鸿华,穆勇,屈忠锋,等.基于面板数据的接近性和相似性关联度模型[J].控制与决策,2016,31(3):555-558.
[4]刘经南,方媛,郭迟,等.位置大数据的分析处理研究进展[J].武汉大学学报·信息科学版,2014,39(4):379-385.
[5]王睿.一种基于回溯的Web上应用层DDOS检测防范机制[J].计算机科学,2013,40(11A):175-177.
[6]Wang J,Li M,Chen J,Pan Y:A Fast Hierarchical Clustering Algorithm for Functional Modules Discovery in Protein Interaction Networks[J].Computational Biology and Bioinformatics,IEEE/ACM Transactions on,2011,8(3):607-620.
[7]Nepusz T,Yu H and Paccanaro A:Detecting overlapping protein complexes in protein-protein interaction networks[J]. Nature Methods,2012,9(5):471-475.
[8]王锐,何聚厚.基于领域本体学习资源库自动构建模型研究[J].电子设计工程,2015(24):32-35.
[9]王卫民,叶秋菊,贺文丽,等.基于GIS的气象时空数据挖掘和融合技术[J].电子科技,2014(2):130-133.
[10]王慧敏,贺兴时,牛四强.数据挖掘在高校图书馆中的应用[J].西安工程大学学报,2014,28(2):241-245.
【相关参考文献链接】
郎振红.面向云计算改进的远程教学系统的研究[J].2014,22 (17):4-37.
李小宁.一种个性化网络辅助音乐教学系统设计[J].2015,23 (15):156-158.
赵明.智能体育教学系统的设计与实现[J].2015,23(11):45-47.
李军林.基于三维图像技术的高校体育多媒体教学平台设计[J]. 2015,23(15):172-173.
屈毅博.基于流媒体技术的远程英语教学系统设计[J]. 2015,23(15):159-161.
任锁平.基于数据挖掘的高职教学质量监控评价系统设计及应用[J].2015,23(16):25-27.
刘一鸥,李艳红.教学资源信息库的建设与实现[J].2015,23 (17):32-35.
王洪敏.网络教学集成平台的功能框架与功能分析[J]. 2014,22(12):23-25.
闫朝升,李丹.基于OLAP的教学质量分析系统设计与实现[J]. 2015,23(14):12-14.
翁省辉,吴方.定时关机程序在C语言教学中的应用[J].2015,23 (15):16-18.
杨岚.基于云计算技术的艺术设计专业辅助教学系统设计与实现[J].2015,23(17):135-136.
Research on specific data mining methods in multimedia intelligent tutoring system
REN Gao-ju,BAI Ya-nan
(Computer College,Pingdingshan University,Pingdingshan 467000,China)
The multimedia teaching system in particular key data are accurate,could improve the compatibility and multimedia intelligent teaching system of information data access capabilities.The traditional method using empirical mode decomposition method for data mining,when the scale enlargement of multimedia data intelligent teaching system,the improvement of information alignment,the accuracy of data mining.In this paper,a criterion based on affine transformation and specific data stream data mining algorithm of phase space reconstruction,multimedia intelligent teaching system established by the structure model of the distribution of data of the data by dimensional affine transform information fusion processing,phase space reconstruction was carried out on the merged data traffic,in higher dimensional phase space reconstruction to extract the smart multimedia teaching systems of higher order moments of the specific data in feature,realize the characteristic data of accurate mining.The simulation results show that by using this method to the accuracy of the data mining to identify probability is higher,anti-interference performance is stronger.
multimedia;teaching system;data mining;phase space reconstruction
TP391
A
1674-6236(2016)11-0004-04
2016-03-18稿件编号:201603240
国家“863”计划基金资助项目(20167AA01Z146);2014年度河南省科技计划项目(142102210226)
任高举(1979—),男,河南叶县人,硕士研究生,助教。研究方向:数据挖掘、人工智能。