廖志锦
摘 要: 针对传统的分类方法在对运动数据的最优关联数据进行分类时,存在分类误差大、效率低的问题,提出基于决策树寻优的运动数据中的最优关联数据的分类算法。采用有向图模型构建运动数据的最优关联数据分布式结构模型,对采集的运动数据进行非线性时间序列特征重构,在重构的运动数据高维特征空间中进行运动数据的关联性映射,提取反映运动数据类别的属性特征,通过决策树寻优方法实现运动数据的自适应分类。仿真结果表明,采用该方法进行运动数据中的最优关联数据分类,其准确性较好、误分率较低,从而有效挖掘运动数据的关联信息,实现运动特征监测。
关键词: 运动数据; 关联数据; 分类算法; 数据挖掘; 特征提取
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)24?0053?03
Abstract: In allusion to the problem that big error and low efficiency exist in the traditional classification method of optimal association data classification for motion data, the optimal association data classification algorithm based on decision tree optimization is proposed for motion data. The directed graph model is adopted to construct the optimal association data distributed structure model for motion data. The nonlinear time series feature is reconstructed for the collected motion data. Association mapping of motion data is performed in the reconstructed high?dimensional feature space of motion data to extract the attribute features reflecting motion data categories. The decision tree optimization method is adopted to realize adaptive motion data classification. The simulation results show that the method has good accuracy and low error in optimal association data classification for motion data, and can perform effective association information mining for motion data to realize motion feature monitoring.
Keywords: motion data; association data; classification algorithm; data mining; feature extraction
随着大数据信息处理技术的发展,采用大数据信息处理方法进行体育运动数据的信息处理和加工,分析运动数据中的关联性属性特征,提取运动数据中能反映人体运动信息的关键特征参量,实现人体运动的状态特征监测和模式识别,指导体育运动实践。对运动数据的最优关联分类是实现运动数据的关键特征挖掘和信息提取的关键,实现运动数据的在线实时监测和管理,从而掌握运动员的运动水平。数据分类又是数据聚类,其原理是挖掘反应数据属性类别的信息特征量,根据提取的特征量为信息导引值,实现大数据分类识别。传统方法对运动数据的关联数据分类方法主要采用模糊C均值聚类、K均值聚类、近邻点网格分类等[1?2],上述方法在对大规模运动数据分类中存在计算开销过大,分类的准确性不好等问题。对此,本文提出基于决策树寻优的运动数据中的最优关联数据的分类算法,并进行了数据分类的仿真实验,得出有效性结论。
1 运动数据的分布式结构分析与特征重组
1.1 运动数据非线性时间序列特征
為了实现运动数据中的最优关联数据的分类,采用网格式分布结构模型进行运动数据的网格分割,建立运动数据的最优关联的图结构模型。基于决策树寻优方法进行运动数据的关联属性特征提取和自适应分类,决策树模型采用C4.5的Domain knowledge决策树模型[3],决策树的根节点为运动数据分类的初始网格分割节点,通过对两组相似的运动数据的属性判断和相关性特征重组,采用检索节点图模型分组方法进行运动数据分类。根据上述设计原理,得到运动数据的分类的决策树模型如图1所示。
在大数据背景下进行运动数据最优关联分类设计,人体运动数据图模型结构用二元有向图表示,运动数据随边分布特征记为:
假设运动数据在决策树中的分类节点的边集为A,网格分割的时间窗口函数为,通过对运动数据进行多重小波分解[4],采用时频分析方法,得运动数据关联维分割代价函数表述为:
式中,是运动数据最优关联子集的自回归特征向量。在有向图决策树模型中进行人体运动数据的最近邻点采样,根据上述设计,对采集运动数据进行非线性时间序列特征重构。
1.2 运动数据关联性映射
在重构的运动数据高维特征空间中进行运动数据关联性映射,提取反映运动数据类别属性特征,运动数据高维特征空间状态函数记为:endprint
数据分类自适应权重,二元耦合向量为Y,运动数据行为匹配评价指标集,在高维特征空间中,存在一个数据对象y,在有限论域内[5],运动数据分类向量决策树分叉距离为,用二元回归分析法构建运动数据分类关联性映射为:
在关联规则映射体系中,构建运动数据属性识别的本体模型,通过本体结构的模板匹配,进行运动数据的关联数据分类识别。
2 运动数据分类算法实现
在进行运动数据的数据结构分析和分布式结构模型的基础上,进行运动数据的最优关联数据分类设计。本文提出一种基于决策树寻优的运动数据中的最优关联数据的分类算法。首先提取反映运动数据类别的属性特征,根据运动数据的暂态性扰动关联性分布特性,构建反映运动数据主特征量的决策树分叉图[6],得到运动数据分类的属性特征提取结果为:
以上述属性特征提取结果为输入,假设分类的维数为,那么,运动数据在决策树中分类的叶节点元素为,校验元素中含有个根节点,通过自组织神经网络映射[7],得到关联数据分类的加权权重满足。设运动数据的信息归类误差为,则在不同的网格区域内构建运动数据分类的协方差矩阵为:
式中,为点的相似度矩阵,通过求取运动数据最优关联数据主特征量,计算运动数据分类的聚类中心:
计算相邻聚类属性特征点的联合概率密度特征,令为运动数据分类的四元组,即,大数据分类属性。根据自相关函数匹配技术,提取反映运动数据类别的属性特征量,记为:
式中,为聚类中心小扰幅值。如果,则第k类分类的扰动振荡系数趋于零,如果,则数据分类聚类中心存在扰动[8]。采用关联函数匹配方法进行扰动抑制[9],假设大数据特征空间给定点集为,得到数据分类输出信息时间序列为:
式中,在维关联维特征映射空间中,采集一维数据矢量,用本文决策树分类方法,将关联数据划分成n个簇,根据运动数据的关联性映射结果,对运动数据分类。
3 仿真实验
对运动数据中的最优关联数据的分类的仿真实验建立在Microsoft Visual C++ 7.0,Vega Prime 2.2.1仿真环境中,采用Matlab编程工具进行数据分类算法设计。运动数据采集来自于某高校对大一本科生统计的田径体育运动数据,统计时间为2017年1月—4月,运动数据特征采样的相对时间延迟为0.12 s,最优关联数据调度路径的条数为10,幅度参数为(0,1.0,3.0,4.0,5.0),运动数据的相似度关联系数为m=12,数据特征重构的最大迭代步数归一化初始采样频率Hz,决策树的Sink节点为55随机矩阵。根据上述仿真环境和参量设定,进行运动数据中的关联数据分类仿真,得到运动数据采样的样本测试集如图2所示。
以图2采集的运动数据为对象,进行运动数据的最优关联数据分类,采用不同方法进行对比,测试数据分类的误分率(见图3),得出本文方法进行运动数据的关联数据分类误分率较低,收敛性较好,性能更优。
4 结 语
本文研究了运动数据的优化分类问题,提出基于决策树寻优的运动数据中的最优关联数据的分类算法,并进行实验分析,研究可知,本文方法能有效实现运动数据的最优关联数据分类。
参考文献
[1] 刘健,常莲.基于Bohzmann机的物联网数据分类方法研究[J].激光杂志,2016,37(10):116?120.
[2] 尚朝轩,王品,韩壮志,等.基于类决策树分类的特征层融合识别算法[J].控制与决策,2016,31(6):1009?1014.
[3] IHSAN A K, MEHDI G D. Improved accuracy for decision tree algorithm based on unsupervised discretization [J]. International journal of computer science and mobile computing, 2014, 3(6): 176?183.
[4] 王卫红,严鲁琴,金丹丹,等.基于GEPSO模型的面向对象遥感图像分类[J].计算机科学,2015,42(5):51?53.
[5] 匡桂娟,曾国荪,熊焕亮.关注用户服务评价反馈的云资源再分配方法[J].计算机应用,2015,35(7):1837?1842.
[6] 张红蕊,张永,于静雯.云计算环境下基于朴素贝叶斯的数据分类[J].计算机应用与软件,2015,32(3):27?30.
[7] 熊忠阳,刘芹,张玉芳.结合项目分类和云模型的协同过滤推荐算法[J].计算机应用研究,2012,29(10):3660?3664.
[8] 杨棽,齐越,沈旭昆,等.一种快速的三维扫描数据自动配准方法[J].软件学报,2010,21(6):1438?1450.
[9] 李保利.基于类别层次结构的多层文本分类样本扩展策略[J].北京大学学报(自然科学版),2015,51(2):357?366.endprint