基于数据挖掘算法的弧圈球技术研究

2018-05-14 14:44罗红
阜阳职业技术学院学报 2018年3期
关键词:关联规则乒乓球数据挖掘

罗红

摘 要:弧圈球在乒乓球技术中是比较关键的技术之一,正确使用弧圈球技术能够让运动员在比赛过程中获得最佳战绩,能够充分地发挥出弧圈球的威力。在分析弧圈球技术层面以及战术方面特点的基础上,综合数据挖掘技术基本理论分析了关联规则的数学模型和算法流程;最后对某省乒乓球运动员的弧圈球技术使用情况进行了数据挖掘,剖析了使用不同弧圈球技术后的得分和失分情况,从而为教练员在训练和比赛中提出决策提供了理论依据。

关键词:弧圈球;乒乓球;数据挖掘;关联规则

中图分类号:G846 文献标识码:A 文章编号:1672-4437(2018)03-0051-04

乒乓球项目是我国的优势运动项目,弧圈球技术是乒乓球关键技术之一,弧圈球属于一种进攻型乒乓球技术,高水平的弧圈球技术能够有效地应对削球和攻球,不仅能够主动进攻,而且能够进行相持。从类型方面,弧圈球技术包括快弧型弧圈球技术和弧快型弧圈球技术。弧圈球技术的准确使用是决定乒乓球比赛胜负的主要因素,因此,可以采取数据挖掘技术对乒乓球比赛和训练过程中弧圈球技术使用的大量信息进行深入剖析,从而发现有价值的信息,为乒乓球比赛和训练决策提供依据,进而提高乒乓球运动员的技术水平,获得最佳的训练效果和比赛成绩[1]。

1 弧圈球的战术特点

弧圈球技术可以形成最佳的弧线,在拉弧圈球的过程中将形成摩擦力,可以让乒乓球以旋弧线飞行,乒乓球上旋过程中受到空气阻力,所以产生较大的压力。当下沿气流和阻力一致时,压力降低,速度增大,同时在重力的共同作用下,形成了压力差。弧圈球能够使打出的距离减小。利用弧圈球能够应对多种来球,弧圈球能够有效地应对强力下旋球,可以增加弧线的旋转强度,进而提高正确击球的概率,在乒乓球比赛中能够取得良好的效果。弧圈球具有较大的攻击力,弧圈球拉得越快,越能够和攻球产生同样的攻击力。针对攻球、旋球和推挡球,许多弧圈球运动员都采取发力拉上旋技术,如果落点适宜,能够产生较大的进攻力量,一旦没有完全掌握弧圈球的技术要领,容易出界,因此,可以采取抢冲、拉冲、连续冲等技术为主要的进攻方式[2]。

在战术方面,一些欧洲的优秀乒乓球运动员站位通常离台远,主要采用大力拉冲的方式。我国的乒乓球运动员在使用弧圈球时,一般离台很近,击球点较高,幅度不大,主要通过前臂和手腕的力量,同时利用手指进行调节。我国乒乓球运动员在使用弧圈球技术时巧妙地融合了快攻技术,在技术方面,弧圈球体现了转和快的特征。在乒乓球比赛阶段,应该选择发球长、短结合的战术,实现抢先上手、力争主动,这样不仅能够抢冲下旋球,而且能够反拉对方的弧圈球。发球时选择近网球,让对方不得已必须轻挑,接着进行两面快撕,并且与长球配合。在第四、五板的争抢中,应该采用反拉弧圈球的意识,从而提高前三板的有效性[3]。

2 数据挖掘的基本理论

数据挖掘技术发展很快,是数据库研究的一种新方法,该方法融合了数据库理论、机器学习、统计理论和人工智能等先进的技术。利用数据挖掘技术能够从大量的、随机的数据中发现具有潜在价值的信息和知识,能够发掘出数据之间的规律。数据挖掘的对象主要是数据库中的网络数据,这些网络数据必须是真实有效的,数据挖掘出的知识应该可理解和可接受的。数据挖掘能够从数据库中识别有潜在价值的信息,主要从数据库中提出未知的和有价值的信息。数据挖掘属于一种决策技术,利用智能技术、机器学习理论以及统计理论对提出的数据进行智能分析和归纳总结,从而能够为决策者提供有利的数据支持。

数据挖掘的目的就是能够发掘出数据中的模式,主要包括描述型模式和预测型模式,前者是描述已有数据中潜在的事实,能够描述数据的规律;后者能够依据已有数据对未来的数据值进行预测。数据的模式主要包括分类模式、聚类模式、关联模式、序列模式、回归模式和偏差模式。可选择的理论包括云理论、数据论证理论、人工神经网络等。数据挖掘已经得到了普遍关注,其发展趋势包括提出数据挖掘语言,使其形成标准化;提出可视化的数据挖掘技术,从而能够使知识发现实现人机交互;提出网络化的数据挖掘,使数据挖掘在服务器配合的过程实现。

针对乒乓球弧圈球技术的数据特点,选择关联规则技术进行数据挖掘。关联规则属于一种通用的数据挖掘技术,模型如下所示:

项目集定义为 ,项目中的一个元素定义为 ,事务集合定义为 ,事务中的一个元素定義为 ,不同事务属于项目的子集。设 为一些项目构成的集合,当 包含 时,则 支持 , 对 的支持度support( ) ,表示 在 中出现的频率。如果support( ) min_sup,min_sup表示最小支持度, 表示频繁集项集。寻求全部频繁项集 为数据挖掘的关键。当 包含 时,将 => 称为规则,其中, 和 均处于 ,同时 ,=>表示关联。信任度在 中 出现的频率,计算表达式如下所示[4]:

(1)

基于关联规则的数据挖掘算法流程如下:

步骤1:找出支持度超过给定最小支持度欲知的频繁项集。

步骤2:基于步骤1发现的频繁集形成关联规则。

对于不同的频繁项集 ,寻找出 中全部非空子集 , ,当 不小于最小信任度时,形成关联规则 。

利用FP-Growth算法形成频繁集,该算法具有无需形成大量的候选集合,能够获得较高的时空效率。FP-tree的定义如下:

(1)FP-tree包含一个根节点,定义为“null”,FP-tree属于一个项前缀子树集,还有一个频繁项目构成的头表。

(2)不同项前缀子树的节点包括三个域,分别为item_name、node_link、count, item_name为节点项名,node_link表示下一个具有相同项名的节点,当没有达到这个节点时,为null。

(3)频繁项头表的每个表项包括两个域,分别为item_name和node_link。

算法1:输入为DB和最小支持度阈值。输出为FP-Tree。

算法流程如下:

步驟1:对数据库进行全面扫描一次,获得频繁项集合F和相应的支持度,对频繁项集依据支持度降序排列,排列后的结果定义为L。

步骤2:构造FP-Tree的根节点,定义为T,记为“null”,对数据库的不同交易Trans进行如下的操作:

依据L的排序,提取出排序Trans中的频繁项,定义提取的频繁项为 ,执行程序 ,当T中存在一个子节点N,将N的Count域值加1,反之,构造一个新节点N,Q其count取为1,定义其父节点为T,将其node_link和与其有相同项目名的域串联。当P非空时,调用Insert_tree(P,N),算法结束。

算法2:输入为算法1创建的FP-Tree;输出为全部的频繁项集;

算法流程如下:

如果FP-Tree仅有一条路径P,然后,针对P中的每个组合定义为 进行如下操作:

步骤1:构造频繁集 ,同时将其支持度确定为 中节点的最小支持度,否则,针对FP-Tree从表尾到表头的不同表项(定义为 )进行如下的操作。

步骤2:构造频繁集 ,支持度选取 的支持度。

步骤3:构建频繁集 条件模式库和条件树。

步骤4:如果步骤3构建的条件树为空,则,调用FP-Tree(Tree1, )。

乒乓球技战术组合在第拍的支持度定义为[5]:

3 实例研究

为了验证数据挖掘算法在弧圈球技术分析中的有效性,以某省参加国家级乒乓球比赛的弧圈球技术使用情况的数据库为研究对象,数据的录入是人为进行的,为了避免分析数据中的错误,对全部数据进行清洗,将数据库中不完备的数据删除。在进行弧圈球技术分析时,主要感兴趣的是发球、接发球以及得分动作。部分数据脚本见表1。

最后,将上面获得的FP-Tree与其表头输入至算法2,依据表尾至表头的顺利对不同的表项进行考察。算法2的部分执行过程见表2。

以某次国家级乒乓球比赛为例,利用关联分析对比赛过程中弧圈球技术应用进行数据挖掘。

(1)以主球员(赵某)加转弧圈球得分动作为数据挖掘目标,相应的规则数见表3。

当最小支持度阈值为0.25,最小信任度阈值为0.45时,可以获得两条关联规则,分别为:

规则1:当主球队员(赵某)发下旋球,对手反弧圈球,最后主球队员(赵某)反手加转弧圈球进攻,主球运动员(赵某)得分。规则1的支持度为15%,信任度为100%。

规则2:主球队员(赵某)发侧下旋球,对手反手挑打,主球队员(赵某)侧身加转弧圈球,主球运动远得分。规则2的支持度为5.5%,支持度为86%。

(2)以主球员(赵某)前冲弧圈球得分动作为数据挖掘目标,相应的规则数见表4。

当最支持度的阈值为0.15,最小信任度的阈值为0.15时可以获得三条规则:

规则1:主球队员(赵某)侧身弧圈球,对手中路正手削球,然后主球队员(赵某)中路正手前冲弧圈球,主球队员(赵某)失分。规则1的支持度为15%,信任度为55%。

规则2:主球队员(赵某)反手削球,对手反手削球,主球队员(赵某)侧身前冲弧圈球,主要队员(赵某)失分。规则2的支持度为24%,信任度为75%。

规则3:主球队员(赵某)正手弧圈球,对手中路反手弧圈球,主球队员(赵某)反手前冲弧圈球,主要队员(赵某)失分。规则3的支持度为30%,信任度为95%。

4 结论

利用数据挖掘技术中的关联规则算法对乒乓球弧圈球技术进行了深入分析,通过对弧圈球特点的深入探究,对乒乓球竞赛中弧圈球技术使用进行了剖析,并且通过数据采集构成了数据库,利用关联规则算法发现了比赛过程中主球队员应用弧圈球技术得分和失分的规则,从而使球员了解应用弧圈球技术的得分或者失分情况,为教练员在进行乒乓球训练及比赛中利用弧圈球战术提供有利的理论依据,以真正发挥弧圈球的威力,提高乒乓球训练的效果和乒乓球运动的技术水平。

参考文献:

[1] 荣银超. 试谈乒乓球正手快攻、弧圈球教学中“重心交换”说法 [J]. 四川体育科学, 2018(1):48-51.

猜你喜欢
关联规则乒乓球数据挖掘
乒乓球与大铁球
数据挖掘综述
软件工程领域中的异常数据挖掘算法
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
基于R的医学大数据挖掘系统研究
迷你乒乓球
一本面向中高级读者的数据挖掘好书