因子分析和聚类分析在足球中的应用

2020-03-13 08:08殷倩陆媛
数学学习与研究 2020年4期
关键词:聚类分析因子分析足球

殷倩 陆媛

【摘要】本文根据12—13赛季英超联赛中20支球队的12项技术指标数据,运用因子分析法对英超联赛的成绩与技术指标的关系进行研究,找到影响比赛成绩的4个因子并且进行命名,然后通过聚类分析,把不同的球隊根据他们的相似程度分为几个类别,从而研究足球队各方面能力的特点和规律,为我国足球队和不同球队的比赛进行针对性的训练提供了更多科学依据.

【关键词】足球;因子分析;聚类分析

足球运动是一项历史悠久的体育运动,现代足球来自英国,也是现在世界上影响力最大的体育项目之一,因其丰富的内涵和感染力被视为一门艺术.

本文选取了2012—2013赛季的英超20支球队的12项比赛指标作为参考数据,对它们进行因子分析,提取反映球队攻防技术的主因子,并且计算综合得分对球队进行排名,然后再基于主因子进行聚类分析,将不同球队分类,最终得出了不同足球队各方面能力的差异.

一、研究对象及评价指标的选取

本文选取2012-2013赛季的英超20支球队作为研究对象,收集了比赛中的进球数、失球数、传球数、助攻数、射门数、被射门数、射正数、越位、解围、拦截、黄牌、犯规等12项指标,数据见表1.

二、因子分析

(一)因子分析方法

因子分析是将原始变量综合为少数几个与原始变量有相关关系的因子,这些综合出来的因子能够反映出原始变量中的绝大部分信息.一般来说,因子的个数会远远少于原始变量的个数.因子分析的基本步骤是:(1)对数据进行相关性检验;(2)提取出主要因子,也称为公因子;(3)对提取的公因子进行命名和解释;(4)计算因子得分并进行综合评价.

(二)因子分析过程

本文运用SPSS17.0软件进行因子分析,具体结果如下:

1.数据的相关性分析:Bartlett检验的P值接近0,说明12个变量之间有较强的相关关系.KMO统计量为0.660,接近0.7,说明适合进行因子分析.

2.变量共同度量都在70%以上,说明提取出的公因子对原始变量的解释能力较强.

3.本文采用Varimax法进行因子旋转,总共提取4个特征值大于1的公因子,这4个公因子的累计方差贡献率达到83.631%,说明因子分析的效果理想.

4.从旋转后的因子载荷矩阵可以看出,第一个因子与进球数、助攻数、传球数、射门数、射正数这几个变量的载荷系数关系较大,从实际意义上看,这几个变量主要反映了球队的射门能力,因此,可以把因子1命名为“射门能力因子”;而第二个因子与拦截这个变量的载荷系数关系较大,从实际意义看,这个变量主要反映了拦截影响,因此,可以将因子2命名为“拦截影响因子”;第三个因子与犯规、失球、解围、黄牌这几个变量的载荷系数关系较大,主要反映了阻止对手得分的能力,所以可以把因子3命名为“防守能力因子”;第四个因子与被射门数、越位这两个变量的载荷系数关系较大,可以将因子4命名为“越位影响因子”.

5.根据SPSS按回归法估计的因子得分系数矩阵,可以将4个公因子表示为12个变量的线性组合,从而计算出4个公因子得分,有了公因子得分,就可以对每个足球队分别按照前面命名的“射门能力因子”“拦截影响因子”“防守能力因子”和“越位影响因子”进行评价和排序.

6.最后对20支足球队的能力进行综合评价.具体方法是:计算每个足球队的总因子得分,然后按照总得分的多少进行排序,以反映各支球队水平的差异.每支球队的总因子得分计算方法是:用每支公因子的方差贡献率做权数,对每个公因子得分进行加权,然后加总得到每支球队的总因子得分.计算公式为:

根据表2中的排名,射门能力因子得分最高的球队是曼城,得分最低的球队是雷丁,这说明曼城的射门能力最强,雷丁的射门能力最弱;拦截影响因子得分最高的球队是阿森纳,得分最低的球队是斯托克城,这说明阿森纳的拦截能力最强,斯托克城的拦截能力最弱;防守能力因子得分最高的球队是托特纳姆热刺,得分最低的球队是西布朗维奇,这说明托特纳姆热刺的防守能力最强,西布朗维奇的防守能力最弱;越位影响因子得分最高的球队是利物浦,得分最低的球队是桑德兰,这说明利物浦的越位手法最好,桑德兰的越位手法最差.

三、基于主因子得分的聚类分析

(一)聚类分析方法

聚类分析就是根据对象之间的“相似度”把对象分为不同的类.根据变量对所观察的样本进行分类的叫作Q型聚类,根据样本对多个变量进行分类的则叫作R型聚类.

本文研究的是Q型聚类,聚类方法采用层次聚类法.层次聚类又称为系统聚类,它事先不确定要将样本分成多少类,而是先把每一个对象都作为一类,然后一层一层进行聚类.在对样本进行分类时,度量样本之间的相似性用点间距离.在层次聚类法中,当类别多于1个时,就涉及如何定义两个类别之间的距离问题.本文点间距离使用最常用的平方欧氏距离,类间距离使用实际中较常用的离差平方和法.

(二)聚类分析过程

根据上面的因子分析找出的4个主因子作为新变量,对20支球队进行层次聚类分析.从运行的结果来看,将20支球队分成五类比较合适,得到的结果见表3.

根据SPSS软件得到的不同类别球队4个因子得分的方差分析表可以看出,检验的P值均接近0,表明不同类别球队的4个因子得分之间都有显著差异,说明把20支球队分成五类是合理的.根据表4中各类别球队的4个因子得分的均值情况,可以得出以下结论:

(1)将曼城、阿森纳、切尔西三支球队分为第一类,他们的射门能力因子的平均值远远大于其他类别的球队,因此,这类球队的射门能力很强,另外,拦截能力也不错.

(2)将利物浦、埃弗顿、曼联、西布朗维奇、诺维奇五支球队分为第二类,这五支球队的越位影响因子的平均值远远高于其他类别的球队,射门能力也相对较强.

(3)将南安普顿、斯旺西、富勒姆、雷丁四支球队分为第三类,这四支球队的拦截影响因子的平均值远远高于其他类别的球队,由此可见这些球队的拦截能力很强,另外防守能力也不弱,但是射门能力却很弱.

(4)将纽卡斯尔、托特纳姆热刺、西汉姆联、阿斯顿维拉、女王公园巡游者五支球队分为第四类,这五支球队的防守能力因子的平均值远远高于其他类别的球队,射门能力一般,越位影响因子相对较高.

(5)第五类中的斯托克城、维冈、桑德兰三支球队的射门能力因子、拦截影响因子、越位影响因子的平均值都远远小于另外四个类别的球队,防守能力也仅仅是一般.

四、结论与建议

本文通过因子分析方法从12项指标中提取了4个主因子:射门能力因子、拦截影响因子、防守能力因子和越位影响因子,建立了英超足球队指标体系,基本能够直观地反映出英超足球队的水平,同时还确立了较为直观、简便、实用、科学的综合评价方法,并将4个主因子作为新变量对20支球队利用层次聚类方法进行了分类,在方法上是可靠、有效、可行的,对及时了解世界竞技足球的进攻情况、检查训练效果、制订训练计划、有效控制训练过程和选拔优秀足球运动员提供了科学的依据.

【参考文献】

[1]孙飞,谷贻林.2007年中超联赛进球特征分析与研究[J].体育成人教育学刊,2008(4):59-61.

[2]贾俊平.统计学:第四版[M].北京:中国人民大学出版社,2011:254-288.

[3]牛锦山.2009年欧洲冠军足球联赛攻击性防守技术研究[J].成都体育学院学报,2010(5):63-66.

[4]龚明波,钟平.尺度空间层次聚类在足球球队技、战术能力分类中的应用研究[J].体育科学,2005(1):87-90.

[5]唐峻峭,彭伟,毋洪飞.论现代足球战术及其特征[J].成都体育学院学报,2007(1):78-80.

[6]杨辉.主成份分析法聚类分析法在对足球比赛综合评价中的应用[J].湛江师范学院学报,2004(6):52-56.

猜你喜欢
聚类分析因子分析足球
让足球动起来
少年快乐足球
农村居民家庭人均生活消费支出分析
基于主导产业视角的战略性新兴产业识别以及实证研究
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
实证分析会计信息对股价的影响
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
认识足球(一)