2018赛季中超联赛锋线球员进球价值分析

2022-03-31 21:09:40林庆阳孙海涛续衍法
当代体育 2022年11期
关键词:进球数中超联赛足球比赛

林庆阳 孙海涛 续衍法

在足球比赛中,射门进球是决定比赛胜負的关键。然而为球队打破僵局的第一进球、锁定胜局的进球与锦上添花的进球价值显然不同。区别于简单依靠进球个数的进失球、射手榜等数量统计,本文基于2012-2018中超联赛历史数据,通过分类汇总、曲线拟合等方法量化表示足球比赛进球与积分的关系,并以2018赛季中超联赛进球数据为例,分析不同进球所获得的积分,进而量化球队锋线球员为球队带来的进球价值贡献。

1 引言

随着足球世界的相互交流和融合,足球比赛攻防转换速度加快,对抗越来越激烈。射门进球作为攻防的焦点,是足球比赛最直接的表现方式,决定一场比赛的胜负。在现代职业足球一场比赛中一支球队最常见的分数就是1,其次是0,即在一场比赛中攻入数粒进球是相当不容易的,所以进球才令人欣喜若狂。因此,人们热衷记录、反复计算和比较总进球、场均进球、净胜球、射手榜等与进球相关的数据指标,并从多个维度进行详细的数据统计研究。

目前,在足球比赛进球研究方面,国内外文献大部分聚焦在进球特征分析方面。贺斌等人通过文献资料法、录像统计法对2013赛季中超联赛的射门和进球方式、身体部位、距离、时间和区域5个方面特征进行分析研究。钟云越等人在此基础上对2018赛季中超联赛进球特征进行分析。周哺心采用文献资料法、专家访谈法、录像分析法和数理统计法对以及逻辑分析法对2014-2017赛季欧洲冠军联赛皇家马德里队的共计38场比赛的射门及进球情况进行了研究。胡俊则对第21届世界杯足球赛决赛阶段169粒进球的进球数量、进球时间、获得球权方式、进球前传递次数与传递时间、进球前最后一传方式与属性、进球球员场上位置、射门方式、射门部位、射门区域与球进门区域等特征进行统计分析。

近年来,随着信息技术的迅速发展,云计算、超算等技术的应用普及,以大数据为核心的信息处理和分析技术在众多行业领域深化应用,促进了行业技术发展水平的飞速提升。目前,在信息化较早、数据积累较多的行业,如互联网、电信、金融等领域,大数据技术已经显示出对行业发展的重大影响。如何合理利用大量数据进行竞技体育分析是近年来关注的热点。

足球是世界上非常受欢迎的运动之一,在全球范围内吸引了众多的参与者。成千上万的职业足球运动员参与到专业的足球比赛中,许多重大的足球赛事(如国际足联世界杯等)受到数以百万计的球迷的关注。足球比赛数据主要包括统计数据、事件数据和轨迹数据等。在足球比赛中,统计数据可以细分为球队统计数据和球员表现统计数据。其中,针对球队的统计数据主要包括每场比赛的进球数、失球数、射门次数、犯规次数、红黄牌次数、角球次数、扑救次数等,以及每场比赛后球队的净胜球数、球队积分、球队排名等。针对球员的统计数据主要包括出场次数、出场时间、球员位置、进球数、助攻数、红黄牌次数、跑动距离、高强度跑距离、冲刺跑距离等。

在足球比赛中,积分和进球二者之间有密切的联系。为球队打破僵局的第一进球、锁定胜局的进球与锦上添花的进球为球队带来的积分显然不同。因此,衡量每个进球为球队带来的积分可以针对性的量化进球价值。本文首先对大量的中超历史进球数据进行分类汇总,换算得出不同进球数与积分的关系,进而基于中超历史数据进行积分与进球关系多项式曲线拟合,具体计算得出每个进球所对应的积分,最后再进行球队锋线球员进球价值分析。

2 分析方法

2.1 分类汇总

分类汇总用于交叉性研究,将变量按照一定规则进行分组汇总。在日常工作中,我们离不开要整理汇总数据,分类汇总就是快速解决这一问题的最好方法。结合自变量x的放置情况以及汇总类型的选择情况,分为四种情况,如表1所示。

Excel中的数据透视表是个交互式的透视表,具有最快、最灵活的数据汇总功能,可快速合并和比较大量基础数据,且可以旋转行、列以查看基础数据的不同汇总结果,还可显示用户感兴趣部分的明细数据等。首先按照列属性整理需要处理的基础数据表,创建“数据透视表”框架,然后在创建的“数据透视表”框架中添加需要分类汇总的 内容则可以进行简单数据项汇总和多重数据项汇总。

2.2 多项式曲线拟合

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。作为一种比较常用的曲线拟合方法,最小二乘法经常应用在科学研究和工程技术领域内,处理实验数据并确定变量之间的关系,所谓“拟合”就是找到数据的基本趋势,而不要求所作的曲线完全通过所有的数据点,其中应用最为广泛的是多项式拟合。

从本质上讲,多项式曲线拟合也是一个广义的线性模型,其数学表达式为:

(式1)

其中M是多项式自变量的最高次数,xj代表的是x的j次幂,  是xj的系数。

假设样本的数目为N,则对于每一个样本xn,其对应的输出为tn,用平方误差和作为损失函数,那么损失函数可以表示为:

(式2)

当式2损失函数达到可以接受的误差范围得到的多项式即满足条件的多项式。

3 分析实例

为考虑中超联赛每个进球的价值,我们首先汇总中超联赛2012-2018赛季的场均进球数及其对应的积分,分析不同进球数与积分的关系,直观量化不同进球的价值。随后计算出每个进球对应的积分值,用于计算2018赛季中超联赛锋线球员在一个赛季中的进球为球队贡献的积分。

以[赛季,场次,球队,进球,积分]为数据项属性整理2012-2018赛季中超2880条数据,利用Excel中的透视表汇总得出每个进球下的平均积分,如表2所示。对表2数据进行多项式拟合,得出的多项式函数F曲线如图1所示。

结果显示,在2012-2018赛季中超联赛的一场比赛中一个进球基本相当于得到一个积分,打入两粒进球后赢球概率更大。相对于一粒进球,打入三个进球并不能带来三倍的积分。根据球队已经完成的进球数的不同,每个进球的积分转化率是大相径庭的,具体结果如图2所示。

通过积分与进球曲线换算2012-2018赛季中超联赛每一个进球产生的相应的积分(如上图),结果表明第一粒进球和第二粒进球通常被视为关键进球;第三粒进球可以换取0.67个积分,也是非常重要的;包括第四个进球在内的更多进球则只能换取不足0.4个积分,球队的第五粒进球只能换取大约0.15个积分。

通过分析足球比赛中每个进球影响力不同可知简单以进球数衡量射手价值的方法存在局限性。本文根据比赛中每个进球贡献积分,计算2018赛季中超联赛中每个进球球员为球队所贡献的积分。按照[轮次,球队,第几个进球,进球球员姓名,是否为乌龙球]数据属性汇总2018赛季所有球队的所有进球,删除乌龙球数据后按照每个进球的积分进行本赛季球员进球积分/价值计算,得出的赛季进球价值积分榜如表3所示。

结果表明,2018赛季中超联赛上海上港队的武磊不仅在进球数上最多,而且为球队创造的积分也最多。其次为球队贡献积分较多的射手是长春亚泰的伊哈洛和广州富力的扎哈维。

进球数量相同的射手进球价值积分却可能相差较大。进球数为16的射手中,山东鲁能泰山队的佩莱比广州恒大的塔利斯卡高出3.51分。进球数为13的射手中,江苏苏宁的特谢拉获得了12.05个积分,广州恒大的高拉特的10个积分,上海上港的胡尔克和广州恒大的保利尼奥约获得9.7个积分,而广州恒大的阿兰仅获得9个积分。2018赛季为上海上港的攻入12球的奥斯卡只获得8个积分,未能跻身这份榜单。

(作者单位:1.国网山东省电力公司体育文化分公司;2.山东鲁软数字科技有限公司)

猜你喜欢
进球数中超联赛足球比赛
精彩的足球比赛
赛会制视角下中超联赛不同水平球队位置球员跑动表现分析
2021—2022赛季英超冠亚军球队进球特征分析
新王登基!江苏苏宁获2020赛季中超联赛冠军!
华人时刊(2020年21期)2020-11-17 11:28:32
欧洲五大足球联赛冠军队进球特征及其发展趋势研究*
运动精品(2019年1期)2019-07-15 00:57:14
足球比赛
启蒙(3-7岁)(2018年9期)2018-08-30 08:55:58
足球比赛里的“排兵布阵”(七)
足球比赛
第17、18届世界杯足球赛决赛阶段进球特征的量化分析
防守压倒一切
足球俱乐部(2008年3期)2008-09-01 03:03:04