屈铁强,陈彦龙,周长敬,龚炳南,刘鸿优
现如今不同水平级别的足球运动队对比赛表现分析的运用都极为普遍,且日趋成熟,而学术领域对足球比赛表现分析的研究则日渐深入。 随着足球比赛表现分析手段和方法的迭代更新,当前实践允许采取大数据样本、纳入多变量因素来对足球比赛表现进行深度分析。 足球比赛的终极目标是获取比赛胜利,因此,在比赛表现分析中,无论样本量和自变量如何扩展,最恰当的因变量都应该是比赛的获胜概率。
当前学者多以单赛季联赛或单届杯赛为研究对象,探讨各项足球比赛表现指标与比赛胜负的关系。在对中超联赛的研究中,彭召方等和侯鸿骞等认为传球为影响比赛胜负的显著性指标;刘天彪等的研究表明,比赛获胜关键指标是传球成功率、拦截和抢断;李国辉和刘鸿优等则认为射正球门是决定比赛结果的显著性关键变量。 房作铭等对2018年国际足联世界杯比赛表现的研究表明, 增加射门次数、射正次数、射正率、定位球射门次数、突破进入罚球区次数、控球率、传球成功率、解围成功次数和防守反击次数可使比赛获胜概率显著提升;而Liu 等对2014年世界杯比赛数据进行分析后发现,射门次数、射正次数、反击射门次数、禁区内射门次数、控球率、短传次数、平均传球次数、空中优势、铲球是影响比赛结果的关键致胜指标。由上可见,不同学者对于同一赛事、 不同赛季/ 届次的足球比赛表现进行研究,得出了较多不一致的结论,很大一部分原因可能是基于单赛季或一届杯赛的比赛数据建立的统计学模型界定出来的比赛致胜指标往往不够稳健。因此,宜采取多个连续赛季的研究样本, 进一步增加数据模型的稳健性和预测结果的说服力。 此外,目前足球比赛表现分析研究多以单纯的跑动指标或单纯的技战术指标为主,鲜有对跑动指标和技战术指标的综合表现分析研究, 这显然不足以反映足球比赛复杂、多样性的特点。 因而,尽可能地扩大样本量、 纳入尽可能多的自变量和采取更加科学的统计模型和推断方法是提高足球比赛表现分析研究结果说服力的主要途径。
基于上述认识,本研究以横跨8个赛季的1 899 场比赛作为研究样本, 运用广义混合线性模型(Proc Glimmix)和数据级数推断法(Magnitude-based Inference), 同时纳入跑动指标和技战术指标作为自变量,且控制赛季、比赛场地、球队实力、对手实力4个比赛情境因素的影响,对中国足球协会超级联赛(以下简称中超联赛)的致胜关键指标进行界定,以期丰富前人研究结果,加深对中超联赛比赛特征认识,提高教练员有针对性地制定训练及战术策略。
本研究的样本为2012—2019 赛季中超联赛1 899 场比赛的数据。数据来源于中超联赛官方数据提供商AMISCO 公司,该公司的数据已被广泛运用于欧洲各足球联赛和中超联赛的科学研究与训练实践之中。
研究变量包括比赛结果(胜/ 平/ 负)、赛季(比赛所处的赛季:2012—2019)、比赛场地(主/ 客场)、球队实力(球队的赛季末排名:1~16 名)、对手球队的实力(对手球队的赛季末排名:1~16 名)和每支球队每场比赛的跑动指标和技术指标。 基于数据可获得性,被选取的比赛跑动指标(time-motion analysis)和技术指标(notation analysis)分别为16个和22个。本文对所有研究变量进行了分组,见表1。
表1 研究变量分组Table1 Grouping of research variables
所有1 899 场比赛的跑动和技术表现指标皆被导入Excel 中进行处理, 添加每场比赛的主客场信息、比赛结果、比赛所处的赛季和每支球队的赛季末排名。 将整理好的Excel 数据导入SAS Studio 3.6 进行统计学分析。
采取广义混合线性模型,以每支球队在每一场比赛中的每一项跑动指标和技术指标的数值为预测变量(主效应),以赛季、比赛场地、球队实力、对手实力为协同预测变量(固定效应),以球队获胜概率的比值(odds)为因变量,进行38 次独立的多元逻辑回归模型创建。 所有模型中,球队名称都被添加为随机效应, 以识别同一球队参加的多场不同比赛,正确处理重复测量数据。 赛季、比赛场地和比赛结果以名义变量的形式加入模型: 赛季被命名为2012—2019,代表2012—2019 赛季;比赛场地被命名为1(主场)和2(客场);比赛结果被命名为3/1/0,分别代表胜、平、负。 球队实力和对手实力以连续型变量的形式加入模型, 具体处理方法为添加新变量“实力差异”, 实力差异=log (球队排名/ 对手排名)。
创建的广义混合线性模型可以在正确处理重复测量数据的基础上,控制赛季、比赛场地、球队实力、对手实力4个比赛情境因素的影响, 估算出球队的跑动指标和技术指标数值与比赛获胜概率之间的对数回归关系。在模型创建后,采用数据级数推断法的非临床推断方法对模型结果进行统计学推断, 分别计算出每一项指标数值增加2个标准差(SD)对球队获胜概率带来的变化, 同时计算变化值的99%置信区间。 足球比赛中,10%的获胜概率变化被界定为“最小有意义变化值”,即当某一项指标数值增加2个SD,带来的获胜概率变化值的99%置信区间上限和下限不同时包含正、负“最小有意义变化值”(±10%)时, 该指标与获胜概率变化的相关关系被定义为清晰的。 对获胜概率变化为清晰的正值、负值或微小无意义值的可能性的大小可做如下界定:<0.5%极其不可能;0.5%~5%非常不可能;5%~25%很不可能;25%~75%可能;75%~95%很可能;95%~99.5%非常可能;>99.5%极其可能。
表2展示了中超联赛球队在获胜、 战平和失利的比赛中的各项跑动指标的描述数据, 图1 则展示每一项跑动指标数值增加2个SD 对球队获胜概率带来的变化值及其99%置信区间。由图1 可见,增加2个SD 的跑动相关指标数值只能给比赛获胜概率带来微小无意义的变化。
图1 2012—2019 赛季中超联赛球队比赛跑动指标与获胜概率的关系Figure1 Relationship between running indicators and winning probability of Chinese Super League team in 2012-2019 season
表2 跑动指标描述数据(±SD)Table2 Analysis of running indicators (±SD)
表3展示了中超联赛球队在获胜、 战平和失利的比赛中的各项技术指标的描述数据, 图2 则展示每一项技术指标数值增加2个SD 对球队获胜概率带来的变化值及其99%置信区间。 由图2 可见,增加2个SD的射正率可以为球队获胜概率带来31%的增量(99%置信区间:±4.4%),而增加2个SD 的个人控球时间、个人控球次数、进攻三区个人控球次数、个人控球平均触球次数、传球次数、传球成功率、向前场传球次数、向前场传球成功率和传中次数分别会降低20%(±4.2%)、25.3%(±4.2%)、25.6%(±4.3%)、17.3%(±4.1%)、25.2%(±4.2%)、19%(±4.2%)、25.8%(±4.3%)、19%(±4.2%)和32%(±4.2%)的比赛获胜概率,而增加一张红牌,会给球队获胜概率带来10.6%(±4.3%)的下降。
图2 2012—2019 赛季中超联赛球队比赛技术指标与获胜概率的关系Figure2Relationship between technical indicators and winning probability of Chinese Super League teams in 2012-2019 season
表3 技术指标描述数据(±SD)Table3 Analysis of technical indicators (±SD)
?
近年来, 大量研究已对不同水平赛事致胜关键指标进行过探讨。在比赛跑动相关指标上,有研究表明跑动总距离、 高速跑距离与最终联赛成绩不存在显著相关性,也有学者认为本方控球及对方控球跑动相关指标是影响比赛结果的显著性因素。本研究通过对8个赛季中超联赛跑动指标分析,显示中超联赛球队在比赛中的所有跑动指标对比赛获胜概率只带来微小无意义的影响。在足球比赛中,大部分的时间是处于非控球状态下的中低强度活动,可能与比赛关键事件联系不紧密。这说明在近8个赛季的中超联赛中, 跑动指标并不是球队获胜的关键指标。基于足球比赛攻守的特征,跑动能力是球员应具备的基本能力, 并不是影响比赛胜负的关键指标。
在射门相关指标上,房作铭等对2018年国际足联俄罗斯世界杯比赛的研究发现, 射正率是影响比赛结果的显著性指标。 刘鸿优等学者研究发现, 射正球门次数给比赛获胜概率带来积极正面影响。 国外学者对德国甲级联赛和巴西世界杯的研究也证实这一点。射门要求的是质量而非数量,射门的质量是决定足球比赛胜负的关键因素。 本研究的结果再次验证这一观点,在中超联赛中,射正率是射门相关指标中唯一对比赛胜负造成实质性影响的指标。
在控球相关指标中,目前研究多集中在对球队整体控球率的分析。 Liu 等和房作铭等在对世界杯比赛表现分析中发现增加球队整体控球率将提升比赛获胜概率,张磊等和侯鸿骞等对中超联赛的分析也验证了这一观点。 侯会生等、龚炳南等和李荣等则认为球队整体控球率与比赛胜负关系不存在相关性;而Christian、姜哲等认为,当面对同等实力的球队, 整体控球率的增加对比赛胜率产生消极影响。 球队整体控球率是由一系列的个人控球组成,个人控球开始于球员能够持球执行动作的时刻,结束于另一名球员的个人控球开始。本文通过对8个赛季的中超比赛数据分析, 发现个人控球时间、个人控球次数、进攻三区个人控球次数和个人控球平均触球次数等4 项指标对中超联赛比赛获胜概率均有消极影响。 即中超联赛各球队无论在主客场,面对不同实力球队,个人控球相关指标的增加对比赛结果均产生负面影响。显而易见,当球队出现过多个人控球,被对方有针对性抢断后迅速打反击,将会给球队带来极高的丢分风险。 当今世界足球潮流强调整体协同作战能力, 而淡化以往核心球员的个人表现。 因此,球员占用过多控球时间与次数,不仅会影响球队进攻节奏,让对手有充足的时间回防,重新构建防线体系,而且会在增加本方进攻难度的同时增加被打反击的危险性, 进而增加球队失球风险,降低获胜概率。
在传球相关指标研究中, 学者们对不同赛季中超比赛中的传球表现对比赛结果的影响持有不同观点。例如刘鸿优等按球队实力/ 对方实力划分比赛情境, 认为上游球队显著性致胜指标分别为传球成功率、 向前直塞球, 下游球队关键性致胜指标是传中;姜哲等则认为传中次数增加对比赛结果具有消极影响;谢军等、柏延洋等则持有不同观点。之所以有诸多不同观点, 原因可能在于研究赛季不一致,样本量规模不同。本研究发现,传球次数、传球成功率、向前传球次数、向前传球成功率、传中次数均对比赛结果带来消极影响, 从而反映中超联赛各球队在比赛中传球盲目且目的性不足, 传球不仅不会带来正面的比赛效益, 反而会消极影响比赛获胜概率。 这一研究结果与龚炳南等对中超7个赛季分析中得出的结论类似。 本研究以8个赛季中超比赛数据为样本量, 估算出球队传球相关指标数值与比赛获胜概率之间的对数回归关系, 更具有科学合理性及说服力。
在防守相关指标上,前人研究发现红牌、黄牌和抢断3 项指标是影响胜负关系的关键指标。 本研究基于8个赛季数据分析, 结果显示只有红牌这一指标对比赛结果有显著性影响, 增加一张红牌将降低10.6%的获胜概率, 其他防守相关指标对比赛胜负关系只有微小无意义的影响。毋庸置疑,在如今对时空争夺异常激烈的足球比赛中, 被判罚红牌的球队,在少一人的情况下,将会极其被动。 无论是上游球队还是下游球队在比赛中被判罚红牌, 都会导致 比 赛 获 胜 概 率 的 降 低。 Liu 等和Bar-Eli 等的研究都认为,出现球员被红牌罚出场的情况,将极大降低本球队获胜的可能性,削弱球队得分表现,对比赛结果产生显著的负面影响。 本研究结果再次验证了这一论点。
4.1 在近8个赛季的中超联赛中, 球队在比赛中完成的跑动总距离、 高强度跑动距离和高强度跑动次数等所有跑动相关指标对比赛获胜概率只存在微小无意义的影响。
4.2 在技术相关指标中,仅有射正率的增加可以为球队获胜概率带来清晰的提升,个人控球时间、个人控球次数、进攻三区个人控球次数、个人控球平均触球次数、传球次数、传球成功率、向前场传球次数、向前场传球成功率、 传中次数和红牌数量的增加皆会清晰降低球队的比赛获胜概率。