杨萌宇 张雷
摘 要:网络科学的出现为研究和解决团队系统中的问题提供了新的方法和思路,在其框架下可以将团队的整体表现看作参与者之间的互动结果。文章将网络科学应用于足球运动中,为足球球员组成的团队构建了一个传控网络模型,并对模型的网络模式进行了进一步的分析。
关键词:网络科学;K-Means;网络模式;改进Kruskal算法
随着社会的不断发展,其所面临的一系列挑战也变得越来越复杂。在这种背景下,团队合作变得越来越重要,跨部门和领域的强大团队可以完成个人努力无法完成的复杂任务,为了探究足球比赛中的团队合作模式,文章基于网络科学构建了球员的传控网络模型[1],并提出了改进的Kruskal算法对模型的网络模式进行了识别和分析[2-3]。
1 球员的传控网络模型
考虑整个赛季的团队表现,以球员为网络模型的节点,节点大小与球员聚类位置的可信程度成正比。在链接的权重计算中文章考虑了传球权重、距离权重以及干扰权重,其中传球权重与赛季传球质量成正比,距离权重为传球双方的拓扑距离,干扰权重与传球瞬间距离链接最近的对方球员与链接的距离成正比。
1.1 基于K-Means聚类的球员位置计算模型
在网络模型中,节点的位置是一个很重要的参数。足球比赛中球员的位置是时刻变化的,为了确定一个球员移动的平均位置,文章使用了K-Means聚类的方法对球员所有传球发起的位置进行了计算,估算出了球员移动位置的质心。
K-Means聚类是一种经典且应用广泛的聚类算法,对于大数据有较好的可伸缩性和高效性。对于一位球员,定义其n次传球传球发起的位置为:a1,a2,…,an,步骤如下所示:
Step1,选择出事的k个类别中心:u1,u2,…,uk;
Step2,对于剩余的每个位置ai,将其归类到距离最近的类别中心的类别,即:
(1)
Step3,重新计算已经得到的各个类的质心,将每个类别中心更新为隶属该类别所有样本的均值,即:
(2)
其中cj为第j个类别的集合;
Step4,重复Step2,Step3,当迭代前后j的值不发生变化时,算法收敛,中止运算。
1.2 基于样条插值的干扰权重计算模型
在一个赛季中,由于多场比赛面对着不同的对手,无法衡量每场比赛的对抗强度对于整个赛季干扰权的影响,故使用球员整个赛季的传球成功率来近似代替干扰权。在一场比赛中,为了细致地描述传球瞬间链接线路上的干扰权重,本文使用传球瞬间距离链接最近的对方球员与链接的距离来刻画干扰权重的大小。
文章使用了样条插值对对方球员的位置进行了估算,对于一个特定球员的n次传球,可以得到其传球发起的位置为:(x1,y1),(x2,y2),…,(xn,yn),构建对x坐标的插值节点(t1,x1),(t2,x2),…,(tn,xn),具体步骤如下所示。
Step1,计算步长hi,计算公式为:
hi=ti+1-ti,(i=1,2,…,n-1) (3)
Step2,将数据节点和制定的首位端点条件代入矩阵方程;
Step3,求解矩阵方程(系数矩阵为三对角矩阵,使用追赶法求解),求得二次微分值mi;
Step4,计算样条曲线系数,计算公式为:
ai=yi (4)
(5)
(6)
(7)
其中i=1,2,…,n-1;
Step5,在每个子区间ti≤t≤ti+1中,得到插值函数gi(t)如下式:
fi(t)=ai+bi(t-ti)+ci(t-ti)2+di(t-ti)3(8)
如图1所示,球员α在t时刻传球给球员β,此刻他们的位置分别为(xα,yα)和(xβ,yβ),由此可以得到传球的路线为:
(9)
可以得到对方球员γ在t时刻的位置为(f(t),g(t)),则此次传球的干扰权重为:
Dis(α,β,t)=
(10)
2 基于改进Kruskal算法的网络模式识别算法
作为一项团队协作的体育运动,足球比赛中的策略对于球队整体的表现有着决定性的影响。而场上的策略可以细致拆分为部分球员的局部配合,在上文中构建的传递网络模型的基础上,为了识别网络中的二元和三元结构,文章提出了改进的Kruskal算法。
定义在一段时间内球员间的互动达到一定的频率即可认为其属于同一网络子结构,所以思路是找出网络中权值和最高的环,其考虑了传球数量,传球质量等因素,可以刻畫球员在场上对于比赛中团队表现的贡献程度,算法步骤如下所示:
Step1,将网络模型中的所有边删除,只剩余节点,进而构造出一个没有边的非连通网络。
Step2,从边集中寻找权值最高的边,连接对应的两个顶点。
Step3,判断此时的网络是否为连通网络,如果是则停止运算,否则继续执行Step2。
Step4,查找构成的网络模型中所有的环。
3 结果
在问题求解中,文章选取了2017—2018赛季埃弗顿队在英格兰超级联赛整个赛季(38场比赛)的数据,数据包括38场比赛双方球员的传球时间、触球位置以及行为信息。
首先统计了所有球员的传球次数,结合球员的位置将30名球员中的11人作为本次模型的球员节点,球员的位置编码为F,M,D和G,编号为1—4。在整个赛季中。对球员的传球位置进行了聚类,得到了球员的平均位置,然后结合传球权重、距离权重和干扰权重计算出了球员节点链接的权重,进而构建了球员的传球网络模型,如图1所示。
在傳球网络模型的基础上,为了进一步探索球队的网络结构,文章使用改进的Kruskal算法对网络模型的邻接矩阵进行了识别,找到了局部团队结构,如表1所示。
从比赛数据和对球队的贡献程度方面可以发现,球队的2号前锋、1号和3号中场以及1号和3号后卫表现最为出色,其构成的局部传控结构是球队防守、控球和进攻的基础。此外,文章绘制了表1所示局部结构中球员的跑动热点图和传球位置坐标图,如图2所示。
4 结语
通过上述球员传控模型,文章确定了传控网络模型中的主要网络模式,进而可以得到阵型的主体框架,为球队的阵容以及策略优化提供了有价值的参考。文章中的网络模型以及改进Kruskal模式识别算法可以推广到更多的领域中,对探究和优化团队协作问题有着重要的意义。
[参考文献]
[1]WILLIAM B, SHEEHAN,RHYS T,et al.Using cooperative networks to analyse behaviour in professional Australian football[J].Journal of Science and Medicine in Sport,2020(3):23-24.
[2]朱军芳,陈端兵,周涛,等.网络科学中相对重要节点挖掘方法综述[J].电子科技大学学报,2019(4):595-603.
[3]王瑛.网络拓扑与连边权重对群体一致性的影响研究[D].上海:上海交通大学,2018.
Network science-based team collaboration model and network pattern recognition
Yang Mengyu, Zhang Lei*
(Chongqing Jiaotong University, Chongqing 400074, China)
Abstract:The emergence of network science provides new methods and ideas for researching and solving problems in team systems. Under its framework, the overall performance of a team can be viewed as the result of interaction between its participants. This article applies network science to football, builds a transmission and control network model for a team of football players, and further analyzes the network model of the model.
Key words:network science;K-Means;network model;improved Kruskal algorithm