周亚辉,毛可亲
(1.台州学院 教师教育学院,浙江 临海 317000;2.岳阳市第四中学,湖南 岳阳 414000)
指标权重表示某一指标在综合评价中的重要程度,权重越大说明该指标的重要性越高,对整体的影响越大.常用的权重确定方法有:专家打分法、Delphi 法、AHP 法、主成分分析法(PCA)等[1,2].
CBA 联赛是由中国篮球协会主办的、国内最高级别的篮球联赛.从比赛的角度看,一支球队的攻防综合能力受到很多因素的影响,通常可以在球队的比赛统计数据中得到体现.目前,相关研究主要集中在CBA 联赛参赛球队攻防能力的对比和评价方面[3~6],很少关注球队综合能力相关影响因素的权重分析.本文根据CBA 官方提供的2019~2020 赛季各参赛球队常规赛比赛统计数据,提出一种基于主成分分析的球队综合能力相关因素权重计算方法,为CBA 球队攻防综合能力评估提供参考.
主成分分析是将原有多个相关性较强的变量重新组合,生成少数几个彼此不相关的新变量,并尽可能多地提取原有变量的信息.假设有n个样本,每个样本有p个指标变量,构成一个n×p的数据矩阵
记原有变量指标为x1,x2,…,xp,变换后的新变量指标为z1,z2,…,zm(m≤p),新变量通常可以表达为原有变量的线性组合:
其中,新变量指标zi(i=1,2,…,m)称为原变量指标x1,x2,…,xp的第i主成分,lij是原指标变量xj(j=1,2,…,p)在主成分zi(i=1,2,…,m)上的系数.
主成分分析的计算步骤为:
(1)计算相关系数矩阵
其中rij(i,j=1,2,…,p)为原变量xi和xj的相关系数.
(2)计算特征值和特征向量
解特征方程|λE-R|=0,这里E是单位矩阵.求出所有特征值,并按其大小顺序排列为λ1≥λ2…≥λp≥0.分别求出对应特征值λi的特征向量ei(i=1,2,…,p).
(3)计算主成分累计贡献率
根据特征值,计算累计贡献率:
选取累计贡献率超过95%的特征值λ1,λ2,…,λm所对应的前m个主成分.
(4)计算原指标在不同成分线性组合中的系数
其中eij为第i主成分对原指标变量xj的载荷数.
(5)计算主成分贡献率
(6)计算原指标在综合模型中的系数
(7)指标权值归一化
最后根据归一化权值进行排序,即可得到该指标在综合得分模型中的权重.
本文数据来自于中国篮球协会官方网站(https://www.cba.net.cn/)公布的2019~2020 赛季常规赛球队基础数据(表1).通过相关系数分析,得到相关系数(表2).求解相关系数矩阵的特征方程,得到特征值和累计贡献率(表3).
表2 相关系数
表3 特征值和累计贡献率
由表3可知,前4 个主成分的方差累计贡献率达到95%以上,说明前4 个主成分几乎可以反映原有指标的信息.因此,取前4 个主成分.
进一步得到各主成分对原指标的载荷(表4).表4中,第1 主成分对得分的载荷是0.942039.
表4 各主成分对原指标的载荷
根据式(5),计算原指标在不同成分线性组合中的系数,见表5.
表5 原指标在主成分线性组合中的系数
根据式(6),得到各主成分贡献率分别为0.832978、0.0825381、0.0557323、0.0287518.根据式(7)和(8),计算得到各指标的权重值及排名,见表6.
表6 综合模型中指标权值
从表6可知,在综合能力模型中,影响因素最大的三个指标为:得分、篮板和助攻.
本文基于主成分分析方法,计算了CBA 2019~2020 赛季各参赛队进攻和防守的综合能力,并对影响因素权重大小进行排序.研究表明,在球队综合能力模型中,影响因素最大的三个指标分别为:得分、篮板和助攻.另外,犯规的指标权值超过了0.14,略小于助攻,所以防守动作的规范程度也是提高球队综合能力的一个重要方面.