基于主成分分析的CBA球队综合评估指标权重计算

2020-12-22 02:25周亚辉毛可亲
关键词:特征值权值贡献率

周亚辉,毛可亲

(1.台州学院 教师教育学院,浙江 临海 317000;2.岳阳市第四中学,湖南 岳阳 414000)

指标权重表示某一指标在综合评价中的重要程度,权重越大说明该指标的重要性越高,对整体的影响越大.常用的权重确定方法有:专家打分法、Delphi 法、AHP 法、主成分分析法(PCA)等[1,2].

CBA 联赛是由中国篮球协会主办的、国内最高级别的篮球联赛.从比赛的角度看,一支球队的攻防综合能力受到很多因素的影响,通常可以在球队的比赛统计数据中得到体现.目前,相关研究主要集中在CBA 联赛参赛球队攻防能力的对比和评价方面[3~6],很少关注球队综合能力相关影响因素的权重分析.本文根据CBA 官方提供的2019~2020 赛季各参赛球队常规赛比赛统计数据,提出一种基于主成分分析的球队综合能力相关因素权重计算方法,为CBA 球队攻防综合能力评估提供参考.

1 主成分分析法

主成分分析是将原有多个相关性较强的变量重新组合,生成少数几个彼此不相关的新变量,并尽可能多地提取原有变量的信息.假设有n个样本,每个样本有p个指标变量,构成一个n×p的数据矩阵

记原有变量指标为x1,x2,…,xp,变换后的新变量指标为z1,z2,…,zm(m≤p),新变量通常可以表达为原有变量的线性组合:

其中,新变量指标zi(i=1,2,…,m)称为原变量指标x1,x2,…,xp的第i主成分,lij是原指标变量xj(j=1,2,…,p)在主成分zi(i=1,2,…,m)上的系数.

主成分分析的计算步骤为:

(1)计算相关系数矩阵

其中rij(i,j=1,2,…,p)为原变量xi和xj的相关系数.

(2)计算特征值和特征向量

解特征方程|λE-R|=0,这里E是单位矩阵.求出所有特征值,并按其大小顺序排列为λ1≥λ2…≥λp≥0.分别求出对应特征值λi的特征向量ei(i=1,2,…,p).

(3)计算主成分累计贡献率

根据特征值,计算累计贡献率:

选取累计贡献率超过95%的特征值λ1,λ2,…,λm所对应的前m个主成分.

(4)计算原指标在不同成分线性组合中的系数

其中eij为第i主成分对原指标变量xj的载荷数.

(5)计算主成分贡献率

(6)计算原指标在综合模型中的系数

(7)指标权值归一化

最后根据归一化权值进行排序,即可得到该指标在综合得分模型中的权重.

2 球队综合能力指标权重计算

本文数据来自于中国篮球协会官方网站(https://www.cba.net.cn/)公布的2019~2020 赛季常规赛球队基础数据(表1).通过相关系数分析,得到相关系数(表2).求解相关系数矩阵的特征方程,得到特征值和累计贡献率(表3).

表2 相关系数

表3 特征值和累计贡献率

由表3可知,前4 个主成分的方差累计贡献率达到95%以上,说明前4 个主成分几乎可以反映原有指标的信息.因此,取前4 个主成分.

进一步得到各主成分对原指标的载荷(表4).表4中,第1 主成分对得分的载荷是0.942039.

表4 各主成分对原指标的载荷

根据式(5),计算原指标在不同成分线性组合中的系数,见表5.

表5 原指标在主成分线性组合中的系数

根据式(6),得到各主成分贡献率分别为0.832978、0.0825381、0.0557323、0.0287518.根据式(7)和(8),计算得到各指标的权重值及排名,见表6.

表6 综合模型中指标权值

从表6可知,在综合能力模型中,影响因素最大的三个指标为:得分、篮板和助攻.

3 结论

本文基于主成分分析方法,计算了CBA 2019~2020 赛季各参赛队进攻和防守的综合能力,并对影响因素权重大小进行排序.研究表明,在球队综合能力模型中,影响因素最大的三个指标分别为:得分、篮板和助攻.另外,犯规的指标权值超过了0.14,略小于助攻,所以防守动作的规范程度也是提高球队综合能力的一个重要方面.

猜你喜欢
特征值权值贡献率
一种融合时间权值和用户行为序列的电影推荐模型
单圈图关联矩阵的特征值
一种通用的装备体系贡献率评估框架
迭代方法计算矩阵特征值
强规划的最小期望权值求解算法∗
程序属性的检测与程序属性的分类
关于装备体系贡献率研究的几点思考
求矩阵特征值的一个简单方法
周期特征值问题的Wilkinson型定理