李昌锋 张星 林福生 林增荣
(福建生物工程职业技术学院 福建福州 350002)
基于Fisher判别分析的大学生体质健康综合评价分级模型研究
李昌锋 张星 林福生 林增荣
(福建生物工程职业技术学院 福建福州 350002)
本文旨在研究通过Fisher线性判别分析建立大学生体质健康综合评价分级模型。样本数据来自福建生物工程职业技术学院在校大学生的体质测试数据,从中随机抽取训练集样本1100例和测试样本集550例,利用MATLAB软件来完成模型的建立与验证测试。测试结果表明,采用此模型能够快速有效地对该校大学生体质健康状况进行综合评价,实现对学生体质健康类别的快速分类。
大学生体质健康 Fisher线性判别 评价模型 MATLAB
近年来,大学生体质健康水平呈下降趋势。如何科学有效地评价大学生的体质健康状况,对促进大学生进行科学有效的体育锻炼,养成良好的体育锻炼习惯及促进学校体育教学改革都具有十分重大的意义。本文旨在研究一种基于Fisher判别分析的分级评价模型,该模型能够有效、科学地对大学生体质健康进行分级综合评价,能够对大学生体质发展趋势进行分析,为制定大学生运动处方、促进大学生自我评价、加强大学生体育锻炼提供有效依据[1]。
本文以福建生物工程职业技术学院在校大学生的体质健康测试数据为样本,测试指标分别为身高、体重、肺活量、50m跑、立地跳远、坐位体前屈、1000m跑(女生为800m跑)、引体向上(女生为1min仰卧起坐)等8个项目。根据《国家学生体质健康标准》,测试结果分为优秀、良好、及格、不及格四个等级。考虑到男生和女生的体质健康评分标准不同,所以将数据样本分为男生和女生两类进行处理,并建立各自的评级模型。所有的数据样本都是通过Microsoft Excel进行筛选,将测试项目不全的、离散程度超过3S的数据剔除,并从4个等级的样本集中随机抽取男女生训练样本集1100例和测试样本集550例。
Fisher是一种可以利用大量已有的同构标记数据(源域)设计小样本训练数据(目标域)分类器的算法。Fisher准则基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳[2]。
数据分为4个样本集合{优秀、良好、及格、不及格},所以为了实现两两进行判别比较,需要分别建立6个Fisher算法分类器:
其中:
X为样本数据(x1,x2,x3,x4,x5,x6,x7,x8);
Yk为分类器判别函数式;
w*k为分类器各维数系数向量;
w0k为分类器阈值。
表1 男生Fisher线性判别系数表
表2 女生Fisher线性判别系数表
k=1,表示分类器1:优秀与良好判别分类;
k=2,表示分类器2:优秀与及格判别分类;
k=3,表示分类器3:优秀与不及格判别分类;
k=4,表示分类器4:良好与及格判别分类;
k=5,表示分类器5:良好与不及格判别分类;
k=6,表示分类器6:及格与不及格判别分类。
整个算法设计是根据样本数据的分类进行分支处理,通过给定的训练数据,确定Fisher线性判别函数的投影方向W和阈值W0,然后根据这个线性判别函数,对测试数据进行测试得到测试数据的类别。
Fisher分类器的具体算法步骤实现如下[3]:
(2)样本类内离散度矩阵:Si=∑x∈Xi(x−mi)(x−mi)T,,i=1,2,3,4。
(3)总类内离散度矩阵:Swk=Si+Sj。
(4)求最佳向量:w∗k=Swk−1mi−mj。
(3)(4)(5)中k=1,2,3,4,5,6,(i,j)∈{(1,2),(1,3),(1,4),(2,3),(2,4),(3,4)。
模型求解使用MATLAB软件完成,分别得到男生和女生的Fisher线性判别系数表,如表1,表2所示。
应用测试样本集对模型进行测试检验,测试结果为:男生体质健康分级评价模型测试总的准确率为93.1%,误判率为6.9%;女生体质健康分级评价模型测试总的准确率为94.2%,误判率为5.8%。可以认为该模型具有较好的分级区分度,效果显著。
另外,女生总的分级效果略好于男生。从原始数据分布特点来看,男生各项指标的数据分布离散度比女生略大,导致男生数据在4个等级类别的交叉边界处存在重叠样本数的可能性增大,而在边界数据的判别上Fisher准则的准确度会略微降低。这个结果符合模型的特点,也是后续需要进一步改进优化的地方。
该模型具有计算快速、实用性强、极具推广性等优势。该模型算法可以针对不同群体样本进行推广适用。比如:将样本集扩充到福建省大学生体质健康数据,那么通过Fisher准则训练,便可得到相应的适用模型参数。同样还可以推广到中老年人群的体质健康评测。
本文选用Fisher算法来建立大学生体质健康综合评价分级模型,并对其准确度和实用性进行了验证。样本测试结果表明,用本评价模型对学生个体进行评价具有较高的准确度,其设计思想与大学生体质健康水平分布的实际情况相符合,运用本模型可对学生个体或群体进行综合评价,实现对学生体质类别的科学快速分类。
该评价模型与《国家学生体质健康标准》的综合评价方法相比,减少了程序,只需要进行一次算法调用运算,便能得出学生个体或群体的体质等级,免去查找各指标得分并要进行权重计算的繁杂过程。同时,这种方法能够充分考虑到人在评估过程中的主观能动作用,能够克服人为评价的局限性。总之,该分级评价模型对于监测大学生体质健康状况和预测大学生体质发展能够起到有效积极的作用。
[1]石娟娟.大学生体质健康综合评价分级模型构建的研究[D].武汉:华中科技大学,2011.
[2]卢卓,邓方贞.基于Fisher分类算法的水稻种子品种识别[J].南方农机,2015(10):10-11.
[3]陈国华,韦程东,蒋建初,等.数学模型与数学建模方法[M].天津:南开大学出版社,2012.
G804
A
2095-2813(2017)10(b)-0020-02
10.16655/j.cnki.2095-2813.2017.29.020