基于聚类分析的天津市大学生体质健康评价分级模型研究

2014-08-08 01:00张晓丹杨倩倩
天津科技 2014年8期
关键词:判别函数比重类别

张晓丹,杨倩倩

(1. 天津体育学院体质检测中心 天津 300381;2. 天津体育学院研究生部 天津 300381)

基于聚类分析的天津市大学生体质健康评价分级模型研究

张晓丹1,杨倩倩2

(1. 天津体育学院体质检测中心 天津 300381;2. 天津体育学院研究生部 天津 300381)

为完成对大学生体质健康状况快速有效的评价,运用聚类分析构建原始数据的分级模型。按照国家规定标准对天津 49所大学的全日制大一、大二在校大学生进行体质健康测试,结果显示,采用聚类分析构建的分级模型对大学生体质健康进行评价可以提高评价效率和精确程度,说明运用本模型可对学生个体或群体进行综合评价,实现对学生体质健康类别的科学快速分类。

聚类分析 体质健康 大学生 分级模型

0 引 言

开展学生个体或群体体质健康分级综合评价,对于了解大学生体质健康状况有着重要意义。大学生体质健康综合评价分级模型的构建,旨在研究一种具有定性、定量功能的大学生体质健康状况的评价方法,对大学生体质健康状况数据进行处理,免去查找各指标得分并进行权重计算[1]的繁杂过程。该模型能够克服人为评价的局限性,完成大学生体质发展趋势的定量分析,为制定大学生运动处方、促进大学生自我评价、加强大学生体育锻炼和促进学校体育教学改革奠定基础。

1 研究对象与研究方法

以参加 2013年全国学生体质健康测试的天津49所大学的大一、大二全日制在校大学生为研究对象,采取整群抽样方法,从身体健康、无重大疾病的在校本、专科学生中抽取1,965人。剔除无效数据(测试项目不全的、离散程度超过 3,S),其中有效数据为1,833人。

对所选取的大学生分别进行了身高、体重、肺活量、1,000,m(女生为 800,m)、引体向上(女生为 1,min仰卧起坐)、坐位体前屈、立定跳远、50,m等8个项目的测试。[2]所有学生体质测试数据由 Microsoft Excel储存,进行异常数据(测试项目不全的、离散程度超过3,S)筛选以后,建立数据库。利用SPSS 17.0数据统计软件对筛选后的有效数据进行处理,运用聚类分析对原始数据进行分类,并运用判别分析法建立判别函数,最后计算判别方程的回代符合率。

2 研究结果

在构建分级模型的过程中,考虑到大学男生与大学女生体质健康评分标准不同,故将男生女生区别开来,分别建立相应的判别模型。

2.1 聚类分析

聚类分析[3]是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。由于样本数量较多,我们采用 K-Means Cluster聚类分析对样本进行分类。本研究欲将天津市大学生体质分为4个级别,通过聚类分析确定天津市大学生体质的4个起止区间。其结果如表1、2所示。

表1 男生聚类分析结果Tab.1 Clustering analysis result of male students

表2 女生聚类分析结果Tab.2 Clustering analysis result of female students

2.2 Fisher线性判别函数的建立

在对原始数据进行处理的基础上,进行判别分析[4]的操作,可以得到标准化正规判别函数系数(见表 3、4),包括各独立变量对应的 4个判别函数的标准化的系数值。

根据表3的Fisher线性判别函数系数表,可以得到判定男大学生体质优秀、良好、及格与不及格的 4个线性判别函数:

注:上述公式中的 X1~X8分别代表身高、体重、肺活量、1,000,m、引体向上、坐位体前屈、立定跳远、50,m等8项指标。

表3 男生Fisher线性判别系数表Tab.3 Fisher linear discriminant analysis coefficients of male students

表4 女生Fisher线性判别系数表Tab.4 Fisher linear discriminant analysis coefficients of female students

同理,根据表4的Fisher线性判别函数系数表,可以得到判定女大学生体质优秀、良好、及格与不及格的4个线性判别函数:

注:上述公式中的 X1~X8分别代表身高、体重、肺活量、800,m、仰卧起坐、坐位体前屈、立定跳远、50,m等8项指标。

2.3 判别函数的应用

随机选取任意男生样本,将其身高、体重、1,000,m 跑、引体向上、坐位体前屈等 6项指标分别代入上述男生的 4个判别函数中,同理,随机选取任意女生样本,将其身高、体重、800,m 跑、1,min仰卧起坐、立定跳远等6项指标分别代入上述女生的4个判别函数中,可以得到相应的判别得分 F值,然后再根据判别规则,将所得的4个F值进行比较,哪个最大,就将其归入哪类。

2.4 判别效果评估和检验

构建了判别模型后,用所建立的判别函数对已知类别的样品进行判别,计算判对率和判错率,可用来描述判别函数的判别效果。把原始数值带入到模型中可以看到男生体质总体的判对率为 97.5%,错判率为 2.5%;女生体质总体的判对率为 98.2%,错判率为1.8%。同样,模型的总判对率为 97.85%,总错判率为2.25%。由此可见,所构建的判别函数的判别效果是很显著的。

我们亦选取了未参与建模的15名男大学和16名女大学生,利用已经构建成的分级模型,对其进行体质判定。总判对率为 92.40%,总判错率为 7.60%。据此,我们认为判别函数整体拟合较好,各类分级较为显著。

3 分析与讨论

在男生人数为927个的总体样本中,第一类别即体质优秀者为110人,所占比重为11.87%;第二类别即体质良好者为273人,所占比重为29.45%;第三类别即体质及格者为412人,所占比重为44.44%;第四类别即体质不及格者为132人,所占比重为14.24%。显然,体质及格者所占比重最大,体质优秀者与体质良好者比重之和比体质及格者略少一些为 41.32%,体质不及格者比重也较高。

而在女生人数为906的总体样本中,第一类别即体质优秀者为108人,所占比重为11.92%;第二类别即体质良好者为233人,所占比重为25.72%;第三类别即体质及格者为350人,所占比重为38.63%;第四类别即体质不及格者为 215,所占比重为 23.73%。可见,体质及格者所占比重最大,体质优秀者与体质良好者比重之和居于其次,体质不及格者比重明显高于男生。

在天津在校大学生体质监测人数为 1,833的总体样本中,体质优秀者所占比重为 11.89%,体质良好者所占比重为 27.61%,体质及格者所占比重为41.57%,体质不及格者所占比重为18.93%。

由以上的数据分析结果可知,学生体质大部分集中在及格等级,优秀与良好者所占比例也较大,而不及格等级所占比例相对偏小。这说明,天津市在校大学生男女生的体质状况总体上尚佳。并且,在优秀与良好两个等级中,女生所占比例和男生所占比例近似;在不及格等级中,女生所占比例高于男生。这说明男生体质要优于女生。

4 结 语

本文选用聚类分析中的 K-Means Cluster聚类法,用“评价模型”对学生个体进行定量评价具有较高的灵敏性,其设计思想与大学生体质健康水平分布的实际情况相符合。运用本模型可对学生个体或群体进行综合评价,实现对学生体质类别的科学快速分类。与《国家学生体质健康标准》的综合评价方法相比,它减少了程序,只需要进行一次数学运算,便能得出学生个体或群体的体质健康等级,[5]免去了查找各指标得分并要进行权重计算的繁杂过程。同时,这种方法能够充分考虑到人在评估过程中的主观能动作用。

[1]《国家学生体质健康标准解读》编委会. 国家学生体质健康标准解读[M]. 北京:人民教育出版社,2007.

[2]Joanne E. Arsenault,Mercedes Mora-Plazas,Yibby Forero,et al. Micronutrient and anthropometric status indicators are associated with physical fitness in Colombian schoolchildren[J]. British Journal of Nutrition,2011(105):1832-1842.

[3]侯彩虹. 基于模糊聚类分析的织物质量分级方法[J].东华大学学报,2005(2):54- 58.

[4]李卫东. 应用多元统计分析[M]. 北京:北京大学出版社,2008:155-176.

[5]Jerrold S. Greenberg,George B. Dintiman,Barbee Myers Oakes. Physical Fitness and Wellness:Changing the Way You Look,Feel and Perform[M]. Champaign:Human Kinetics Publishers,2004.

Study on an Evaluation Classification Model of Physical Health of University Students in Tianjin based on Clustering Analysis

ZHANG Xiaodan1,YANG Qianqian2
(1. Tianjin Municipality Physical Fitness Surveillance Center,Tianjin University of Sport,Tianjin 300381,China;2. School of Graduate,Tianjin University of Sport,Tianjin 300381,China)

In order to realize fast and effective evaluation on physical health of university students in Tianjin,a physical health test for freshmen and sophomores from 49 universities and colleges in Tianjin,which was in accordance with the physical health of national standard,was carried out. The result showed that,the adoption of constructed clustering model improved the efficiency and accuracy of the evaluation on university students’ physical health. It was concluded that it was feasible to classify physical health of university students through application of this classification model,which can evaluate physical health of either individuals or groups.

cluster analysis;physical health;college students;hierarchical model

R851.3

A

1006-8945(2014)08-0076-04

天津市科委科普项目(13KPXM01SY004)。

2014-07-06

猜你喜欢
判别函数比重类别
Fisher判别法在个人信用风险评估中的应用
游乐设施事故与危险量化判别函数的构建
今年第一产业增加值占GDP比重或仍下降
壮字喃字同形字的三种类别及简要分析
探究上市公司财务预警的数学模型
中央和地方财政收入及比重
中央和地方财政支出及比重
西夏刻本中小装饰的类别及流变
制造业上市公司财务预警研究
多类别复合资源的空间匹配