GA-BP神经网络预测大学生体质的模型构建研究

2018-08-10 07:34:24许珊珊崔洪珊
关键词:肺活量实测值体质

许珊珊,曹 冶,崔洪珊

(1.淮南联合大学, 安徽 淮南 232038; 2.镇江市第一人民医院, 江苏 镇江 212002)

随着经济的快速发展,日益丰富的物质文化产品满足了人们便捷、舒适的生活需求,但营养过剩、生活节奏加快、环境污染等给人们的健康也带来新的威胁[1]。青少年是社会发展的重要驱动力之一,保障青少年的身心健康尤为关键[2]。目前,青少年由于精神压力大、缺乏运动、营养摄入不合理等因素,导致身体健康下滑,引起如肥胖、低血红蛋白、龋齿等问题[3]。研究显示,中国大学生普遍存在亚健康问题且大学生体质健康状况呈不同程度的下降,大学生体态也有倾向于肥胖的发展趋势[3-4],国外大学生体质状况也一样不容乐观[5-7]。因此,学生年度体能测试已成为高校重要的工作之一。通过体质健康影响因素分析,采取有针对性的对策和医学相关干预措施,可达到增强学生体质、促进其健康成长的目的[8]。

目前,青少年学生体测依据各项指标,如肺活量、引体向上等,反映了学生的体质状况,还可给出综合评判标准[9]。综合评判标准需要经过较为复杂的计算获得,耗费大量的人力、物力。由于综合评判指标是依据各项体能指标的评分标准获得[10],因此综合评判指标与各项指标之间具有紧密的关联性。如能在综合评判指标与各项体能指标之间建立一种直接联系,不但可以削减单项体能指标的评分耗时工作,还可以预测学生未来体质发展状况,做到影响因素的预防分析,有效避免体质状况下滑。

目前大学生体质监测数据只实现了信息存储或统计。基于学生体能数据,进行统计分析和实施物理健康监测较多,而通过建立体质预测模型进行分析的研究较匮乏。现有预测体质模型有Fisher判别法、灰色EGM预测模型、多层感知器模型等[11]。上述模型对不同年龄段人体的体质预测有好的效果。但是,研究体质状况和健康体适能指标、竞技体适能指标的方法和模型还不够系统[12]。本文建立了一种由遗传算法(GA)与多层前馈神经网络(BP)构成的GA-BP神经网络模型,可用于快速评估大学生体质总体状况。

1 数据采集与模拟方法

1.1 数据采集

该方法适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生。首先将学生按照年级划分为不同组别,而身体形态类中的身高、体质量,身体机能类中的肺活量,以及身体素质类中的50 m跑、坐位体前屈为各年级学生共性指标[13]。目前大学生测试指标为:50 m跑、坐位体前屈、立定跳远、男生引体向上、女生1 min仰卧起坐、男生1 000 m跑、女生800 m跑,上述指标可以较好地反映大学生速度、爆发力、力量和耐力素质水平[14]。

本文研究的是采集自某东部大学的男生与女生体质数据,包括该校2015年除因生病或其他身体原因无法参与体能测试的所有在校生,男生为2129人,女生为3391人。样本采集时间:2015年9月20日—2015年10月30日。采集数据包括身高、体质量、肺活量、短跑(50 m跑)耗时、长跑(男1 000 m和女800 m)耗时、坐位体前屈、立定跳远、总分等。总分是学生体质的总体得分,反映学生体质状况(等级为优秀、良好、及格与不及格)。上述采集的样本用于模型的建立,其样本基本信息见表1。另外,也采集了2016年的学生样本用于验证模型的时间扩展预测能力。

表1 2015年学生样本基本信息

1.2 模型框架

本文采用Matlab软件建立GA-BP神经网络。BP神经网络是多层前向网络,由输入层、输出层、中间层即隐含层组成。在同一层中含有许多神经元且相互间不作用,不同层次间的神经元相互作用[15-16]。本文研究建立了2种神经网络子模型:GA-BP-1与GA-BP-2,分别用于预测男生体质与女生体质,其网络框架如图1所示。

GA-BP神经网络模型的结构为8个输入神经元节点数、3个隐含层数节点数、1个输出神经元节点数。输入神经元变量见表2。预测男生体质模型的8个输入神经元节点数为身高、体质量、肺活量、50 m跑耗时、立定跳远、坐位体前屈、1 000 m跑耗时、引体向上;预测女生体质模型的8个输入神经元节点数为身高、体质量、肺活量、50 m跑耗时、立定跳远、坐位体前屈、800 m跑耗时、仰卧起坐。1个输出神经元节点数为总分。GA参数设置中种群规模为10;交叉概率为0.8;变异概率为0.1。

图1 BP神经网络框架

模型类别输入神经元GA-BP-1身高体质量肺活量50 m跑耗时坐位体前屈立定跳远引体向上1 000 m跑耗时GA-BP-2身高体质量肺活量50 m跑耗时坐位体前屈立定跳远仰卧起坐800 m跑耗时

GA-BP-1与GA-BP-2模型训练过程如图2所示[17]。

图2 GA-BP神经网络训练过程

本文按照设定的训练样本和测试样本数比值(1∶2)随机抽取训练样本和测试样本。GA-BP-1模型中:训练样本为1 419;测试样本为710。GA-BP-2模型中:训练样本为2 260;测试样本为1 131。测试样本占总样本数的1/3。模型建立后,用于评估时间扩展预测能力的样本数为:男生样本2 319,女生样本3 584。本文采用决定系数(R2)评估模型的拟合优度。当R2越接近1时,表明模型拟合的效果越好,实测值与模拟值相关性好,拟合优度高;相反,越接近0时,表明模型拟合的效果越差,实测值与模拟值相关性不好,拟合优度不高。

1.3 数据预处理

由于测试数据具有多维性和复杂性,输入值存在不同的量纲。输入数据取值量级相差较大会对网络的识别精度造成影响。本文采用Matlab软件的mapminmax函数对数据进行预处理,样本数据限制值的范围为-1~1。

2 结果分析

2.1 GA-BP-1模拟结果

通过GA-BP-1神经网络训练,训练样本和测试样本拟合的标准值与实测值之间的决定系数分别为0.95与0.91,如图3显示。实测值与模拟值之间具有较好的相关性,拟合优度高。一般情况下,训练样本和测试样本之间存在内在规律,因此网络模型的好坏需要通过训练误差与测试误差相比较才能判断网络本身的好坏。测试误差与训练误差比值太大,会导致过度拟合现象发生;如果太小,将导致测试样本不能反映训练样本的内存规律。因此,测试误差和训练误差接近时较为理想。本文研究显示:训练误差和测试误差比为1.01,测试误差和训练误差很接近,所以网络训练结果相对合理。

图4中:训练样本模拟效果与测试样本模拟效果比较接近;模拟值与实测值的变化趋势整体一致,大小交错分布,吻合性较好。

图3 GA-BP-1训练模拟值、测试模拟值与实测值相关性

图4 GA-BP-1训练模拟值、测试模拟值与实测值分布

2.2 GA-BP-2模拟结果

通过GA-BP-2神经网络训练,训练样本和测试样本拟合的标准值与实测值之间的决定系数分别为0.94与0.94,如图5显示。实测值与模拟值之间具有较好的相关性,拟合优度高。训练误差和测试误差比为0.999 8,测试误差和训练误差很接近,所以网络训练结果相对合理。

图6中:训练样本模拟效果于测试样本模拟效果较接近;模拟值与实测值的变化趋势整体一致,大小交错分布,吻合性较好。

图5 GA-BP-2训练模拟值、测试模拟值与实测值相关性

图6 GA-BP-2训练模拟值、测试模拟值与实测值分布

2.3 时间扩展的预测能力

GA-BP-1与GA-BP-2建立后,为了验证模型的时间扩展预测能力,选择2016年的样本数据进行模拟,模拟结果见图7。结果显示:模型预测的预测值和实测值均有很好的相关性。相关系数分别达到0.94与0.95。因此GA-BP-1与GA-BP-2模型能够具有很好的扩展预测能力,可以应用于学生体质情况。

2.4 影响因素分析

GA-BP神经网络可以有效预测大学生体质,还可以做到影响因素的预测分析。本文以肺活量影响因素变化为例,研究某男生与某女生体质随肺活量的变化情况,以此预测体质状况的变化规律。该男生体质情况为:身高150.7 cm,体质量63.6 kg,50 m跑耗时10.7 s,立定跳远145 cm,坐位体前屈为10 cm,1 000 m跑6.53 min,引体向上2个/min。该女生体质情况为:身高171.9 cm,体质量50.7 kg,50 m跑耗时10.4 s,立定跳远190 cm,坐位体前屈为15cm,800 m跑耗时4.12 min,仰卧起坐10个/min。本文研究考察的该男生和女生的肺活量变化范围为2 500 mL到4 000 mL。模拟结果见图8。

图8(a)显示男生体质随肺活量变化的规律。图8(b)显示女生体质随肺活量变化的规律。

图7 模拟值与实测值相关性

图8 体质随着肺活量不同的变化规律

图8显示,在不同的肺活量条件下,肺活量越大,体质状况越好;肺活量为2 500 mL时,体质最差;当肺活量为4 000 mL时,体质最好。研究表明,该男生的体质随肺活量值的变化情况由3个阶段组成:在 2 000~2 500 mL之间体质是一个缓慢增长阶段;在2 500~3 500 mL时体质有一个显著快速增长阶段;在3 500 mL以上,体质增长速度变缓。因此,在其他条件不变的情况下,肺活量在2 500~3 500 mL阶段是提高该男生体质的一个有利条件。图8(b)显示:随着肺活量的提高,该女生体质基本呈线性增长,该女生对肺活量的敏感性强,肺活量提高有助于该女生体质的增强。由于每位学生的情况不同,模拟结果有所不同,但总体表明模型能在不同因素条件下预测学生的体质,为体质增强提供可行性建议。

3 结论

本文研究了某东部大学的男生与女生的体质预测模型的构建,为大学生体质评估工作提供参考。模型构建由8个输入神经元、3个隐含层、1个输出层的BP网络框架组成。以2015年大学生体质数据为样本,GA-BP-1的训练和测试结果显示,实测值与模拟值决定系数分别达到0.95与0.91,GA-BP-2的训练和测试结果均达到0.94,两种模型的预测值与模拟值均显示出较好的分布。对2016年大学生体质数据进行预测,结果显示:GA-BP-1与GA-BP-2的模拟值与实测值的决定系数分别达到0.94与0.95,显示出较好的时间扩展预测能力。GA-BP-1与GA-BP-2模型可以预测和分析不同条件对体质的影响,可为大学生增强体质提供建议。因此,本研究的GA-BP-1与GA-BP-2模型可以用于预测大学生的体质,为大学生体质模型的预测提供参考。

猜你喜欢
肺活量实测值体质
制作简易肺活量袋
小学科学(2022年22期)2023-01-20 12:43:42
中医“体质”问答
中老年保健(2022年2期)2022-08-24 03:21:38
中医“体质”问答
中老年保健(2022年4期)2022-08-22 03:00:28
中医“体质”回答
中老年保健(2022年6期)2022-08-19 01:42:20
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
常用高温轴承钢的高温硬度实测值与计算值的对比分析
哈尔滨轴承(2020年1期)2020-11-03 09:16:22
28天吃出易瘦体质
海峡姐妹(2020年7期)2020-08-13 07:49:32
市售纯牛奶和巴氏杀菌乳营养成分分析
中国奶牛(2019年10期)2019-10-28 06:23:36
一种基于实测值理论计算的导航台电磁干扰分析方法
电子制作(2018年23期)2018-12-26 01:01:22
手机测肺活量不科学