摘要:本文采用文献资料法、问卷调查法等研究方法,从关联规则相关概念入手,创新地利用计算机数据挖掘技术跨学科探究体育问题,以机器挖掘深层次探求影响山东青少年体质健康的因素以及与其青少年久坐、睡眠、面屏等因素的关联。研究旨在提升山东省青少年体质健康水平,为山东省青少年体质健康的促进提供系统、科学、有效的方案。
关键词:关联规则" 数据挖掘" 青少年" 体质健康促进
中图分类号:G804 文献标识码:A 文章编号:1006-8902-(2025)-01-103-3-TBB
1、前言
近年来,随着经济发展的迅速变化,人们大多奔波于生计工作,能自我支配的体育锻炼时间愈发减少,身体活动量的减少埋下健康隐患。青少年学业的繁忙也致使其有效参加体育锻炼活动的时间减少,针对现有情况及青少年儿童体质健康水平下降趋势愈发显著,对青少年体质健康问题的优化提升刻不容缓。
新时期下多样的、大量的、高效的数据处理必将成为数据发展的方向,现有青少年体质健康问题和青少年体质监测数据处理问题引起人们高度关注。可将学生体质健康测试与大数据体质健康系统上的实际应用、服务提供、功能开发相结合。青少年体质健康检测中,利用关联规则从海量体质健康数据中挖掘出来具有相关性或者连续性的特点,将这些表象化的数据进行实质化分析,创新地利用计算机数据挖掘技术跨学科探究影响山东青少年体质健康的因素及寻求体质健康与久坐、睡眠、面屏时间的关系。
2、研究对象与方法
2.1、研究对象
以山东省13—16岁青少年的体质健康影响因素作为研究对象。
2.2、数据收集方法
(1)资料收集法。
笔者在学校图书馆查阅了以“体质”“身心健康”“健康促进”“大数据分析技术的具体使用”为关键词的相关文献资料,为本研究提供理论基础。查阅和调查的山东省13—16岁青少年的体质健康现状以及国家对青少年体质健康水平的评价标准,为本研究提供了数据支持。
(2)问卷调查法。
采用分级分层整群抽样法,在山东省分别以地级市、区(县)、街道(乡镇)、社区(村)为样本地区,首先综合考虑山东省各地区地理位置(沿海、南部、西部、北部)和经济情况(近五年内人均收入情况),抽取经济发达程度高、中、低的三个城市,同理再从三个城市中抽取经济发达程度高、中、低的三个区(县),并从县中的社区或村中各抽高、低两个社区或村进行简明健康调查和家庭、社会情况调查。纳入抽选范围:以13—16岁的青少年为调查对象,并且在居住地居住三年以上的。
(3)数据挖掘技术。
利用大数据挖掘技术中的关联规则对相关数据进行数据标准化整理、寻找隐藏的影响青少年体质健康的因素以及体质健康与青少年久坐、睡眠、面屏之间的关联或相互关系。该算法的挖掘过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二阶段为从这些高频出现的项目组之间产生关联规则。关联规则中经典算法是Apriori算法,Apriori算法通过层次迭代扫描的策略,挖掘出所有频繁的大项目集。该算法首先扫描一遍数据库,根据最小支持度,得到频繁1-项目集,然后将频繁1-项目集连接在一起得到候选2-项目集,并再次扫描数据库,根据最小支持度剪枝得到频繁2-项目集,以此类推,直到没有新的频繁项目集生成,然后根据最小置信度得出关联规则。从算法的执行过程,我们能够看出该Apriori算法的长处:简单、易理解、数据要求低。
3、概念界定
3.1、关联规则中的基本概念
(1)关联规则。
关联规则(Association Rules)是一种研究数据库中项与项之间关系的方法,最早由20世纪的计算机工程师提出。由于其分析过程简单清晰、结果易于解释,在医疗健康、通信和银行等领域,关联规则被广泛应用。而在青少年体质健康检测中,利用关联规则从海量体质健康数据中挖掘出来具有相关性或者连续性的特点,将这些表象化的数据实质化分析。进而根据这些数据所蕴含的深刻含义进行绘制体质健康报告以及设计运动处方和营养处方,为青少年体质健康的促进提供了另一种有效的方法。
①项及项集
项,指分析数据中的一个对象;项集,就是若干项的项构成的集合。
②事务
事务是指一组相互关联、相互依赖的操作序列。在这些序列中,操作要不全部执行成功、要不全部失败回滚。
③支持度和可信度
支持度指项集数据集中出现的频率,它可以来衡量一个项集的重要性或常见程度。可信度指关联规则的可信程度,用来衡量当前提条件出现时,结果出现的概率。
④频繁项集
频繁项集是指在数据集中出现频率超过给定阈值的项目集合。
(2)关联规则的挖掘流程。
挖掘流程:首先,确定一个已满足support(X=Y)≥minsup且具有可配置的目标(X=Y)。其次,通过给定的minsup函数,在数据集D中寻找支持度大于minsup的项目集。最后,利用第一步中发现的频繁项目集生成规则,并根据minconf筛选出有意义且强大的规则。
本文认为,获取频繁项目是一个关键问题。当支持度(X=Y)≥minsup且配置性(X=Y)≥minconf时,最终目标是X=Y。步骤如下:首先,在数据分析的初始阶段,设定minsup值,并在数据集D中寻找支持度大于minsup的项目集,这些项目集被称为频繁项集;接着,从这些频繁项集中生成关联规则,并在规则算法的约束下,严格按照minconf筛选出所需的强规则项。由此可见,在基于关联规则的交易数据库算法中,频繁项集是一个关键问题。
综上所述,在了解关联规则的内在含义和注意事项的基础上,在体育领域,一些学者提出了一种基于关联规则的体育评价决策支持系统的设计方法。本文将大数据挖掘方法应用于体育信息评价中,结合体育信息评价的先验知识,构造了一个关联规则特征集,利用关联规则特征提取大数据信息融合技术实现了体育评价决策支持系统的数据库结构。在这一阶段,关联规则的应用主要是研究销售业务与工程问题之间的关系。这种方法在体育领域研究应用较少。运用该方法的理论,可以为解决体育领域的实际问题提供大量的数据。本文以山东省青少年体质健康问题及体质测试数据存在的现实问题为导向,综合数据挖掘技术的选择,然后基于关联规则算法探求山东省青少年体质健康影响因素以及其与青少年久坐、睡眠、面屏等因素的关联。
3.2、山东省青少年体质健康影响因素分析
(1)青少年久坐。
通过相关研究发现,中国的青少年在身体活动方面存在较大的缺陷,久坐现象愈发严重。2012年的经济合作与发展会议数据显示,上海市15岁学生的课堂之外的作业和假期文字性的作业时间为14h,这个数据大大高于国际5h的水平,占比为世界之最。2016年上海体育学院国家社科基金重大项目组对全国及新疆建设兵团10万余名学生进行调查,大数据结果显示,仅有不到1/3的儿童青少年能每天参加至少60min的中高强度身体活动,而且对于久坐时间符合标准的也仅只有11.8%的学生,这个数据是随着学业年级递增的,初中和高中年级的学生室外体育活动、身体素质锻炼均低于平均水平。除此之外,儿童青少年每天所面临的学校遗留作业完成时间也比面屏时间要多,是久坐行为产生的最为主要的原因。久坐行为带给儿童青少年的危害是我们无法想象的,甚至会影响他们今后的学习和生活。所以我们在关注青少年体质健康的促进方式的同时也要对久坐行为和面屏时间进行关注,重视久坐行为对儿童青少年产生的巨大后续影响。
(2)青少年睡眠。
截止到目前,许多先进的研究均发现青少年普遍存在睡眠问题。郑静对广州市1099名儿童青少年所信赖的监护人进行调查,最后发现,22.2%的儿童青少年确实存在睡眠不足或睡眠不良的问题。还有学者采用匹兹堡睡眠质量指数对长沙市2216名儿童青少年进行大量调查,发现14.4%的学生存在睡眠不健康的问题。青少年作为祖国的花朵、社会发展的希望,是社会的坚定发展力量,其睡眠和心理健康方面的发展存在紧密的联系,任何一方面出现问题,都会对学生未来的发展产生不良的影响。另外睡眠障碍的研究人群主要是成年人或者是老年人,且随着年龄的增长睡眠问题越来越明显,讨论研究青少年的睡眠问题至关重要且迫在眉睫。
近些年来,关于睡眠质量与手机依赖关系的研究逐渐增多,并取得了一些成果。例如,Shahin(2013)发现,随着青少年对手机依赖性的增加,他们的睡眠质量也在下降。Yogesh等人(2014)对手机使用与睡眠质量之间的关系进行了研究,结果表明,手机使用时长与睡眠质量之间存在显著的负相关。此外,一些研究表明,对手机的依赖对睡眠质量没有直接的影响,而是间接的。例如,Demerce等人(2015)发现,依赖手机直接产生消极情绪,如抑郁或焦虑,间接导致睡眠障碍。中国学者王瑞峰等人(2014)对合肥市中等职业学校学生进行了抽样调查。研究发现,中职生对手机的依赖程度很高,这也会影响他们的睡眠质量。减少使用手机有助于提高睡眠质量。以唐山市青少年为研究对象,发现青少年对手机的依赖是影响青少年睡眠质量的重要因素。
依赖手机的人比不依赖手机的人少。王海青等人(2016)证实,使用手机会影响睡眠质量。这些结果表明,对手机的依赖会直接或间接地影响睡眠质量。因此,不良的手机使用习惯会影响个人的睡眠质量。
一般来说,影响青少年睡眠质量的因素有很多,主要包括传统社会文化因素、家庭因素、青少年的心理和行为特点以及个人习惯等。随着电视、电脑和网络的广泛使用,青少年的睡眠习惯和睡眠时间受到了很大的影响。这也是目前青少年缺乏睡眠的主要原因之一。此外,繁重的学业和考试压力,加上日益激烈的竞争,使得青少年承受了更大的精神压力,失去了学习之外的许多快乐。在一项关于睡眠不足原因的调查中,来自不同国家的研究人员指出,睡眠不足与过度的学习负担、过度使用电脑、在卧室里放置电视以及不良的睡眠习惯等因素有关。
(3)青少年面屏。
随着科学技术的发展,许多电子设备吸引了年轻人。首先,玩耍是青少年的天性。随着科学技术的发展,信息化已成为大势所趋。电子设备已经成为许多青少年的“好伴侣”。许多青少年因缺乏自制力被电子设备所吸引。他们经常长时间使用电脑、手机、电子游戏等电子设备,不仅浪费了学习时间,甚至占用了锻炼时间。其次,饮食不规范也是严重危害青少年健康的“罪魁祸首”。有些青少年不喜欢吃蔬菜和水果。他们只是喜欢吃肉。吃的时候,他们只选择自己喜欢的菜,像一些油炸食品、软饮料和其他含有大量食品添加剂的食品,营养极不均衡。虽然在短时间内对青少年的健康几乎没有影响,但随着时间的推移,负面影响将一个接一个地暴露出来。
4、结束语
13—16岁的青少年正处于人生的关键阶段,面对巨大的学习压力,学生的健康也很重要。青少年处于特殊的生理发展阶段,需要逐步增强体质。人类的健康发展一直是卫生保健领域关注的焦点,这不仅反映了一个国家或地区的经济、健康和人口素质,也是衡量这些指标的重要方式。为了减少儿童和青少年的久坐时间,减少和消除不良行为,促进养成健康的生活方式,促进身心功能的全面发展,可以对个体进行家庭、学校、社区和其他层次的干预。本文通过关联规则技术创新地利用计算机数据挖掘技术跨学科探究体育问题,深层次探求了影响山东青少年体质健康的因素以及与其青少年久坐、睡眠、面屏等的关联。
参考文献:
[1]薛辉,韩永毅.在证券行业中挖掘有价值“大数据”的探讨[C]//中国新闻技术工作者联合会.中国新闻技术工作者联合会2015年度“新闻科技论文”优秀论文集.中国证券报,2015.
[2]刘华婷,郭仁祥,姜浩.关联规则挖掘Apriori算法的研究与改进[J].计算机应用与软件,2009,26(01).
[3]刘超臣,刘思言.家庭对青少年体育行为习惯养成的影响[J].当代体育科技,2021,11(17).
[4]牛猛.关联规则的基本研究[J].河北工程大学学报(社会科学版),2016,33(02).
[5]柳玉巧.聚类分析和关联规则技术在成绩分析中的研究及应用[D].武汉:华中师范大学,2014.
[6]黄琨.基于大数据的青少年体质健康与高血压的关联研究[D].武汉:湖北大学,2020.