多源数据分析大学生发展需求对心理压力的影响

2023-05-30 21:46黄强胡荣王晗宇
计算机应用文摘 2023年3期
关键词:心理压力数据分析数据挖掘

黄强 胡荣 王晗宇

关键词:数据分析;数据挖掘;大学生发展;心理压力

大学阶段是大学生从相对封闭的校园环境到完全开放的社会环境的过渡适应期,是世界观、人生观、价值观逐渐成型的重要时期,也是身心发展最活跃、心理压力多发的时期。这个阶段的大学生面临适应大学生活、学习专业知识、处理人际关系、思考恋爱问题、规划职业生涯、选择就职职业等一系列重大的人生课题。但与之相反的是,大学生在现阶段身心发展尚未完全成熟,自我认知和调控能力以及自我抗压能力不强,容易冲动行事、我行我素,往往事与愿违,从而产生较强的心理落差和心理压力。另有研究表明,重大公共卫生事件本身对大学生心理健康会产生影响,而且由于常态防控导致未来发展的迷茫会进一步加重大学生的心理压力。本文通过问卷调查、网络爬虫采集有关大学生考研考公及就业的多源数据,分析新就业、考研形势对大学生心理压力的影响,并提出建议措施,力求缓解当今大学生面对未来发展需求所面临的心理压力。

1大学生未来发展需求数据分析

本文有关大学生未来发展需求数据采集是通过问卷星对524名在校大学生进行调查获取的。调查问卷中提供的未来发展选项包括考研、考公、考证、就业、留学及其他选项。从数据的描述性统计来看,524名大学生中57.63%选择就业,占比最大,其次48.47%及40.84%选择考研考公,36.83%选择考证,极少数人选择留学及其他选项。

1.1未来发展选项一对一关联规则分析

关联规则最初由“数据挖掘之父”Rakesh Agrawal提出,提出的动机是针对购物篮分析问题。后于1994年开发了第一个关联规则挖掘算法Apriori,至今仍然作为关联规则挖掘的经典算法被广泛讨论,此后诸多研究人员对关联规则的挖掘问题进行了大量的研究。一对一关联规则的形式如:X=y,X和y是事务集合的真子集,并且X和y的交集为空集,其中X被称为蕴涵式的前件,y被称为蕴涵式的后件。关联规则有时候也表示为“如果……那么……”,即如果x,那么y,前件是蕴涵式规则成立的条件,后者是条件下发生的结果。关联规则分析中有两个重要的参数——支持度(SLLpport)和置信度(Confidence),它们的计算公式为:

针对在校大学生未来发展选项的关联规则分析,首先将问卷调查所获得的数据读取到Python中并进行适当切片,而后将数据集合作为项集,其中每一个数据集合作为事务。然后,采用布尔关联规则将事务数据集转换为布尔值(0或1)的数据集。如图1所示。

为方便分析,设置一对一关联规则分析的最小支持度和最小置信度均为0。然后定义列表存取两两一组的强规则和支持度与置信度,利用For循环对每一个选择与后面的选择与之关联度匹配,支持度建立于两个选项同时选择,而置信度建立于选择一个选项条件下选择另一个选项的概率,且支持度与置信度均大于等于最小支持度和最小置信度即可,最后将结果保存导出到Excel表中。如图2所示。

从以上分析结果可以看出,支持度最高的规则为同时选择考研一考公、考研一就业、考公一考研、考公一就业、就业一考研,其中置信度从高到低依次为考公一就业、考公一考研、考研一就业、考研一考公及就业一考研。因此,被调查大学中大部分选择先考公、考研,后就业的方式。另外,考研和考公同时选择的人数也较多,支持度较高,说明考公、考研仍然是在校大学生未来发展最佳选项。除了受传统认知的影响外,近年来由于疫情导致的就业不稳定以及需求放缓等因素影响,考研、考公成了大学生缓解就业压力和谋求个人发展的优先选项。

1.2国内考公考研数据分析

考公考研数据的采集主要是通过Python网络爬虫从公共部门教育网站以及正规考公培训机构网站爬取的,包括历年招录数据和地区招录数据,并将相关数据通过Echarts进行数据可视化。具体如图3、图4所示。

利用Python对国内考公地区招录数据进行分析,通过Pandas读取数据,设置横轴代表地区、报考人数、职位数和报录人数,纵轴代表竞争比,再利用机器学习中的标准化处理库对数据进行定义,最后导人机器学习包的K-均值聚类模块设置聚类个数和迭代次数,之后进行K一均值聚类。聚类结果标签从3到0降序排列,其中北京、广东为一类;西藏、青海、贵州、宁夏、甘肃、重庆、陕西、天津、海南为二类;四川、云南、河南、河北、广西、湖北、山东、福建等为三类;新疆、湖南、内蒙古、山西、辽宁、吉林、黑龙江等为四类。北京和广东地区国考竞争比最大,青海、海南、贵州等地区竞争比较第一类弱,而四川、云南等地区竞争比一般,故较多人会选择这类地区进行报考,而竞争比最小的地区为新疆、山西和内蒙古等。

利用Python对国内考研报录数据进行线性回归分析,通过Pandas读取数据,利用切片将需要计算的数据——报名人数、增长率和录取人数,作为线性回归的X轴坐标值,报录比作为y轴坐标值。然后导人线性回归模块、创建线性回归对象并使用fit()函数进行先进性拟合训练,再利用score()方法返回拟合优度的判定系数、获取回归系数和常数项[1]。

在获得线性回归模型后可以进行2022年考研招录比预测,导人NumPy库以数组形式存放2022年考研报考人数,增长率和录取人数并用于最后预测,之后通過机器训练在线性回归系数和常数项下利用一元线性回归公式进行科学计算,得到2022年考研报录比预测值为4.38。

绘制历年考研报录比散点图(如图5所示)。

1.3计算机类专业就业岗位数据分析

通过Python网络爬虫爬取国内某知名招聘网站计算机有关的四个岗位,包括Java开发、前端开发、软件测试及运维岗位数据,并存放于本地Excel文件中,再利用Python数据框读取数据并连接数据库,将数据框的数据利用“append()”方法依次导人数据库的数据表。最后建立路由和设置jobjava,jobWeb,jobTest,jobNetwork列表,在成都招聘版块实现四个页面的数据可视化,具体采用列表形式将每一条招聘数据以~行显示[2]。如图6所示。

2大学生校园学习生活状态数据分析

通过问卷星對524名大学生课外生活问卷调查以及588名在校大学生校园学习生活关键词调查,课外生活调查问卷提供了运动、逛街、泡图书馆、蹦迪、探店/打卡网红店、看电影、听歌、追剧、聚餐及其他选项,关键词调查问卷提供了内卷、间断性躺平、疫情、封校、忙碌、考试、美食、学习、恋爱及其他选项。从调查结果描述性统计分析显示,课外生活选项排在前三的分别是追剧(60. 11%)、看电影(59.16%)、听歌(54.2%),如图7所示。关键词选项排在前四名的选择依次是内卷(75.68%)、封校(75.51%)、疫情(71.09%)、间断性躺平(59.35%)。可以看出,前几年随着疫情防控的常态化,高校大学生较长时间居家或在校封闭学习和生活,大环境的改变已然很大程度上影响了大学生的心态、学习和生活,导致心态不够乐观、学习效率降低、人际交往减少、运动实践不足等消极结果。具体如图7、图8所示。

3大学生未来发展需求产生的心理压力影响及对策

通过以上多源数据分析,一方面是考公考研、就业等竞争压力越来越大,另一方面是疫情防控常态下大学生学习生涯自我效能降低,从而进一步加重了未来发展需求产生的心理压力。

3.1考公考研心理压力及对策

从国内考公地区招录竞争比K一均值聚类分析可以看出经济相对发达、福利待遇相对较好的地区的国考竞争大。从国内考研报录数据线性回归分析得到2022年考研招录比预测值,可以看出招录比在考研人数上升情况下仍呈现上涨趋势,比2021年增加了近一倍,但由于报考人数同样翻倍,可以看出考研竞争很大。由此可见,大环境的变化促使就业困难加剧,考研人数激增,大部分学生转战考研导致大学生在疫情后考研压力激增。面对日益增大的考公考研压力,高校应该组织专门队伍帮助学生做好职业生涯规划,根据个人性格特质、行为偏好等确定是否适合考公考研,再根据个人学习能力选择适合的目标单位[3]。另外,要注意激励学生提升自我效能,避免焦虑型考公考研。选择考公考研是许多大学生渴望认识自己、提升自我的一种表现,但随着竞争日益激烈,考生在备考过程中往往会出现焦虑等消极心理,应当学会自我暗示,以内心的主观想象和独白对自己进行潜移默化的言语或者行动暗示,从而减轻心理负担。

3.2就业心理压力及对策

从就业数据分析结果来看,计算机类专业就业岗位薪资待遇高于其他行业平均水平,而且普遍集中在经济相对发达地区,生活条件较好,但与之匹配的岗位技能要求也越高,这与大学生在校学习所掌握技能不匹配。同时,疫情防控背景下留学渠道受到影响,部分留学生归国就业,导致大学生就业市场面临的挑战只增不减。此时,就业学生容易出现焦虑、自卑、胆怯、盲目、从众等心理问题。因此,高校教育教学管理者应当尽早引导学生规划职业生涯,引导学生择业时从个人理想、价值观、能力水平、综合素质等方面认真审视自己,分析自己的优势和劣势,了解社会和用人单位对人才的需要,结合自身特点来选择自己的人生位置。

猜你喜欢
心理压力数据分析数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
缓解心理压力10法
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
警察心理压力现状及应对策略
消防员心理压力状况调查
一种基于Hadoop的大数据挖掘云服务及应用
通过图片看内心
基于GPGPU的离散数据挖掘研究