基于支持向量机的高校大学生“网瘾”模式识别研究

2021-07-14 13:19夏士岚覃希刘梦娟
管理学家 2021年9期
关键词:网瘾模式识别支持向量机

夏士岚 覃希 刘梦娟

[摘 要] 文章针对现行高校大学生潜在的“网瘾”问题,提出基于支持向量机的“网瘾”模式识别方法。通过问卷调查和实际调查两种形式获得实验数据,借助计算机学科中的支持向量机算法对实验数据进行模式识别,并对识别结果进行分析、核验。实验结果表明,该方法能有效辅助高校管理者及时发现具有“网瘾”特征的学生。

[关键词] “网瘾”;支持向量机;模式识别;大学生;高校

中图分类号:G647 文献标识码:A 文章编号:1674-1722(2021)09-0001-03

★基金项目:广西高校本科生潜在网瘾威胁预测与防控研究研究阶段性成果(项目编号:2015LSZ032);广西大学大学生潜在网瘾威胁预测与防控研究研究阶段性成果(项目编号:XGS1437);广西高等学校大学生思想政治教育理论与实践研究课题

21世纪是一个网络时代,大学生群体既是潮流的先锋,又极易迷失在网络世界,导致自我封闭、学习成绩下降。更有甚者,导致精神抑郁、品行障碍、情感分裂、人格分裂、自杀行为或青少年犯罪等。这就是人们俗称的“网瘾”现象,对高校大学生的“网瘾”问题应当予以高度重视。笔者利用支持向量机数学模型,通过对高校大学生的问卷数据和实际调查数据进行挖掘分析,及时发现具有“网瘾”特征或潜在“网瘾”特征的个体,并对其实施及时的教育引导。

一、相关概念的界定及研究背景

(一)大学生“网瘾”

“网瘾”的概念,最初由美国心理学家格登博格(Goldberg)提出,随后,匹兹堡大学的金伯利·扬博士(Dr.Kimberly Young)发展完善了他的这一概念。“网络成瘾”(IA)、“网络成瘾症”(IAD)或“病态网络使用”(PIU),是指在无成瘾物质作用下的上网行为冲动失控,表现为由于过度使用互联网而导致个体明显的社会、心理功能损害。中国青少年网络协会在2005年发布的《中国青少年网瘾报告》中对“网瘾”做出了如下界定:在认同“上网给青少年的学习、工作或现实中的人际交往带来不良影响”前提下,如果满足了以下三个条件中任何一个,就认为该网民从一定程度上具有网瘾特征,即判定属于“网瘾”。1.觉得在网络中比在现实生活中更快乐或更能实现自我;2.每当因特网的线路被掐断或由于其他原因不能上网时会感到烦躁不安、情绪低落或无所适从;3.向亲人隐瞒了自己上网时间。

(二)支持向量机

支持向量机(SVM)是一种用来具体实现统计学习理论核心思想的一种通用的学习方法。SVM由统计学习理论(SLT)和结构化风险最小化原则(SRM)派生而来,是借助最优化方法实现机器学习的数据挖掘利器。它能从小样本中提取必要信息,能解决非线性问题,适用性广,不会产生局部极小值。因此,SVM可以摆脱传统统计学中“以大数据为实验基础”的束缚,采用小样本即可解决分类、预测等问题[1]。SVM的数学机制如图1所示,分类问题最终是要找到最优分类面。图1中实心点和空心点代表两类样本,H为分类线,H1、H2分别为过两类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。若能将两类数据正确分开,并且使分类间隔最大,此时的H为最优分类线。由此概念可推广得出最优分类平面的概念。虚线上的少量样本称之为支持向量,支持向量机也因此得名。

二、大學生“网瘾”成因分析

(一)个人因素

很多学者在研究中强调了个人因素以及生理机制对于大学生“网瘾”的影响。个人因素主要包括大学生的性格、社交圈、人生观、培养环境等方面。性格内向的学生更喜欢使用网络进行社交。尤其对于自信心不足、表达能力不好的学生在传统的交流方式下他们不善于表达自己内心的想法,而面对网络所提供的方式就很喜欢。目前网络社交的方式除了聊天以外就是网络游戏。大学生在心理上长期依赖网络,久而久之就形成“网迷”或“网瘾”习惯。大学生正常的社交圈人群多为同学、老师,交流的内容是经过校园环境净化、筛选的精英主流文化。而具有“网瘾”的大学生其社交圈人群是很复杂的,社交圈内所交流的内容往往都是未经过滤的社会信息,这些信息中往往掺杂黄色、暴力文化、错误偏激认识等。因为成长的社交圈不同,所以造就“网瘾”大学生和非“网瘾”大学生。所以,大学生的个人因素跟“网瘾”的形成有重要关系。

(二)家庭因素

家庭因素是大学生“网瘾”问题的根源。据有关研究显示,家长从小的教育方式深刻影响着大学生在校的行为。实际上,教育是家庭、学校、社会三者结合的产物,而家庭教育是教育体系的基础。大学生在高校中出现“网瘾”问题往往是长期家庭环境所致。父母缺乏关爱、错误的家庭教育方法等因素造成孩子心灵上的空缺,孩子只能通过网络来弥补。进入大学后,离开父母的约束,他们习惯性地通过最熟悉的网络来满足自己,最终导致出现“网瘾”的现象。因此,家庭中父母的情况、亲情关系、教育方式都影响在校大学生对网络的使用状态。

(三)学校因素

在教育体系三元素中,学校是教育的主体,承担着主要的教育任务。大学生在学校的学习环境、专业教学情况、同学氛围都将影响大学生在学校的发展。教学设施是否完善、大学生对所学专业是否感兴趣、同班或同宿舍同学的学习态度都会影响大学生个体的发展。当大学生个体在学校发展不好时,普遍通过网络来消除烦恼,如果大学生长期处于低迷状态并通过网络来解脱,这就有可能形成“网瘾”习惯。

(四)社会因素

随着信息时代的到来,网络已经成为人们生活中必不可少的元素。这使得人们足不出户也能满足生活需要。但是现阶段的网络社会发展还不够健全,仍无法跟真实社会等同。有的大学生长期只通过网络进行社交,只接受网络规则的熏染,对真实社会的规则不能适应,甚至无法接受。久而久之,真实大学生个体对真实世界产生排斥感,反而对网络世界充满喜爱。最终,大学生只能依赖网络生存,形成“网瘾”习惯。

三、建立大学生潜在“网瘾”预测模型

本文设计的大学生潜在“网瘾”预测模型是基于SVM理论的分类预测模型完成的。模型中的各个维属性根据大学生“网瘾”的成因进行归纳而得。属性根据性质分为4组,共27维属性值[2]。

第一、二组:父亲/母亲信息

职业{1: 单位干部,2: 普通白领,3: 工人,4: 务农}

文化程度{1: 大学及以上,2: 大学以下}

收入{1: 5000元以上/月,2: 5000~3000元/月,3: 3000~1000元/月,4: 100 0元以下/月}

年龄{1: 60以上,2: 50多,3: 40多,4: 40以下}

第三组:家庭关系信息

1.父母关系{1:和睦,2:不和谐,3:离异}

2.是否为独生子女家庭{1:是,2:否}

3.家里有无电脑{1:有,2:无}

4.父母一直为你设计好一切{1:是,2:否}

5.父母对你管教如何?{1: 非常严厉、事事干涉,2:正常关心,3: 有求必应,4: 不闻不问}

6.当你犯错误时父母采取什么方式?{1: 打骂,2: 讲道理,3: 不理睬}

7.跟父母有代沟吗?{1:有,2:无}

第四组:个人信息

1.政治面貌{1: 党员,2:团员,3:群众}

2.性格{1:外向,2:内向}

3.在大学中人际关系如何?{1: 朋友很多、社交很广,2: 社交圈一般,只跟本班同学熟,3: 没有什么朋友,常感到孤单寂寞}

4.目前是否谈恋爱?{1:是,2:否}

5.进入大学后的成绩如何?{1:一如既往的好,2:比高中时好,3:比高中时差,4:一直一般,5:一直不好}

6.喜欢本专业吗?{1:喜欢,2:不喜欢}

7.进入大学时是否给自己定有学习/工作上的奋斗目标?{1:是,2:否}

8.目前是否仍朝着目标努力?{1:能,2:不能}

9.无人提醒时能否自主学习?{1:是,2:否}

10.经常自己的事情自己决定{1:有,2:没有}

11.上大学前有无接触过电脑?{1:有,2:没有}

12.上大学前有无接触过网游?{1:有,2:没有}

四、实验操作过程

(一)准备阶段

实验数据通过发放问卷获得。实验对象选取广西大学计算机与电子信息学院2019级(当年大一)、2018级(当年大二)、2017级(当年大三)三个年级的大学生。共发放问卷数量1000份,回收934份,有效问卷929份。我们将回收的问卷数据录入数据库,并对数据进行数据类型转换,将文本型的问卷数据转换成数值型数据。本实验的SVM模式识别借助libSVM算法包完成,因此要以libSVM的分类格式规范源数据。另外,SVM分类预测需要准备两个集合:训练集和测试集。于是我們将2017级、2018级的大学生数据作为训练集,将2019级大学生数据作为测试集。剔除不规则数据后,得到训练集数据670条,测试集数据264条。

(二)数据状态的审定

实验中“-1”表示网瘾状态,“1”表示正常状态。SVM利用训练集来习得预测模式,训练集中每一名同学的分类情况要尽可能的符合实际[3]。因此,训练集状态的审定是至关重要的。训练集中的数据由老生(2017级、2018级的大学生)数据组成。通过对老生长期在校的表现、欠学分情况、大多数同学的反馈,很容易可以知道老生中具有显性网瘾表现的同学,以此得到训练集中的数据状态。

对于测试集而言,数据来自新生(2019级大学生)。利用SVM的分类功能来识别新生的状态,最后对预测的情况进行评测。新生经过一个学期的观察后,满足以下条件的判定为具有潜在网瘾威胁:

在校表现:平时旷课时数≥5学时

考试情况:正考不及格科目数≥3门

宿舍调查:使用电脑从事上网活动超过≥6小时

(三)评测指标

实验设定3个评测指标来评测试验结果:精确度、漏检率、误检率。其中精确度用来衡量实验方法的准确程度,公式如下:

精确度=实验得到的状态跟审定状态相同的人数/新生总人数×100%

漏检率用来描述实验方法把有“网瘾”学生误判成了无“网瘾”学生的错误程度,公式如下:

漏检率=(实际状态为有“网瘾”但识别为无“网瘾”的新生人数)/新生总人数×100%

误检率用来描述实验方法把无“网瘾”的学生误判成了有“网瘾”的学生情况,公式如下:

误检率=(实际是无“网瘾”但实验识别为有“网瘾”的新生人数)/新生总人数×100%

(四)实验数据分析

实验结果的评测标准是经审定后的测试数据状态。将审定的数据状态分别跟SVM实验预测状态和问卷调查得到的状态经行对比。结果如下表所示:

从表中精确度一栏看出SVM的精确度是88.46%,问卷调查得到的精确度是90.76%。虽然SVM比问卷调查得到的精确度要略低,但经过进一步对比发现,SVM的“网瘾”漏检率是17.6%,问卷的“网瘾”漏检率是44.1%,问卷比SVM预测的“网瘾”漏检率高出26.5个百分点。这说明,使用问卷的调查方式很难获取潜在“网瘾”状态,即被调查者更倾向于将自己认为是无“网瘾”的。而使用SVM预测获得的“网瘾”状态相对来说更客观。SVM是通过计算被调查者的特征,将其根据模式归类得到的结果。SVM能更客观地挖掘潜在的“网瘾”情况。从非“网瘾”误检率看出,SVM的偏高,问卷的偏低。这也说明了,问卷调查过程中,被调查者更偏向于将自己填写成非“网瘾”状态,所以问卷的非“网瘾”误检率低;而SVM通过计算来挖掘,会把一些本来是认为自己是正常的大同学误检成是“网瘾”状态。

综上所述,在挖掘“新生中具有潜在‘网瘾威胁”的过程中,SVM的挖掘效果更好。虽然SVM在尽可能发现具有“网瘾”威胁大学生的同时,会把小部分无“网瘾”的大学生误认为是有“网瘾”的,但这种误检,在实际中对大学生工作的开展没有任何阻碍。相反,若将有潜在“网瘾”威胁的”漏检,在实际工作中辅导员和班主任会因此错过对新生最佳的引导和教育时机,最终导致更多“网瘾”大学生的出现。

五、结语

目前针对大学生“网瘾”问题普遍的解决措施有两大方面。一是针对已经有明显“网瘾”状况的大学生所采取的补救措施,二是为了防止“网瘾”的发生而针对所有大学生采取的有效措施。前者属于亡羊补牢,收效甚微;后者属于漫天撒网,费时费力,工作没有重点,它们都不能从根本上解决这一问题。利用笔者提出的基于支持向量机的大学生潜在“网瘾”威胁预测方法,可以利用老生的特征数据,对新生进行预测。预测结果能为高校辅导员及大学生工作者提供有针对性的大学生群体名单,进而可以根据大学生的具体情况对该群体实施预防性的心理辅导教育。

参考文献:

[1]危雅玲.青少年网瘾治理的困境及对策研究 ——以南京市为例[J].南京师范大学,2020(01):66.

[2]覃希,夏宁霞,苏一丹.基于支持向量机的垃圾标签检测模型[J].计算机应用研究,2010,27(10):3893--3895.

[3]肖丹.社会化理论视域下网络成瘾大学生思想政治教育途径研究[J].西南石油大学,2017(05):49.

猜你喜欢
网瘾模式识别支持向量机
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
中学生网络依赖(网瘾)形成的个人影响因素及其应对措施
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
汽车外观造型创新设计遗传算法的应用
独立院校大学生网瘾形成的原因及对策研究
医学生网瘾成因及防治方法研究
基于熵技术的公共事业费最优组合预测
自动洁地机器人的设计
基于支持向量机的金融数据分析研究