徐炜君, 魏 勇, 原大明, 刘东升
(1.东北石油大学秦皇岛分校,河北 秦皇岛 066004; 2. 燕山大学理学院,河北 秦皇岛 066004)
基于GA-SVR的大学生手机依赖预警系统
徐炜君1, 魏勇2, 原大明1, 刘东升1
(1.东北石油大学秦皇岛分校,河北 秦皇岛 066004; 2. 燕山大学理学院,河北 秦皇岛 066004)
针对手机依赖严重影响大学生课堂学习效率的问题,利用GA优化SVR的惩罚因子C、不敏感损失参数ε和核函数参数γ,设计了一种大学生手机依赖预警系统.系统通过手机APP发布和回收手机依赖调查问卷,避免了问卷的发放、收集和数据录入分析等繁琐的工作.系统通过问卷数据建立的GA-SVR预警模型,可以较为准确的预测出学生的综测成绩进而给出预警信息.系统的统计分析功能可以实现任意时段预警信息的统计分析,便于教学管理者和教师掌握学生整体状态并采取应对措施.实际运行结果表明,系统可以自动的进行手机依赖的预警和统计分析,系统分析结果可信、可靠.
遗传算法;手机APP;支持向量回归机;预警系统
随着信息技术的快速发展及手机功能的日新月异.手机已经成为人们日常生活的重要组成部分.人们不仅可以利用手机进行通信、视频聊天,还可以用它来完成搜索定位、网游、网购等活动.不可否认,手机给人们的生产生活提供了许多便利,但同时也带来许多负面影响,其中影响最大的问题就是手机依赖.
大学生占手机用户的很大比例,与其他的手机用户相比,大学生更能充分利用智能手机的功能,对手机依赖程度高于其他群体.手机依赖是对手机的过度依赖使用,对身心健康及学习生活产生负面作用的行为[1].智能手机的长期使用会导致大学生思维的惰性,影响其学习成绩,甚至脱离现实形成非正常的 “依赖”[2].大学生手机依赖的程度与课堂学习效率存在显著的负相关,且与课堂学习效率的不同维度也存在显著的负相关,这表明手机依赖严重影响了大学生的课堂学习效率及学习成绩[3].
目前,手机依赖已经引起了国内外众多学者的普遍关注,他们根据自身的学科背景和研究目的,从心理学、生理学、社会学和统计学等各个不同的视角对手机依赖进行了卓有成效的研究[4].
本文结合笔者的学科特点,从人工智能的角度探究手机依赖对大学生学习的影响,提出了一种手机依赖预警系统.系统以手机成瘾指数量表作为问卷调查的基础制作手机依赖调查问卷,采用手机APP发布和回收该调查问卷,并结合问卷学生的综测成绩形成支持向量回归机(SVR)的训练数据,通过遗传算法GA优化SVR的参数(C、ε、γ),进而设计了大学生手机依赖预警系统,该系统可以根据上述问卷来预测参与问卷学生的学习成绩是否会受到手机依赖的影响而下滑,如果有影响系统会给出预警信息,这样便于教学管理者和教师及时掌握学生的动态并采取应对措施.
系统结构如图1所示,主要由手机APP、服务器、手机依赖预警模型及预警结果统计分析4个部分组成.该APP将发布和回收的调查问卷数据上传到服务器的数据库中;服务器将收集的问卷数据按照年级、专业整理后作为手机依赖预警模型的训练样本和预测样本;建立在GA-SVR基础上的手机依赖预警模型利用训练样本得到模型参数并对预测样本进行预测和预警;系统还可以进行预警结果的统计分析.
1.1手机APP设计
APP 是指应用在智能手机或平板电脑上的第三方应用程序.随着智能手机等移动终端设备的普及,APP 的应用也得到了长足的发展.目前,通过 APP进行的移动调查应用已经非常普遍.与传统的问卷调查相比,APP调查融合了移动设备触屏、扫码、定位等功能,具有使用便捷、快速、安全等优势.因此,APP已经成为一个能够收集各种数据的独特平台[5].本系统的手机APP主要用来发布和回收手机依赖调查问卷,调查问卷以香港中文大学梁永炽教授编制的手机成瘾指数量表(Mobile Phone Addiction Index,MPAI)作为调查问卷基础,并结合问卷学生上一学期综测成绩排名及其自然属性形成.该APP用JAVA开发,可通过JDBC(Java Data Base Connectivity)与服务器中的MySQL数据库进行数据交互.手机APP界面如图2所示.
图1 系统结构框图Fig. 1 System structure diagram
图2 APP调查问卷界面Fig. 2 Questionnaire interface of APP
1.2手机依赖预警模型
手机依赖预警模型主要以支持向量回归机(SVR)作为预测算法,利用手机APP得到的问卷样本数据对该模型进行训练进而得到模型参数.预警模型能根据参与问卷者的手机依赖程度预测出其将来的综测成绩,该预测成绩与其上一学期的实际综测成绩进行对比,如果出现一定的下滑则给出预警信息.
1.2.1预警建模算法——支持向量回归机(SVR)
1995年俄罗斯科学家Vladimir Vapnik[6]首次提出了支持向量机(Support Vector Machines, SVM)理论,它是一种有监督的学习过程,通常用来进行分类(Support Vector Classification,SVC)及回归预测分析(Support Vector Regression,SVR).非线性支持向量回归机主要是通过对输入空间进行非线性变换升维后,在高维空间中构造线性决策函数来实现线性回归,从而得到输入空间的非线性回归.升维变换一般通过核函数来实现,核变换后的决策函数如式(1):
y=wT·φ(x)+b.
(1)
在约束条件可以实现的情况下,通过寻找最优w和b,得到最优化问题为:
(2)
(3)
通过引入拉格朗日乘子,式 (3)可以转化为:
(4)
k(xi,xj)=e-γ‖xi-xj‖2.
(5)
式中:γ>0是RBF的核函数参数.
由式(4)、(5)可见,通过对参数(C、ε、γ)的优化组合可以确定具体的SVR形式[9],进而实现对预测对象的精准预测.
图3 GA寻优(C、ε、γ)流程图Fig. 3 GA optimization (C、ε、γ) flow chart
1.2.2遗传算法(GA)对SVR参数的优化
遗传算法(Genetic Algorithm,GA)是一种基于生物界自然遗传和选择适合解决优化问题的自适应优化算法[10-11].本文利用该算法对SVR的参数(C、ε、γ)进行寻优组合,参数优化的流程如图3所示.寻优过程中采用均方根误差RMSE作为适应度函数,其公式为:
(6)
1.2.3数据的选取和预处理
本预警系统是一个动态的跟踪预警过程,数据的获取是一个动态过程.系统设计过程中,在每个学期的固定时间(如开学初、期中以及期末3个时间点)要求学生作答问卷并提交.
1)预警模型训练数据的获取:在MySQL数据库的调查问卷数据中,随机抽取100份2014-2015学年第二学期期末采集到的调查问卷数据并结合该学期期末的综测成绩形成预警模型的训练样本集.由于样本集中的数据具有不同的数据类型,所以需要对每个样本数据的各个分量按照式(7)进行归一化预处理,将所有数据均归一化到 [0,1]的范围内.归一化后的训练样本就可以对预警模型进行训练进而得到模型参数.
(7)
其中:yi(j)为分量,yimax(j)和yimin(j)分别为第j个分量的最大和最小值,xi(j)为归一化后的分量,i=1,2,...,n,n为样本数;j=1,2,...,m,m为样本属性数.
2)预警模型测试数据的获取:为了验证系统的预测精度和可靠性,在数据库中随机抽取10份2015-2016学年第一学期期中采集到的调查问卷数据并结合该学期期末的综测成绩形成预警模型的测试样本集.测试样本集的归一化方法与训练样本集相同且两个样本集数据应该一起进行归一化处理.
图4 综测成绩预测曲线Fig. 4 Forecast curve of comprehensive test result
将1.2.3中经过归一化后的训练样本集的综测成绩作为SVR的训练目标输出,问卷数据作为SVR的训练输入.首先用GA算法寻优参数(C、ε、γ),得到SVR的最优参数分别为:C=88.0463,ε=0.0019,γ=0.1325,然后用该训练样本训练SVR进而建立手机依赖的预测模型,最后通过该模型,用测试样本得到综测成绩的预测结果与对应学期的实际综测成绩对比(如图4所示),采用RMSE、复测定系数R2和平方相关系数SCC评价预测模型的精确度和可靠性.
为了验证本文提出算法(GA-SVR)的精确度和可靠性,与粒子群优化支持向量机模型(PSO-SVR)作比较(PSO优化的参数为:C=2.7269,ε=0.01,γ=0.01),比较结果如表1.从表1可以看出,GA-SVR预测模型的RMSE要比PSO-SVR低出约 2.58%,复测定系数R2比PSO-SVR高出约0.16,平方相关系数比PSO-SVR高出约0.057,这说明本文提出的算法有较高的预测精度和可靠性,其学习能力和泛化能力也得到了提高.
表1各预测方法比较
Tab. 1Comparison of different prediction methods
预测方法RMSE%R2平方相关系数SCCPSO-SVR12.130.58080.8956GA-SVR9.550.74050.9524
表2预警结果统计分析表
Tab. 2Statistical analysis of warning results
时间段自然属性人数预警人数百分比%2015年10月—2015年12月性别男1001515女8678.14年级大二9799.28大三53611.32大四36719.44
对每学期中任意时刻的问卷数据利用上述的预警模型进行预测得出其预测的综测成绩,该成绩与其最近一学期的实际综测成绩作比较,如果出现成绩下滑,则给出预警信息.系统的统计分析功能可以对任意时间段的预警信息给出统计分析(见表2),这样便于了解学生的学习情况和状态进而采取应对措施.
本文提出的基于GA-SVR的大学生手机依赖预警系统,利用遗传算法GA优化SVR的惩罚因子C、不敏感损失参数ε和核函数参数γ,使其预测精度和可靠性都得到了较大的提高.系统通过手机APP发布和回收手机依赖调查问卷,避免了问卷的发放、收集和数据录入分析等繁琐工作.以学生的综测成绩作为预测输出的GA-SVR预警模型,可以根据问卷数据较为准确地预测出学生将来的综测成绩进而给出预警信息,这样便于教学管理者和教师及时掌握学生的动态并采取应对措施.实际运行结果表明,本系统可以自动进行手机依赖的预警和统计分析,系统分析结果可靠.
[1] 李止庸.国内外“手机依赖对大学生学习行为的影响”研究综述[C]//中国商品学会第十四届学术论坛暨中韩商品科学交流会议论文集.北京:2011:182-131.
[2] 孙芳,王为正,刘佳帅.智能手机对大学生的影响分析——以H师范大学的实证调查为例[J].哈尔滨师范大学社会科学学报,2015(4):169-173.
[3] 许国成,黄黎,魏莉莉,等.大学生手机依赖与课堂学习效率的关系研究[J].浙江理工大学学报(社会科学版),2014,32(6):535-538.
[4] 贾悦.国外手机依赖研究综述[J].北京邮电大学学报(社会科学版),2015,17(3):74-79.
[5] 王云峰,史菁菁,毛春芳.App应用于跟踪调查的可行性分析[J].中国科技信息,2016,16(1):69-70.
[6] VAPNIK V N.The nature of statistical learning theory[M]. New York:Springer,1995:280-292.
[7] HSU C W, LIN C J.A simple decomposition method for support vector machine[J].Machine Learning,2002,46(123):219-314.
[8] 舒坚,汤津,刘琳岚,等.基于模糊支持向量回归机的WSNs链路质量预测[J].计算机研究与发展,2015,52(8):1842-1851.
[9] 王晓文,梁岚珍.基于PSO-SVR算法的燃煤锅炉结渣特性预测[J].化工自动化及仪表,2013,40(6):742-745.
[10] 张秀玲,徐腾,赵亮,等.基于GA-PIDNN的液压弯辊控制系统设计[J].中南大学学报(自然科学版),2014,45(11):3800-3804.
[11] 刘爱国,薛云涛,胡江鹭,等.基于GA优化SVM的风电功率的超短期预测[J].电力系统保护与控制,2015,43(2):90-95.
Warning System for Mobile Phone Dependence of College Students Based on GA-SVR
XU Weijun1, WEI Yong2, YUAN Daming1, LIU Dongsheng1
(1.Northeast Petroleum University, Qinhuangdao 066004, China; 2. School of Science, Yanshan University, Qinhuangdao 066004, China)
For the mobile phone dependence seriously affects college students’ classroom learning efficiency, using GA to optimize the SVR penalty factor C, insensitive loss parameter ε and kernel function parameter γ, a warning system for mobile phone dependence of college students is designed. The system distributes and takes back the mobile phone dependence questionnaire through mobile phone APP, which can avoid tedious work of distribution, collection and data entry of the questionnaire. Through the questionnaire data, the system establishes the warning model based on GA-SVR, and the model can precisely predict the students’ comprehensive test results and give warning information. The statistical analysis function of the system can realize the statistical analysis of warning information in any period of time, which is convenient for teachers and teaching managers to master the whole state of students and take measures to deal with it. The actual operation results show that the system can automatically carry out the warning and statistical analysis of the mobile phone dependence. The results are credible and reliable.
genetic algorithm; mobile phone APP; support vector regression machine; warning system
2016-04-12
河北省高教学会2015年度高教科研项目(GJXH2015-310);燕山大学青年教师自主研究计划项目(15LGBO22).
徐炜君(1981-),男,讲师,硕士,主要从事高等教育及人工智能等研究.E-mail:xwjsm@163.com
10.3969/j.issn.1674-232X.2016.05.018
TP391
A
1674-232X(2016)05-0556-05