☆ 杨铭钊金世东
(1.长春市实验中学高中部,吉林长春 130117;2.长春市实验中学电教中心,吉林长春 130117)
基于决策树的电子游戏对高中生学习成绩影响分析
☆ 杨铭钊1金世东2
(1.长春市实验中学高中部,吉林长春 130117;2.长春市实验中学电教中心,吉林长春 130117)
目前,电子游戏已经成为青少年的一种重要娱乐休闲方式。其在给青少年带来快乐的同时,也在一定程度上减少了青少年的课外学习时间,困扰了学生、教师和家长。高中生心智发展迅速,但对电子游戏普遍存在较强的依赖性,而且由于其学业紧张,很容易受到电子游戏的影响。针对这个问题,本文分析了基于决策树的电子游戏对高中生学习成绩的影响,并利用机器学习的方法分析了电子游戏与高中生成绩之间的隐含关系,帮助教师和家长有针对性地对高中生进行积极健康的引导。通过实验证明,该方法能发现游戏和成绩之间的隐含关系,并给出一定的建议。
电子游戏;高中生成绩;决策树;机器学习
大多数青少年时期的学生,思维活跃、精力充沛、兴趣广泛,容易接受新鲜事物,容易参与一种或多种适合自己兴趣的课余活动。电子游戏赋予玩家的参与感往往要超出枯燥的书本和沉闷的课堂,而且电子游戏中网路游戏更能提供多元化的功能平台和挑战性的项目,让玩家在解决难题和升级过关的过程中体会到虚拟的进步感和成就感[1],所以相对于传统的学习过程,电子游戏更容易受到青少年学生的关注和喜爱[2]。电子游戏中的某些设定对青少年的智力发育有一定的促进作用,但过分地沉迷电子游戏,则会减少学习时间、降低学习热情、分散学习注意力。特别是在学习任务繁重的高中阶段,面临高考的竞争压力,学生在学习过程中没有体会到进步感和成就感,很容易将竞争压力和进步诉求转移到电子游戏中,而电子游戏恰好迎合了高中生的这种心理,使得高中生沉迷电子游戏不能自拔。
目前,对游戏影响学习的研究主要集中在网络现状调查、网络游戏成瘾原因分析和网络游戏信息动机研究等多个方面,代表性的工作有:林云等人[4]利用回归估计对浙江某大学802名大学生进行学习行为及其影响因素的调查分析。高英彤等人[5]分析网络游戏对中小学教育的负面影响,并提出了应对方案。陈黎明[6]认为人们对网络游戏存在偏见,应该探究网络游戏的特点,设计一款教育网络游戏以提高学生学习效率。季志[8]对浙江某学院821名大学生进行了随机调查发现大学生参与网络游戏的程度和所受影响存在性别差异。
发达国家如美、韩等国为了限制游戏对未成年人的影响,制定了自己的管理规则。主要是对游戏进行了分级[3],对游戏的类型、内容、场景、角色等基本信息进行了分类和定级,未成年玩家被限制接触暴力、血腥、饮酒、赌博等类型的游戏。我国目前对电子游戏的管理和限定还处于探索阶段,对高中生人群的游戏分类标定更是处于完全空白状态,对游戏种类、游戏时间、玩家类型等多个因素对成绩影响的量化研究还很缺乏。
本文针对以上问题,提出了基于决策树的电子游戏对高中生学习成绩影响分析模型,该模型通过收集高中生日常游戏行为数据,利用决策树构建成绩影响分析模型,发现影响高中生学习成绩的关键因素。
从信息论知识中我们知道,期望信息越小,信息增益越大,从而纯度越高。所以决策树算法的核心思想就是以信息增益度量属性选择,选择分裂后信息增益率最大的属性进行分裂。下面是几个重要的概念。
设D为用类别对训练元组进行的划分,则D的熵(entropy)表示为:
其中pi表示第i个类别在整个训练元组中出现的概率,可以用属于此类别元素的数量除以训练元组元素总数量作为估计。熵的实际意义表示是D中元组的类标号所需要的平均信息量。
现在我们假设将训练元组D按属性A进行划分,则A对D划分的期望信息为:
分裂信息定义为:
信息增益率定义为:
决策树就是利用信息熵的基本属性,构造一棵熵值平均下降最快的树,将一个最大的不确定状态转化为不确定性为零的多个子状态。
构建游戏——成绩影响模型实际上是利用已有游戏行为数据构建一个成绩分类决策树的过程。主要包含三个子过程:收集游戏行为数据、训练测试模型和判定规则生成。其中,收集游戏行为数据采用调查问卷的形式,以无记名的方式在学生中进行调查,对采集到的样本通过简单的数据预处理成模型可用格式。利用已有的决策树算法对采集到的行为特征数据进行训练和测试,最终形成一个完整的决策树,则游戏——成绩影响模型构建完成。将该模型中的分类限制条件转换为IF-THEN结构的因果规则,这样更容易被理解和利用,利用这些规则指导学生在学习和游戏之间找到一个最佳的平衡。
图1 基于决策树的游戏-成绩影响模型
如图1所示,基于决策树的游戏——成绩影响模型主要有三个部分组成:训练数据、模型和分类规则。其中训练数据由调查问卷生成,整理成统一格式,具体内容将在实验结果部分介绍。游戏——成绩影响模型是利用训练数据构建的一棵决策树,以树的结构存储,这个模型可以用来训练和测试,经过测试优化后,模型最终建立。分类规则由模型生成,可以将决策树模型的限制条件转换为IF-THEN结构的条件规则,利用这些规则可以根据学生的游戏行为预测学生的成绩行为,教师和家长可以根据实际情况调整策略,如减少游戏时间,加强游戏监管等。
图2 模型评估和新数据分类
如图2所示,分类规则的基本形式为IFA1^A2^…^An,THEN Class A or B or C or D.其中Ai为决策树的分类条件,Class j代表成绩分类情况。我们将如图3所示的部分决策树限制条件转化为IF-THEN结构的因果条件,则IF-THEN因果条件为:
IF主观影响=1,上课是否玩=0,游戏时间<=8,THEN Class A
图3 部分决策树
样本数据通过调查问卷的形式采集,最终回收的有效调查问卷为46份,调查问卷产生的游戏——学习行为特征有15个,具体特征及其含义如表1所示。
表1 游戏——学习行为特征
根据提交者的成绩信息,从高到低分为四类:A,B,C和D。具体的成绩和分类信息如图4所示。
图4 成绩和分类样本数据分析
本文采用WEKA[9]数据挖掘平台中决策树算法J48对成绩和分类样本数据进行训练和测试,采取十折交叉验证的方式保证实验结果的公平性和有效性,经过优化后的主要参数为C=0.001、M=3,训练后生成决策树如图5所示,可以看出主观影响为第一个被选择的属性,ABD三类学生都受主观因素的影响,而C类学生主观上并不在意游戏对学习的影响。上课是否游戏是区分D和AB两类学生的特征属性,上课玩游戏的学生被分在D类里,而不玩游戏的学生被分在AB两类里,可以看出上课是否玩游戏对学习成绩影响很大,而游戏总时间是区分A和B两类的重要特征,游戏时间大于8的学生被分在B类里,而小于等于8的被分在A类里。
图5 基于决策树的游戏-学习训练模型
经过参数优化,模型的正确分类样本数为29个,错误分类样本数为17个,正确分类率为63.0435%,可以看出分类精度并不高,出现这种现象的原因可能是样本特征不显著或者样本数量过少导致欠拟合。
基于决策树的游戏——学习影响模型通过收集高中生日常游戏行为数据,利用决策树构建成绩影响分析模型,能够有效地发现影响高中生学习成绩的关键因素。通过实验证明,该方法能发现游戏和成绩之间的隐含关系,并给出一些IF-THEN结构的关系规则。虽然实验的分类精度不高,但仍有一定的指导意义。下一步工作将主要集中在两个方面:一方面是要扩大调查范围,增加调查样本,解决样本数量过少导致的欠拟合问题;另外一方面是对已有样本的特征进行特征选择,获得最优的样本特征组合,解决样本特征不显著的问题。
[1]李仪凡.中国网络游戏玩家关键驱动因素及市场细分研究——以MMORPG为例[D].上海:复旦大学,2005.
[2]黄少华.网络空间的社会行为——青少年网络行为研究[M].北京:人民出版社,2008.
[3]高英彤,刘艳姝.论软力量与网络游戏[J].外国教育研究,2007,(06):72-76.
[4]林云,梁雄军.大学生学习行为及其影响因素的实证研究[J].天津大学学报,2010,(03):283-288.
[5]高英彤,杨冰,丛迪.网络游戏对中小学教师的挑战及应对[J].中小学教师培训,2009,(02):59-60.
[6]陈黎明.让网络游戏为教育服务[J].现代教育科学,2007,(01):33-35.
[7]段景勇,乔毅.论高校辅导员在大学生网络游戏成瘾中的任务[J].继续教育研究,2008,(08):73-74.
[8]季志.大学生参与网络游戏状况的调查与分析[J].现代教育科学高教研究,2007,(01):130-133.
[8]The University of Waikato.Weka 3:Data Mining Software in Java[EB/OL].[2016.11].http://www.cs.waikato.ac.nz/ml/weka/.
G434
A
1671-7503(2016)23-0024-04
庄丰源]