孙一品, 齐剑川, 秦 华, 钮伟芳, 苏 宁, 钮建伟
(1.北京科技大学 机械工程学院,北京100083;2.北京建筑大学 机电与车辆工程学院,北京 100044;
基于J48决策树算法的大学生社交网络游戏参与原因分析
孙一品1, 齐剑川1, 秦 华2, 钮伟芳3, 苏 宁4, 钮建伟1
(1.北京科技大学 机械工程学院,北京100083;2.北京建筑大学 机电与车辆工程学院,北京 100044;
3.河北省荣军医院第10病区,河北 保定 071100;4.河北科技师范学院 物理系,河北 秦皇岛 066004)
随着SNS社交网站的发展,嵌套在其平台上的社交网络游戏已成为大学生的新宠,而大学生网络成瘾也成为社会各界关注的焦点。为研究大学生参与社交网络游戏的原因,本文通过网络发布问卷的方式对大学生参与社交网络游戏的情况进行调查,将收集到的信息转换成数据导入到数据挖掘软件WEKA中。采用J48决策树算法对数据进行分类处理,得到游戏参与情况的决策树模型。模型分析结果表明,大学生社交网络游戏玩家参与社交网络游戏的原因主要与家庭环境、生活状态以及网站的社交活性有关。家庭的完整性和幸福度是影响大学生参与SNS网络游戏的最重要原因之一,对待生活的心态同样影响大学生是否会选择参与社交网络游戏,而SNS网络广泛的社交性是促进大学生参与社交网络游戏的另一个重要原因。这些参与游戏的原因与大学生网络成瘾的原因部分重合,为预防大学生网络成瘾提供了依据。
社交网络游戏; J48决策树算法; 网络成瘾
据CNNIC第37次中国互联网统计报告指出,中国网民规模已达到6.88亿,网络游戏用户规模达到3.91亿[1],其中,大学生是主力军。数据显示,超九成中国大学生每日使用互联网时长超过2小时[2]。网络不仅拓展了大学生的思维模式,开阔了视野,同时便于他们知识的更新和扩容。但长期无节制地使用网络和沉迷于网络游戏,不仅会造成玩家食欲低下、失眠、视力减退、头痛头晕等身体不适[3],而且极易出现幻觉,内心孤独加倍甚至抑郁等精神状况[4]。因过度使用网络而导致的明显的社会、心理损害的现象称为网络成瘾综合征,后又被称为有问题的网络使用(problematic Internet use ,PIU)[5]。目前,网络成瘾已经被社会各界广泛关注。
与此同时,随着社交网站(social networking sites,SNS)的发展,SNS注册用户数量激增。就像Facebook曾经掀起的网页与社交游戏的浪潮一样,微信成为很多人接触社交网络游戏(social network game,SNG)的入口。截至2016年3月,微信月活跃用户已突破7亿[6]。腾讯找到一种将游戏直接有效送往用户手中的途径:将网络游戏与社交网络账号绑定,网络用户直接变成游戏玩家。“SNS+Game”能够满足玩家社交互动需求,这一模式已经成为网络游戏企业寻求进一步做大做强的重要途径。截至目前,社交网络游戏在网络游戏畅销排行榜中名列前茅。与传统的网络游戏相比,SNS网络游戏高度的互动性与短时间、低付出、高回报的特点无疑带给用户更多娱乐价值,同时成为运营商吸引新客户、打败竞争对手的有效途径。
目前对于SNS用户的社交网络游戏行为的研究已经取得一定的成果。有研究指出,SNS用户参与社交游戏主要从4个方面获得满足:在人际关系方面,社交网络游戏可以提升自我价值,获取群体归属感,与好友进行互动,增进友谊,促进联系,结识新的朋友[7-8]。在娱乐性方面,可以满足用户情感宣泄、消磨时间[9],追求娱乐、幻想、挑战竞争、逃避现实[7]、寻求刺激的心理需求[10],同时可以体验游戏过程带给身心愉悦的满足感。在自我满足方面,通过角色扮演满足自我实现、超越好友的需要[9]。从游戏本身来讲,SNS游戏的“可行与可实现性”和“创新与独特性”成为吸引SNS用户的重要社交文化因素[11]。然而,对于大学生这一网络时代特殊的群体,上网已经成为日常交往中非常普遍的行为,也是获取知识、认识世界的重要方式。社交网络和社交网络游戏已经影响了大学生的思维模式、心理特点以及行为方式,尤其在智能手机时代的背景下,社交网络给大学生提供了更大的便利。但是,某些大学生仍然存在沉溺于虚拟的社交环境中,在现实生活中无法与人正常沟通,身体素质下降等生理和心理问题[12]。
尽管很多研究者对于社交网络游戏行为进行了研究,并取得了一定成果,但是对在校大学生这一典型群体对社交网络游戏参与原因的调查尚不多见。本文在前人研究的基础上,结合对SNS网络游戏的相关理论以及动机的文献研究,对大学生参与社交网络游戏原因进行调查。利用WEKA数据分析软件中的J48决策树算法,对收集到的问卷数据进行分类,构建大学生参与社交网络游戏的决策树模型,并对决策树结果进行分析,为大学生社交网络游戏成瘾的预测及预防提供依据。
利用网络调查网站“我们做”(http:www.wezuo.com/)发布调查问卷,共收集到问卷436份,其中有效问卷405份。将收集到的有效数据转化为ARFF文件,导入到怀卡托智能分析环境(Waikato environment for knowledge analysis, WEKA)的Explorer应用中进行数据实验分析。
1.1 参试者
本次研究的目标人群是北京地区的在校大学生。采用随机取样的方法共收集到405份有效测试样本。他们年龄分布在18~25岁之间,平时时间支配相对自由,能随时接触到网络。在所有样本中,以大四学生为主,占总体的42.5%;样本性别比例为2.16∶1,男性占68.35%,女性31.65%;样本教育背景以本科第一批次考生的高校(简称“一本”)为主,数量占85.2%;样本专业背景以工科为主,占50.6%,文科、理科分别占25.9%和23.5%。
1.2 调查问卷
本研究的测量主要采用问卷调查法。问卷采取选择题和量表结合的方式。选择题用于事实类问题,由已知选项中作出选择。量表主要面向体验、行为等主观性问题,采用1~5级程度度量(1表示完全不符合,5表示完全符合)由受试者选择。问卷根据已有结论,共设计30个问题,主要侧重孤独感、社交、家庭环境等因子。其中,社交网站使用情况包括5题,SNS游戏参与情况包括6题,游戏参与原因包括13个问题,个人基本信息包含6题。游戏参与原因包括家庭环境关怀、社交能力、人生观、生活方式。家庭环境关怀包括家庭幸福程度、交流难易度;社交能力包括社交意愿、组织能力、交流自由度;生活方式包括生活状态、生活条理性、网络依赖程度。这些考查因素主要与SNS和网络成瘾有关[13],每个问题的设计凸显了玩家体验的角度。
1.3 数据建模
1.3.1 算法选择
本文采用分类算法对数据进行分析。分类是数据挖掘的主要方法之一,目的是生成一个分类模型,把数据库中的数据项映射到某一定类别中,通常用于预测。目前发展较为成熟的分类算法有决策树算法、基于关联规则的分类算法、贝叶斯方法、神经网络算法、K-邻近法等等。决策树算法从一组无序、无规则的事例中推理出一种分类规则,以决策树的形式表示出来[14]。决策树算法能够很好地处理噪声数据,有较高的准确率,并可以显示重要的决策属性,生成的决策结果易于理解,但通常只对较小规模训练样本集有效。基于关联规则的分类算法(classification based on association,CBA)[15]是在关联规则的基础上分类,该算法在数据分析过程中,先分析右部为类别属性值的关联原则,再从中选择合适的数据集。CBA算法能将潜在的数据关联规则呈现出来,但因为在数据分类时常把0设置为最小支持度以避免数据分类时出现纰漏,而导致不能很好地发挥算法的优化作用。贝叶斯算法操作简单,速度快,错误率低,但贝叶斯算法是以独立性假设为前提的,这在实际应用中很难成立,并且利用该算法往往需要足够大的样本集。神经网络算法模拟人类大脑的结构和功能,将学习到的知识储存在网络系统中。但其计算复杂度很高,提取规则的可理解性及算法的实用性还有待进一步提高。K-邻近法则计算繁琐,正确率低。
本文利用WEKA中不同的算法对样本进行分析,根据各算法分类准确率、决策树模型等是否符合研究要求,决定使用何种算法。选出算法较为经典、分类准确性高且决策树模型有意义的算法,将实验结果记录如表1所示。
表1 4种较准确算法结果比较Tab.1 Comparison of the results of four algorithms
由表1可知,这4种正确率较高的算法中,J48决策树算法的正确率最高。综合考虑J48算法的优缺点,选择J48决策树算法进行分析是比较合理的。经典的决策树算法包括ID3、C4.5、C5.0、CART等。J48算法是C4.5算法在WEKA中的应用,该算法派生于ID3算法[16]。
J48算法具体算法步骤如下[17]:
1)创建节点N;
2)如果训练集为空,在返回节点N标记为 Failure ;
3)如果训练集中的所有记录都属于同一个类别,则以该类别标记节点N;
4)如果候选属性为空,则返回N作为叶节点,标记为训练集中最普通的类;
5)for each 候选属性attribute_list;
6)if 候选属性是联系的 then;
7)对该属性进行离散化;
8)选择候选属性 attribute_list 中具有最高信息增益的属性D;
9)标记节点N为属性D;
10)for each 属性D的一致值d;
11)由节点N长出一个条件为D=d的分支;
12)设s是训练集中D=d的训练样本的集合;
13)ifs为空;
14)加上1个树叶,标记为训练集中最普通的类;
15)else 加上1个有 J48(R-{D},C,s)返回的点。
1.3.2 属性选择
选择不同的属性直接影响结果的准确性以及建模的性能。不同的属性,在样本空间的权重是不一样的,即这些属性与类别的关联度是不同的,因此有必要筛选某些属性或者对各个属性赋以一定的权重。在前期与专家讨论的基础上,本文选择以下12个指标作为J48建模的属性,见表2。
表2 J48算法建模的属性Tab.2 Critical attributes of J48 model
1.3.3 决策树建模
根据问卷收集的数据进行建模,得到的决策树用图1表示。其中树的根节点和内部节点是分类属性,叶节点表示分类结果。
图1 决策树模型Fig.1 Decision tree model
1.3.4 交叉验证
根据上述步骤建立的决策树模型,对数据进行交叉验证,J48算法的正确率为98.5%。将该模型对SNS网游玩家的决策树模型完整验证结果整理如表3。
表3 J48算法交叉验证结果Tab.3 Cross validation results of J48 algorithm
表3中,识别率为分类实例中,正确识别出本类实例的概率;误判率为将其他类别的实例判断成本类实例的概率;精准度为对某一类别分类时正确的实例数占总数的比例;召回率为表示识别正确的实例数,占该类别的实例的总数;F值是精确率和召回率的调和平均数,F值越大说明精准度和召回率都相对较高。
从表3可以看出,J48算法的精准度和召回率均达到了98.5%以上。即分类的正确率很高。该结果表明,可以用J48决策树模型反映的结果分析大学生参与SNS网络游戏的原因。
由图1来看,家庭情况作为决策树第1层影响因素,是影响大学生是否参与SNS网络游戏的最大分类因素。从决策树中可以看出,家庭不完整的样本(单亲和其他家庭情况的大学生)中36人都参与SNS网络游戏。同时,在决策树第3层,一本大学的学生中,家庭幸福程度较低的样本共28人也都参与SNS网络游戏。即家庭的完整性和幸福度是影响大学生参与SNS网络游戏的最重要原因。
在决策树的第6层,互联网对生活的意义方面,生活受网络影响很深的测试者在对目前生活感觉厌倦的问题中,选择高分的人群,即对目前生活不满的22个大学生,选择不参与SNS网络游戏;而对目前生活较为满意的人多是SNS网络游戏玩家,共51人。可见,生活状态是影响大学生是否参与SNS网络游戏的另一个原因。
对生活充满希望的样本51人,经常在SNS网站上写日志、传照片和分享站外资源的样本39人,认为SNS游戏是社交手段的样本38人,大多是SNS游戏玩家。而不愿意与他人分享生活和想法、不经常与朋友互动的大学生则更热衷于SNS网络游戏。还有部分大学生认为通过SNS网络游戏可以结交新朋友,并且能和朋友进行很好的互动。而有很好异性缘的用户选择不玩游戏。说明SNS网站的社交活性是影响大学生是否参与社交网络游戏的另一个原因。
平日登陆次数在12次及以上的大学生有26个样本参与SNS游戏,二本和三本的大学生也会参与SNS游戏。
结论表明,家庭不完整或者家庭不幸福的大学生参与SNS网络游戏的可能性非常高,较易成为SNS网络游戏玩家。其心理一般较为脆弱、敏感,对关注度有较高的需求,SNS网络游戏以其虚拟的环境和朋友之间的相互关注吸引了该类人群参加;而家庭幸福的人,多数是积极向上、对生活满意的大学生,这些人也是SNS网络游戏玩家,说明SNS网络游戏参与情况代表了对网络有依赖关系的网络使用者拥有健康的人格。生活幸福的大学生,健康的人格层面通过SNS网络游戏中的社交、娱乐等功能得以体现。能够在SNS网站分享自己生活和想法、结交朋友的人,其玩游戏是为了满足自我,获取关注,希望通过SNS网络游戏与同学、朋友竞争。高社交活性的SNS网络游戏吸引了这样的大学生玩家。同时可以发现,很多不在SNS网站分享生活状态的大学生参与游戏的概率较高,可能是游戏中的社交功能已经满足了玩家的社交需求,无需再通过其他方式获得关注或维持联系。从一定程度上SNS游戏替代了SNS网站的功能。
本文的调查问卷主要根据网络成瘾相关的因素进行设计,由结果很容易看出大学生参与社交网络游戏的原因与网络成瘾的原因是部分重合的。据调查,网络游戏成瘾是网络成瘾的主要类型[18]。目前现有的网络成瘾的影响因素研究主要从个人因素、家庭环境因素以及网络自身三方面考虑。研究发现,网络成瘾者有着情绪不稳定、孤独、自控力差、自卑[19]等独特的性格,神经质的人格和社交网络的支持度是两个重要的成瘾预测因素[20],高神经质和低责任心更容易导致网络成瘾[21];秦华等[22]发现,玩家抑郁明显影响玩家游戏重复行为,且焦虑越严重[23]越有网络成瘾的可能性。家庭环境方面,研究发现,父母的婚姻冲突将严重影响青少年的网络成瘾[24],在一个家庭中,亲子依恋是父母关系融洽和青少年网络成瘾的中介[25]。这与本文得出的家庭不完整的大学生参与社交网络游戏概率较高的结论不谋而合。作为网络游戏本身,其参与时间灵活,让游戏者探索和体验不同的角色,得到成功的满足和喜悦,获得从现实中挣脱出来的刺激与兴奋感,并引诱玩家进一步探索,进而沉迷于网络游戏。本文利用J48算法得出的结论虽然不能有效说明参与SNS网络游戏的大学生都会成瘾,但网络游戏成瘾和网络社交成瘾是最常见的两种网络成瘾障碍(Internet addition disorder,IAD),IAD[26]已经成为影响大学生身心健康的主要原因。家庭情况是影响大学生参与SNS网络游戏的主要原因,也是网络成瘾的主要因素。大学生心理还不够成熟,高度的社交活性会使其沉迷在SNS网络游戏中。目前网络游戏成瘾已经引起各界的广泛关注,但社交网络游戏成瘾鲜有研究。并且随着社交网络和社交游戏的发展,其与大学生学业的冲突日益明显,学习兴趣减退,无法集中注意力,更有甚者直接逃课。因此,为避免大学生过分迷恋社交网站游戏而导致网络成瘾,学校及教育工作者应及时采取措施,尤其是家庭不完整、家庭生活不幸福的大学生,可以采用心理辅导、行为干预等方式进行教育,避免其网络成瘾。
当然,本研究还存在如下不足。首先,有效问卷只有405份,数据相对较少,并且只是针对北京地区的大学生进行调查,样本不够均匀;其次,J48算法得出的原因中,并没有量化地表示出大学生网络成瘾的可能性,只是作了定性的分析。在以后的研究中。要尽量对大学生网络成瘾作出模型预测。最后,SNS网络游戏在设计上有很多不同类型,性别不同、入学年份不同的大学生可能会参与不同类型的游戏,并且在参与游戏时内在感受也会不同,所以在将来的研究中有必要区分大学生的性别、游戏的类型等。
研究可知,利用J48算法对大学生参与SNS网络游戏的原因分类是可取并且效果很好。本文的研究中,随机对北京地区部分大学生SNS网络游戏参与情况进行问卷调查,并将数据转化为WEKA可识别的ARFF格式,使用J48算法对数据分类,得到大学生SNS网络游戏玩家参与社交网络游戏主要与家庭环境、生活状态以及网站的社交活性有关的结论,为及时预防大学生网络成瘾提供了理论依据。
[1] 中国互联网网络信息中心.第37次中国互联网络发展状况统计报告[EB/OL].[2016-05-08].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/.
[2]谢耘耕.2015年中国大学生媒体使用习惯调查报告[EB/OL].[2016-05-08].http://media.people.com.cn/n/2015/0720/c397572-27329888.html.
[3]方琪,王宏,李雷雷.重庆某库区县中学生亚健康状态及危险行为分析[J].中国公共卫生,2013,29(1):94-96.
FANG Qi, WANG Hong, LI Leilei. Sub-health status and behavioral risk factors among middle schoolstudents in Three Gorges Area,Chongqing[J].Chinese Journal of Public Health. 2013,29(1):94-96.
[4]GREYDANUS D E, GREYDANUS M M. Internet use, misuse, and addiction in adolescents: current issues and challenges[J].International Journal of Adolescent Medicine and Health, 2012, 24(4): 283-289.
[5]MORENO M A, JELENCHICK L A, CHRISTAKIS D A. Problematic internet use among older adolescents:a conceptual framework[J].Computers in Human Behavior, 2013, 29(4):1879-1887
[6]2016年微信用户数量统计[EB/OL].[2016-05-08]. http://mt.sohu.com/20160421/n445493845.shtml.
[7]JIN C H. The role of users′ motivations in generating social capital building and subjective well-being: the case of social network games[J].Computers in Human Behavior, 2014, 39: 29-38.
[8]WEI P S, LU H P. Why do people play mobile social games? an examination of network externalities and of uses and gratifications[J].Internet Research, 2014, 24(3):313-331.
[9]LEE J, LEE M, CHOI I H. Social network games uncovered: motivations and their attitudinal and behavioral outcomes[J].Cyberpsychology Behavior & Social Networking,2012,15(12):643-648.
[10] WANG J L, JACKSON L A, ZHANG D J, et al. The relationships among the big five personality factors, self-esteem, narcissism, and sensation-seeking to Chinese university students′ uses of social networking sites (SNSs)[J].Computers in Human Behavior,2012,28(6):2313-2319.
[11]SHEN K S.Measuring the sociocultural appeal of SNS games in Taiwan[J].Internet Research, 2013, 23(3):372-392.
[12]张小平,邵雅利. 网络时代下的“90后”大学生心理特征及教育创新[J]. 重庆邮电大学学报(社会科学版),2014(2):69-76.
ZHANG Xiaoping, SHAO Yali. Post-90 generation college students’psychological characteristics and education innovation under the network era: positive psychology perspective[J]. Journal of Chongqing University of Posts and Telecommunications(Social Science Edition),2014(2):69-76.
[13]黄思旅,甘怡群. 青少年网络游戏成瘾量表的修订和应用[J]. 中国临床心理学杂志,2006,14(1):8-10.
HUANG Silyu, GAN Yiqun. The revision and preliminary application of online game addiction inventory[J].Chinese Journal of Clinical Psychology,2006,14(1):8-10.
[14]HAN J W, KAMBER M. Data mining-concepts and techniques[M]. USA:Morgan Kaufmann Publishers Inc, 2011.
[15]EFE M O, KAYNAK O.A novel optimization procedure for training of fuzzy inference systems by combining variable structure systems technique and Levenberg-Marquardt algorithm[J]. Fuzzy Sets & Systems, 2001, 122(1):153-165.
[16]RUGGIERI S. Efficient C4.5[J]. IEEE Transactions on Knowledge and Data Engineering,2002,14(2):438-444.
[17]KANTARDZIC M.数据挖掘:概念、模型、方法和算法[M].王晓海,吴志刚,译. 2版. 北京:清华大学出版社,2013.
[18]LO S K, WANG C C, FANG W C. Physical interpersonal relationships and social anxiety among online game players[J].Cyberpsychology & Behavior the Impact of the Internet Multimedia & Virtual Reality on Behavior & Society, 2005, 8(1):15-20.
[19]YANG S C, TUNG C J. Comparison of internet addicts and non-addicts in Taiwanese high school[J]. Computers in Human Behavior, 2007, 23(1):79-96.
[20]HARDIE E, TEE M Y. Excessive internet use: the role of personality, loneliness and social support networks in internet addiction[J].Australian Journal of Emerging Technologies and Society, 2007,5(1):34-47.
[21]WANG C W, HO R T, CHAN C L, et al. Exploring personality characteristics of Chinese adolescents with internet-related addictive behaviors: trait differences for gaming addiction and social networking addiction[J]. Addictive Behaviors, 2015, 42:32-35.
[22]秦华,陈宝江,钮建伟. 抑郁与网络游戏特征、行为重复的关系[J]. 工业工程,2012,15(1):105-108.
QIN Hua, CHEN Baojiang, NIU Jianwei. On the relationship between depression and characteristics of online game and activity repetition[J].Industrial Engineering Journal,2012,15(1):105-108.
[23]王滨. 大学生孤独感与网络成瘾倾向关系的研究[J]. 心理科学,2006,29(6):1425-1427.
WANG Bin. A study on the relationship between the loneliness and internet addiction tendency of college students[J].Psychological Science,2006,29(6):1425-1427.
[24]KALAITZAKI A E, BIRTCHNELL J. The impact of early parenting bonding on young adults′ internet addiction, through the mediation effects of negative relating to others and sadness[J]. Addictive Behaviors, 2014, 39(3):733-736.
[25]DENG L Y, FANG X Y, YAN J. The relationship between inter-parental relationship parent-child relationship and adolescents′ Internet addiction[J]. Journal of Special Education, 2013(9):71-77.
[26]MORAHAN-MARTIN J, SCHUMACHER P. Incidence and correlates of pathological internet use among college students[J].Computers in Human Behavior,2000,16(1):13-29.
An Analysis of the Causes of College Students′ Participation in Social Network Games Based on J48 Decision Tree Algorithm
SUN Yipin1,QI Jianchuan1,QIN Hua2,NIU Weifang3,SU Ning4,NIU Jianwei1
(1. School of Mechanical Engineering, University of Science and Technology Beijing, Beijing 100083, China;2. School of Mechanical-Electronic and Automobile Engineering, Beijing University of Civil Engineering and Architecture, Beijing 100044, China; 3.10th Ward, Hebei Rongjun Hospital, Baoding 071100, China;4.Department of Physics, Hebei Normal University of Science and Technology, Qinhuangdao 066004, China)
Social network games, nested on the platform of social networking sites, have become a new favorite of college students. And college students′ Internet addiction has been of considerable interest to the academia in recent years. The reasons why college students participate in social network games are explored. A number of questionnaires are distributed through the Internet to collect information which needs to convert to data format and import into Waikato Environment for Knowledge Analysis (WEKA). And the decision tree model is obtained via the J48 decision tree algorithm. The results of the experiment indicate that college students′ social network game behavior is mainly related to family environment, living conditions and social networking sites activeness. The integrity and happiness degree of a family, together with college students′ attitude towards life and social networking sites activeness, are all important causes in social network game behavior. In addition, college students should be provided with effective strategies to prevent Internet game addiction because the reason of the participation is partly coincident with that of the Internet addiction of college students.
social network game; J48 decision tree algorithm; Internet addiction
2016- 07- 30
国家留学基金委公派出国留学资助项目(201208110144);中央高校基本科研业务费专项资金资助项目(FRF-TP-14-026A2)。
孙一品(1989-),女,河北省人,硕士研究生,主要研究方向为大学生心理健康、网络成瘾.
钮建伟,niujw@ustb.edu.cn
10.3969/j.issn.1007- 7375.2016.06.018
TP18
A
1007-7375(2016)06- 0116- 07