网络学习行为的时间特征研究

2018-11-02 07:06刘非凡
中国教育技术装备 2018年8期
关键词:学习者分析研究

刘非凡

摘 要 时间序列分析法被应用于农业、气象、医学等领域,对未来进行预测以便进行决策和调控。若使用该方法预测网络学习行为,可以发现学生在学习中出现的问题。在借鉴学习行为相关研究基础上,通过使用统计学相关知识,分析网络学习平台中的学习行为数据所具备的时间序列特征。探究应用时间序列分析法分析网络学习行为的可行性,以便后续建立学习行为预测模型。

关键词 网络学习平台;网络学习行为;时间序列分析法;预测模型;高级语言程序设计(C)课程;Excel、SPSS

中图分类号:G652 文献标识码:A

文章编号:1671-489X(2018)08-0009-05

1 问题的提出

根据中国互联网信息中心第39次全国互联网统计报告显示,截至2016年12月,中国网民规模达7.31亿,互联网普及率首次过半,达到53.2%,超过全球平均水平3.1个百分点,超过亚洲平均水平7.6个百分点;我国手机网民规模达6.95亿,增长率连续三年超过10%[1]。网络每时每刻存在于人们的生活中,并影响着人们的生活方式以及学习方式。正是随着网络的迅猛发展,网络学习也不置可否地成为新时代教育的重中之重,成为现阶段乃至未来教育发展的重要任务。

因此,关于网络学习的研究吸引了诸多学者的关注,研究者从学习者的角度,从宏观的角度去分析,如剖析学习者的网络行为特征,帮助网络教学进行个性化调整,建立更适应学习者的网络课程。分析网络学习行为的发展趋势,方便教师实施高效的教学调控,提供更优质的学习支持服务,从而使参加网络学习的学习者获得更好的学习效果。

随着网络课程与学习技术的发展,网络学习伴随在越来越多的教学情境中,在其过程中所产生的大量数据,为深入研究学习者的特征带来新的契机。对于平台中所记录的无意识、零散的学习行为之间可能存在的潜在关系,是教师及其他评价机制所不易捕捉到的[2]。对于这些隐藏在网络学习平台中所记录的学习行为,犹如宝藏一般等待研究者去探索,所以选择恰当的数据挖掘方式、数据处理方法显得尤为重要。

而现阶段的网络学习行为研究多以较为简单的描述性分析方法,虽然操作简单、直观易懂,但其主观性强、结论粗糙的缺点,随着研究问题逐渐复杂化,使单纯的学习行为描述性分析不再能够满足教育研究者更深层次的需求。本研究在广泛调研的基础上,从学习行为研究方法的角度出发,通过使用对比和计量统计学的方法,分析网络学习行为数据的时间序列特征,验证其使用时间序列分析法的可行性,探讨使用时间序列分析的科学意义,以便更加深入地挖掘网络行为数据所存在的信息。

2 文献综述

关于网络学习行为的研究主要有以下特点。

1)基础理论研究,主要是针对网络学习行为的内涵、相关特点,构建行为模型。例如:陈丽的《中国远程学习者学习风格特征的三维模型》基于学习风格理论与学习测量表,建立了适用于我国学习者的网络学习风格模型;彭文辉的《网络学习行为分析及建模》在对学习行为内涵进行研究的基础上,提出学习行为OCCP分类模型和“S-F-T”三维模型,来研究网络学习行为的本质[3-4]。

2)调查研究,主要指从实际调研出发,发现网络学习时存在的问题,并使用调查问卷的方式对学生的信息进行搜集,利用相关分析软件对收集到的数据进行简单的定量分析,来研究学生学习态度关注度对网络学习行为所产生的影响。如李玉斌的《网络学习评价研究的现状与分析》对文献进行梳理,总结了网络学习中存在的普遍问题,并指出以后的研究应对指标体系和评价系统进行改善[5]。

3)网络学习调控机制的研究,主要指研究者希望通过一定的技术方式和学习干预机制,对学生在网络学习时所处的状态发展趋势进行调控,及时发现学生在学习过程中出现的问题,制定个性化的干预策略,建立网络学习行为监控策略与工具。

4)相关技术层面的研究,主要指目前国内学者使用数据挖掘技术对网络学习平台的日志文件进行整理分析。如吴青的《基于网络学习行为的学习风格挖掘》使用聚类分析相关分析等技术,对学生的网络学习行为进行分析,来测量个体的学习特征和风格[6]。

综上所述,国内对网络行为的研究方法依旧比较单一,多以文献分析、问卷调查法和聚类分析法,其不确定因素较多,利用网络学习者在进行网络学习时所产生的网络学习行为数据,可以更加真实地反映学习者的学习特征。在对这些数据进行数据挖掘和处理时,现阶段多以相关性分析为主,多停留在表面现象,或是使用已有数据评价学生的即时学习状况,并没有对数据间深层次关联性以及后续发展进行研究。

国外学者利用数据库中数据,使用多种统计学分析法,通过具体的数据分析指标,对学习行为的相关影响因素以及學习者的学习行为进行预测。相比而言,国内的数据分析技术不够先进,相关研究还相对薄弱。

现阶段信息化教学飞速发展,如果没有统计学对大量的数据进行处理,许多信息将无法显示其有用的价值。因此,采用恰当的数据分析方法,对于网络学习行为研究显得尤为重要。而在金融、气象等领域常使用时间序列分析来处理较复杂的时间序列数据。时间序列分析是概率统计学科的一个分支,它是运用概率统计的理论和方法来分析随机数据序列(或称动态数据序列),并对其建立数学模型,进行参数估计,对模型定阶,以及进一步应用于预报、预测、控制、最佳滤波等诸多方面[7]。为了使网络学习行为研究的重心从对表面现象的总结转移到分析其行为间内在本质的相关关系上,采用时间序列分析挖掘网络学习行为数据更深层的信息,就显得至关重要。

本研究尝试以网络学习平台数据库中的操作行为数据作为特征数据来源,分析其行为数据呈现的特征,通过不同学科的交叉和融合,分析网络学习行为的时间序列特征。讨论网络学习行为使用时间序列分析的可行性,以便可以使用时间序列分析来挖掘网络学习行为中隐藏的信息。

3 研究方法

研究框架 本研究中的网络学习行为特征是指,学习者在网络学习平台上学习时产生的行为。本研究通过了解学习者的总体使用情况,联系时间序列数据特征,对比平台中所记录的行为数据,发现大致规律,来探究网络学习行为数据是否符合时间序列数据的性质及特征。

研究对象 本研究的研究对象为某学校16级某班47名学生。

网络学习微信公众平台介绍 乐学易学公众平台主要由每日易学、每日易考、乐学易学部落、高级语言程序设计(C)、计算机应用基础等子频道构成。其中的高级语言程序设计(C)提供课程导学、微学课件、导学案例慕课视频、资源下载等功能。课程采用网上学习与课堂教授相结合的混合学习方式。

研究工具 本研究采用SQL数据挖掘工具对数据库中的数据进行处理,采用Excel、SPSS等软件进行数据分析。选择高级语言程序设计(C)课程网络学习平台所产生的网络学习行为数据,采用SQL语言对数据进行相关预处理,再使用SPSS统计学软件对预处理后的数据进行时间序列特征分析。

4 研究过程和结果

数据的选择 由于本文的研究对象是学生,考虑到学生在上学期间使用平台会比假期的使用情况更为频繁稳定的客观因素,为使观察分析结果更具有代表性,更能反映学生的学习行为特点,选择从2016年3月1日—6月30日,共122天的4295条行为数据作为样本进行分析,以学生的操作次数以及各种资源的使用次数作为研究数据。

数据的预处理 在所选用的4295条数据中,有若干数据是教师以及网络教学管理者的操作数据。为了保证研究的准确性和严谨性,研究者对4295条数据中教师和教学管理者所产生的行为数据进行剔除,剩余的3282条行为数据的总和统计为使用频次。

行为数据的时间序列特征分析 时间序列具有动态随机变化的属性,从表面上看可能无迹可寻,但实际是具有一定规律性的,所以想要为所研究的时间序列建立一个恰当的模型,就必须对该序列的基本特征进行分析了解,从而使预测结果更加精确。

1)描述分析网络学习行为基本时间序列特征。

①以天为单位分析网络学习行为。如图1所示,对所选用的122天的数据以天为单位进行描述性分析,发现4月25日的使用频率最高,达到125次;在122天中没有产生任何行为数据的天数共有七天。总体来看,从3月开始,由于大部分学生刚刚接触网络学习平台以及教师的督促等原因,学生使用的频率维持在比较高的水平,一直到5月初,学生的整体使用频率都比较高;进入5月之后,学生使用网络学习平台的整体频率随着时间的推移有所下降;但是到6月中旬,学生的使用频率又有所上升,其原因可能是由于期末考试临近,大部分学生使用网络学习平台进行期末考试复习。

从时间序列的角度,整个网络学习行为数据可以看成一个整体的数据对象,而非单独具体的数值采样点。3282条行为数据作为较大量的时间序列数据,已经可以用于深入的数据挖掘,从数据形状上来看,整个数据存在明显的波峰和波谷,在5—6月的时间段中呈现出较为规律的数据形状,学生的使用频率以一定周期的形式递减。

②以周为单位分析网络学习行为。如图2所示,对所选用的122天的数据以周为单位进行描述性分析,发现在第六周出现峰值,为376次;第九周到第15周使用频次较低。以每一周为单位,可以更加明显地看出学生使用的总体趋势随时间的推移而降低。可以发现在前六周,学生使用学习平台的情绪较高涨,对学习平台充满新鲜感;随时间的推移,新鲜感的降低以及第九周到第15周恰逢节假日休息,学生的使用频次降低。

从时间序列角度,以周为单位的原始时间序列图像周期性并不明显,但存在较明显的趋势性:从第一周到第六周,使用频次增加;从第六周到第15周,使用频次减少;第15周至第17周,使用频次短暂增加。从整体上分析,学生使用网络平台的频次呈下降趋势。

2)比较分析网络学习行为时间序列特征。与宜昌市甲型病毒性肝炎发病率预测模型进行比较(图3),发现以天為单位的使用频次图中,各个时刻的数据都依赖于时间,学生的使用频次以及乙肝的发病率都是依赖于时间的变化,但不一定是时间t严格函数[8]。对于每一天每一年的数据取值具有一定的随机性,不可能完全准确地用历史值进行预测。再者,前后日期的数值具有一定的相关性,这种相关性是具有一定的动态规律性。最后,从整体上来看,时间序列往往呈现出某种趋势性或周期性变化的现象[9]。对于上图中的两个时间序列数据从整体上或者是局部来说,都存在一定的周期和趋势——甲肝发病率逐年减少,网络平台使用次数在某一时期逐步减少。因此,网络学习行为符合时间序列的周期性和趋势性的特点;而对于不符合建模条件的数据,应对原序列做适当调整,看新序列是否满足建模条件,是否可以建立时间序列模型[10]。

3)统计分析网络学习行为时间序列特征。网络行为数据时间序列特性分析:如果一组数据具有动态变化的属性,可能直观上看是杂乱无章的,但其内部可能会存在某些规律,想要建立适当的时间序列模型分析一组数据,就一定要对该数据所具有的时间序列特性进行分析,以确保能够建立满足可靠性和置信度以及精度的模型,一般的从一组时间序列的平稳性、随机性和季节性这三个方面去考虑[7]。对于网络学习行为数据,同样可以从这三个方面去验证其时间序列的特征。

①网络学习行为数据的平稳性。在统计学中可知,如果一个时间序列的统计特征不随时间的推移而变化,这样的时间序列就被称为平稳时间序列。想要使用时间序列分析法对网络学习行为数据进行分析,数据的平稳性分析成为必不可少的一部分。对于时间序列的平稳性检验主要有两种方法:图检验法和单位根检验法[7]。本文中采用图检验法对网络学习行为数据的平稳性进行分析。

图检验法是根据网络学习行为数据的时序图和自相关图显示的特征,去判断该数据平稳性的方法。时序图就是由时间和序列值所构成的二维坐标图,如果在图上各个时间点的值始终在某一个数值附近波动,就可认为它是平稳的时间序列;如果在图中各个时间点的值具有显著的趋势或周期性,则可认为它不是平稳的时间序列。自相关图是由延迟期数和自相关数构成的一个二维坐标图。如果随着延迟数目的增加,自相关系数很快变为零,可判断为平稳时间序列,反之为非平稳时间序列。

图4所示為5月的网络学习行为数据时序图,从图中可以发现随着时间的推移,学生的使用频次整体呈下降趋势,则学生操作频次时间序列为非平稳时间序列。

图5所示为5月使用频次自相关图,从图中可以看出,随着延迟数目的增加,自相关系数并没有很快变成零,所以该时间序列为非平稳时间序列。无论是时序图还是自相关图,都验证了网络学习行为数据中的操作频数时间序列的非平稳性。

②网络学习行为数据的随机性。如果一组时间序列数据各个序列值彼此没有任何联系,其含义为该序列是一个没有记忆的序列,之前的行为对未来的行为没有任何影响,这种序列称作纯随机序列。如果一个序列是纯随机序列,则该序列是没有任何分析价值的;如果一个时间序列是纯随机序列,意味着序列没有任何规律性,序列诸项之间不存在相关,即序列为白噪声序列,其自相关系数应与0没有显著差异[11]。

通过图5所示5月网络学习行为数据自相关图,可以发现在16个延迟期中,1、3、5、6、11、14、15共七个延迟期中的自相关系数大于0.05,说明该序列中的各个数据间存在相关性,不是白噪声,可以使用时间序列分析法开展后续研究。

③网络学习行为数据的季节性。对于一组时间序列来说,其所具有的季节性指的是在某个固定的时间间隔中,该数据重复地表现出一种相似的特性。如某个地区的气候变化、降雨量、旅游的人数和某种商品的销售数量等时间序列就包含季节性。对于以月份为单位的时间序列,其季节周期为12个月;以季度为单位的时间序列,周期为四个季节。一组时间序列的季节性标准为:月度数据判断当k=12,24,36,...时,季度数据判断当k=4,8,12,...时,自相关系数是否与0有显著性差异。若自相关系数与0无显著性差异,说明各年中同一月(季)不相关,序列不存在季节性,反之则说明序列存在季节性[7]。因此,具有周期特性的序列就称为季节性序列。

网络学习行为数据,属于在人类的活动中所留存的数据。由于人类活动是随着某些规律而进行的,因此,人类的活动也常会出现周期性的变化。如用电量会出现一天的周期变化,也会出现每周的周期变化,甚至会随着季节的更迭出现季节性的周期变化[12]。以天为单位统计学生的网络学习行为频次,考虑到在一周中学生的网络平台使用情况会伴随着星期的变化而不尽相同,存在某种周期性的规律。

选取5月的数据作为参考(图4),在5日、11日、16日、21日、26日,学生的使用频次较高,处于波峰处,其时间间隔在五六天。数据的变化特征属于周期性变量,其周期性符合随机周期,表现为周期长度在某一领域内波动,类似太阳黑子具有10或11年的周期[13]。网络学习行为数据的周期长度受到随机因素的干扰,而出现某些随机性的变化,但其周期在一定的范围内,所以网络学习行为数据存在其所独有的季节性。

5 论文结论

本文以高级语言程序设计(C)课程为例,配合乐学易学网络教学平台,以某班级中的47名学生在一个学期中使用网络学习平台所产生的数据作为分析对象,以整个学期的使用频次和5月的使用频次分别为例,对网络学习行为数据的时间序列特征进行分析。研究结果如下。

1)时间序列分析法对学习者网络行为研究的意义和优势主要表现在,可以深入挖掘网络学习行为的内隐信息,网络学习行为会随时间发生变化,各个时刻数据间存在一定的联系。通过时序图可以直观地看出,某一段时期的网络行为具有一定的规律可循,并不是毫无规律的纯随机时间序列;但其操作频次容易受到各种内外因素的干扰,后续还需要对可能影响学习行为的多种影响变量进行研究。

2)传统的统计推断是建立在无限多样本数据基础之上的描述性分析,即所谓的大样本理论。而时间序列分析则可以从有限的样本数据中,即所谓的小样本理论,分析其各个时间点数据之间的关系,以便后续建立更加准确的行为预测模型。

3)横向研究只能诊断出变量间是否存在交互作用,而不能具体确定变量间的因果关系;时间序列分析则可以得出动态变化变量间领先落后的关系,甚至是具体的因果关系,预测未来的学习行为,可以为教学管理者制定更好教学干预、预警机制提供支持。

由于计算机科学技术的迅猛发展,为时间序列分析提供了很好的研究工具。本文用到了Excel、SPSS数据处理软件,对网络学习行为数据进行处理,能够得到清晰直观的数据图像以及数据分析结果,有助于更加准确地发现研究对象的发展趋势。在后续研究中,选用更为便捷的、先进的分析软件,以便更加准确地建立预测模型,这也是行为研究不可或缺的一部分。

4)学习行为研究的最终目的是为了对学习者的学习行为进行有效预测和调控,通过使用描述、对比、统计的方法,分别对网络学习行为数据的时间序列特征进行分析,发现其具有时间序列的一般特征,从而验证了时间序列分析法处理网络学习行为数据的可行性,以便建立合适的规律性模型,对网络学习行为进行预测,从而增强学习者的学习效果。

参考文献

[1]中国互联网信息中心.第39次全国互联网统计报告[DB/OL].http://www.cnnic.net.cn/.

[2]胡艺龄,顾小清,赵春.在线学习行为分析建模及挖掘[J].开放教育研究,2014,20(2):102-110.

[3]陈丽,张伟远,郝丹.中国远程学习者学习风格特征的三维模型[J].开放教育研究,2005(2):48-52.

[4]彭文辉.网络学习行为分析及建模[D].武汉:华中师范大学,2012.

[5]李玉斌,武书宁,姚巧红.网络学习评价研究的现状与分析[J].现代远距离教育,2013(5):34-39.

[6]吴青,罗儒国.基于网络学习行为的学习风格挖掘[J].现代远距离教育,2014(1):54-62.

[7]汤岩.时间序列分析的研究与应用[D].哈尔滨:东北农业大学,2007.

[8]刘继恒,徐勇,刘军,等.应用时间序列模型预测宜昌市甲型病毒性肝炎发病率[J].公共卫生与预防医学,2017,

28(2):10-13.

[9]王振龙,胡永宏.应用时间序列分析[M].北京:科学出版社,2007.

[10]吴喜.时间序列建模与模型选择的应用研究[D].合肥:合肥工业大学,2006.

[11]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.

[12]郭龙.时间序列数据的周期性研究[D].成都:电子科技大学,2013.

[13]魏武雄.时间序列分析:单变量和多变量方法[M].北京:中国人民大学出版社,2009.

猜你喜欢
学习者分析研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
隐蔽失效适航要求符合性验证分析
你是哪种类型的学习者
十二星座是什么类型的学习者
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
电力系统不平衡分析
汉语学习自主学习者特征初探
电力系统及其自动化发展趋势分析