冯春燕
摘 要:本文利用八爪鱼数据采集器获取爱课程网的资源共享课全部课程的数据,包括课程名称、所属学校、负责人以及在线学习人数等信息,采用均值比较与线性回归的分析方法,分析其课程学习人数以及不同地区省份课程发布数量,进而了解资源共享课使用效益及现状。
关键词:资源共享課;数据采集器;均值比较;线性回归
中图分类号:G434 文献标志码:A 文章编号:1673-8454(2017)23-0051-03
一、研究背景与意义
爱课程网集中展示了“中国大学视频公开课”和“中国大学资源共享课”,并致力于推动优质课程资源的广泛传播和共享,深化本科教育教学改革,提升高等教育质量,推动高等教育开放,促进学习型社会建设[1]。
本研究期望通过获取目前爱课程网的资源共享课全部课程的数据,分析其课程学习人数以及不同地区省份课程发布数量,进而了解资源共享课使用现状及其使用效益。这不仅有助于提高资源共享课的质量,更有利于满足学习者日趋强烈的学习需求、促进学习型社会建设。
二、资源共享课数据的获取
1.数据采集
在大数据时代下,众多研究者提出了各种形式的网络数据采集技术与系统[2][3][4],高效的网络数据采集技术至关重要,采集到的网络信息能为科学研究提供重要的数据基础。
为了数据采集更加便捷有效,当前也提出了多种数据采集器[5][6],其中八爪鱼采集器提供了实用性、易操作性界面对网络数据进行采集。它是互联网数据采集平台,可简单快速地将网页数据转化为结构化数据,并存储于Excel或数据库等多种形式,实现精准、高效、大规模的数据采集,最主要的优点在于对新手而言方便快捷,容易操作。因此利用八爪鱼采集器以省、直辖市等地区为分类,获取资源共享课的全部页面信息,主要分为四个步骤:设置基本信息、设计工作流程、设置执行计划、完成任务。其中第二的步骤为中心环节,需要利用该软件的流程设计器,设计全部页面数据抓取的流程图,并提取数据字段:课程名称、所属学校、负责人以及在线学习人。其流程图如图1所示。
2.数据内容及整理
利用八爪鱼采集器对爱课程网资源共享课数据的采集,截止到2017年5月15日,共获取全部资源共享课2884条信息,其内容主要包括课程名称、所属学校、负责人以及在线学习人。全国各地区,共抽取了22个省(台湾省并无课程内容,因此除外)、4个直辖市、4个自治区(西藏自治区并无课程内容,因此除外),其中不同地区课程发布量也有所不同,同时并整理了不同省市985/211高校的资源共享课发布数量。
三、数据分析
资源共享课程以开放学习、资源共享、知识公益为理念[7],以学习者为中心,向社会免费开放优质的学习与教学资源,是广大的学习者在课堂学习之外的有益补充,因而了解资源共享课程现状以及网络课程资源的利用情况是至关重要的。以爱课程网为例,利用SPSS软件采用均值比较与线性回归方法,对资源共享课程的在线学习情况以及不同地区、学校资源共享课程的数量进行统计与分析,揭示当前资源共享课程的使用效益与现状。
1.资源共享课使用效益
为描述2884门课程的在线学习人数可进行均值过程,对30个地区计算描述指针,进行检验前的预先分析。在对在线学习人数的均值过程中,包括了均值、个案数、标准差、最小值、最大值、偏度以及峰度等一系列单变量描述统计量,其结果如表1所示。
该数据的观测量总数为2884个,其中有效值为2884个,无缺失值。从表1中可以看出,就均值而言,每个地区的课程在线学习人数差异很大,最大的为青海省的1855,最小的为贵州省的106.5,从个案数、标准差可以发现,每个地区的课程数量之间也有很大的差异。从极小值与极大值可以看出30个地区内的课程在线学习人数之间的差距,如安徽省有41门课程,其中课程在线学习人数最小的只有40人,学习人数最多的有9818人。虽然在课程线学习人数最大值有的甚至上万,但是从偏度与峰度数值中可以看出这些大数量的学习人数仅占全部课程的极少数量。表格中偏度值大部分都大于0,由皮尔逊偏度系数可知是右偏分布,表明较低的值占多数,其中的4个地区小于1的原因在于课程数量过少,而从峰度可知,大部分值远大于0,表示数据呈扁平分布。
综合来看,爱课程网上的2884门课程中的在线学习人数呈扁平且右偏分布,即在整体上大部分课程的在线学习人数都过于稀少,并且各地区课程数量与学习人数分布不均。
2.各地区课程发布量分析
由获取的信息可知每个地区的课程发布数量有很大的差距,然而每个省市其普通高校以及985/211高校数量也存在区别。从获取的爱课程网资源共享课信息可知,每个省市高校以及985/211高校的学校数量与资源共享课程发布的数量,如图2所示。由图可知,不同地区的资源共享课程数量与该地区的高校数量有关,并且可以看出虽然985/211高校数量不多,但是其课程的发布数量占多数,为进一步说明985/211高校数量与课程数量之间的关系,将采用线性回归的分析方法。
回归分析是研究一个因变量或多个因变量(自变量)与一个自变量(因变量)之间是否存在某种线性关系或非线性关系的一种统计学分析方法[8],当参与回归分析的自变量只有一个时,就称为线性回归分析,也就是一元线性回归分析。根据985/211高校数量与课程发布数量建立数据文件,利用SPSS软件用线性回归过程描述其关系,如表2、表3、图3所示 。
从表2中可以看出,985/211高校数量与课程发布数量之间的Pearson相关系数为0.743,显著系数(Sig.(1-tailed))为0.000,即两者之间显著相关。表3给出了非标准化系数、标准化系数、t统计量、显著性系数、95%置信区间,可以看出显著性水平Sig.为0.000小于0.05,可以认为方程显著,与相关分析的表中给出的结果一致。图3为标准化残差的正态概率图,可以看出标准化残差呈正态分布,散点在直线上或靠近直线,可以推断回归方程满足线性的检验,说明985/211高校的学校数量与课程发布数量呈线性关系。endprint
四、总结与启示
本研究认为课程在线学习人数过少,并且地区课程发布数量不均,同时主要课程数量由985/211高校发布。由此,对资源共享课使用效益与现状提出思考与启示。
1.资源共享课程使用效益不高
由数据得出的在线学习人数呈扁平且右偏分布结论可知,课程的利用率极低,其课程的使用效益还远未达到预期效果。导致课程使用效益不够的原因有许多,首先,重建轻用思想严重,课程的建设纯粹成为了学校争取更多名利的项目;其次,资源共享课程质量不高,难以满足学生学习兴趣;最后宣传力度不足,其他高校学生难以发现优质课程。
2.各地区资源共享课程发布数量不均
资源共享课建设在发达地区进行的如火如荼,具有丰富的课程资源,然而有些地区相对滞后。其中缘由与地区经济发展水平有关,更与地区高校数量与教学质量相关,或是不同高校其网络精品课程只在校园网内部分享。
3.部分普通高校的资源共享课程建设力度不足
由于不同的学校其教学质量、教学水平以及投入资金不同,其资源共享课建设水平也有所差距。每个省市的985/211高校占其普通高校的极少部分,但是从上述分析结论中可知其资源共享课程却是占绝大多数,由此反映出普通高校对于资源共享课程建设的力度不足。
要提高资源共享课程的使用率;丰富教学资源,完善课程平台建设;加强推广力度,不同学校、地区之间资源共享,共同进步。
参考文献:
[1]程翥,李贵林,刘海涛.中国高等教育MOOC平台现状分析[J].高等教育研究学报,2014(2):15-19.
[2]沈洪洲.一种基于Chrome扩展程序的网络数据采集方法[J].计算机应用与软件,2016(7):10-13,55.
[3]魏煜欣,李强.一种基于SNMP网络性能管理数据的采集方法[J].计算机工程与应用,2011(2):105-107+123.
[4]田泽,索高华,张荣华.基于FPGA的AFDX网络高速数据采集器设计[J].电子技术应用,2016(8):179-182.
[5]张晓春,孟令军,周之丽.基于STM32的能源管理网络数据采集器设计[J].计算机测量与控制,2015(3):876-879.
[6]李玉峰,陈海军,董兰飞.基于ENC28J60的网络型数据采集器设计[J].橡塑技术与装备,2014(6):51-54.
[7]李鋒.资源共享课程建设现状、问题及对策[J].计算机教育,2014(18):86-89.
[8]李玉光,杜宏巍,黄永生.SPSS 19.0统计分析入门与提高[M].北京:清华大学出版社,2014.
(编辑:王晓明)endprint