张欣泉
(中国海洋大学 信息科学与工程学院,山东 青岛 266071)
大数据在高等教育领域中的应用研究
张欣泉
(中国海洋大学 信息科学与工程学院,山东 青岛 266071)
我国已开始实施国家大数据战略,这必将推动大数据在高等教育领域中的广泛应用。从大数据的内涵、特征、发展的演变以及我国高等教育领域中三类教育大数据积累的现状可以看出,教育大数据在增强政府高校科学决策、推进高校教育教学变革、提升高校教育管理水平等方面可以发挥重要作用。但大数据在应用过程中还面临数据整合、技术支持、隐私安全等问题,高校应该通过实施强化大数据意识、加强数据整合、推进大数据研究、促进校企联合、注重数据监管等策略予以应对。
大数据;高等教育;应用研究;教育决策;教学改革;教育管理
党的十八届五中全会提出要实施“国家大数据战略”,这标志着大数据战略正式上升为国家战略,大数据建设开启了新的篇章。《大数据时代》作者维克托认为,在大数据时代许多学科门类都会发生巨大甚至是本质上的变化和发展,进而影响我们的价值体系、知识体系和生活方式。[1]持续快速发展的中国,面对社会经济的深刻变革以及教育、科技等领域的机遇和挑战,通过大数据这种思维方式和技术手段来解决问题、发现规律、获取知识、赢得竞争力,显得尤为重要。
继物联网、云计算之后,大数据作为IT产业重大技术变革已开始向各个领域渗透,教育也不例外。大数据在教育领域中的广泛应用是国家推进教育信息化的重要内容之一,是信息技术与教育教学的深度融合。我国在实施公共服务大数据工程中,正积极探索发挥大数据对推动教育公平、变革教育方式、提高教育质量的支撑作用。随着大数据技术的快速发展、国家顶层设计的明晰,必然会推动大数据在教育领域创新应用的深化,提升高校人才培养质量。
(一)大数据的定义
2008年,Nature推出了大数据的相关专刊,“大数据”概念第一次正式出现。[2]咨询公司麦肯锡则第一次提出了大数据的明确定义,其在2011年发布的《大数据:创新、竞争和生产力的下一个新领域》中给出大数据的定义是指那些规模大到超出传统数据库工具采集、存储、管理和分析能力的数据集。[3]维基百科给出了与麦肯锡类似的定义,认为大数据是一些使用目前现有数据库管理工具或传统数据处理应用很难处理的大型而复杂的数据集。[4]2012年,Gartner公司将大数据的定义内涵由“数据集”外延至“信息资产”,表述为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。[5]2015年,我国在《促进大数据发展行动纲要》中进一步扩充了大数据的内涵,提出大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。[6]
(二)大数据的特征
关于大数据的特征,2001年Meta Group公司(现为Gartner公司)分析员Douglas Laney最先提出了3V,即Volume、Velocity、Variety,其具体含义是数据体量(Volume)庞大,现在人们创造与复制的数据量每两年增加一倍,数据量已达PB级(1024TB)以上;处理速度(Velocity)高效,要求对海量数据及时有效的分析,这也是和传统数据挖掘技术有着本质不同的特征;数据类型(Variety)繁多,大数据包含了网络日志、音频、视频、图片、地理位置信息等多种结构化、半结构化和非结构化的数据形式。[7]2012年,国际数据公司(IDC)认为大数据是符合4V特征的数据集,在3V基础上增加了Value即巨大的数据价值,但有价值的信息埋藏在大量不相关的信息中,需要进行复杂的分析筛选,深挖背后的价值。[8]2013年,IBM发布《分析:大数据在现实世界中的应用》白皮书也提出了4V,在3V的基础上增加了Veracity即精确性,指与某些数据类型相关的可靠性,数据的真实性和质量是获得真知和思路最重要的因素,追求高质量数据是一项重要的大数据要求和挑战。[9]随着大数据技术发展的成熟和应用领域的增大,人们对其特征的挖掘也会随之变化和拓展。[10]大数据本身具备的这些特征,使得大数据在应用过程中具有了描述性、预警性、预测性、动态性等特点,这势必会对包括高等教育领域在内的各领域产生巨大影响。
(三)大数据的发展
继Nature和Science相继推出探讨大数据问题的专刊以来,各国越来越深刻意识到大数据科学研究的重要性,以及所带来的国家战略意义和巨大的经济价值。2012年3月,美国投资2亿美元启动“大数据研究和开发计划”,这标志着大数据已上升到美国国家战略层面;[11]2013年和2014年,美国先后发布了《支持数据驱动型创新的技术与政策》的报告[12]和《大数据:把握机遇,保存价值》白皮书,[13]着力推进美国大数据的研究和应用,推动制定政策和法律框架。英国、法国、日本、澳大利亚等国也都不断加大对大数据领域的资金投入,在高校中建立大数据研究中心。[14]在中国,许多官方媒体和业内人士认为2013年是大数据元年;[15]2014年,清华大学、北京大学、复旦大学、电子科技大学等高校陆续成立了大数据研究院或研究中心,聚焦学科建设、应用研究和复合人才培养;同年,百度、阿里巴巴、腾讯、京东等互联网企业开始抓紧布局大数据领域,纷纷推出大数据产品和服务,抢占数据资源;2015年9月,国务院发布了《促进大数据发展行动纲要》;2015年10月,十八届五中全会正式提出了实施“国家大数据战略”。可见,大数据已获得各国的高度重视,这也意味着大数据开始进入快速发展时代。
(一)高等教育中的大数据
美国《通过教育数据挖掘和学习分析促进教与学》报告中指出,广义的教育大数据泛指所有来源于日常教育活动中人类的行为数据,它具有层级性、时序性和情境性的特征;而狭义的教育大数据是指学习者行为数据,它主要来源于学生管理系统、在线学习平台和课程管理平台等。[16]12笔者认为我国高等教育中产生的大数据主要分为三类:
第一类是从国家层面看,全国截至2015年5月21日有各类高校共计2845所,[17]这些高校在长期的建设与发展过程中,产生了学校的基本信息、学生变化、人事变动、基建情况、财政投入等基础数据,这些数据通过各类统计已汇总至各级教育主管部门,多年来形成了庞大的教育基础数据库。对这些基于采集基本数据信息的传统数据库,匹配当前我国高等教育和各高校发展现状,并结合经济社会发展的各项指标、国外比较数据等,就形成了我国的教育大数据。
第二类是从高校自身发展层面看,在长期的办学过程中学校逐步汇聚了大量的数据信息,包括学生的基本信息、学习信息、生活信息、实践信息、社交信息;教师的教学信息、科研信息;学校的资产信息、人事信息、招生就业信息、图书馆藏信息等。王左利指出高校在信息化过程产生的这些校园数据,整体上满足数量大、种类多、产生快、真实可信和具备分析价值等特点,完全符合大数据的特征。[18]
第三类是来源于各类在线学习平台的数据,这包括学生的学习日志、路径、课程、成效等学习行为的相关数据。例如,国内的智慧树在线学习平台,已囊括近700所大学,覆盖近400万大学生;截止到2015年春夏学期,共开设72门课程,选课学校达295所,共30万学生在线修读。众多学生在学习过程中产生的信息和数据,被实时的记录下来并累积贮存于平台运营商手中,这些数据也完全符合大数据的各项特征。
高等教育领域中产生的大数据既有常规的结构化数据,也有多媒体教学资源的非结构化数据,可以运用大数据的理念、思维、技术进行数据抽取与集成、数据分析和数据展示,为政府、高校科学地规划决策提供新思维、新依据,为高校推进教育教学变革提供新技术、新模式,为提升大学生教育管理水平提供新思路、新方法。
(二)大数据在高等教育中的应用
1.大数据可以为政府、高校提供更科学的决策服务
大数据的核心就是预测,这种预测能影响和改变我们决策的传统模式。柳叶青研究指出,随着大数据时代的来临,教育领域的数据信息与教育决策之间的关系,已从“数据驱动决策”发展为“基于数据决策”进而关注“数据感知决策”。[19]
张鹏高研究指出,通过对历史统计数据的分析,形成对我国和地方教育发展状况各方面的趋势分析,可以为国家和各级教育主管部门制定长远规划提供数据理论基础;基于教育大数据动态信息的数据挖掘和分析,可提供教育动态监管、预警服务,突发应急事件解决方案,教育舆情分析服务;通过对社会公众需求的调研,可为做好信息公开,提供公众数据服务。[20]美国教育部已建立了覆盖全美的立体化教育数据网络,服务于教育问责体系;并已研制了《教育数据通用标准》,在应用过程中不断调整与优化,2015年已经发展到第五版。[21]我国教育部依据《教育信息化十年发展规划(2011-2020 年)》,已着手建设教育管理公共服务平台,希望通过统一开发的应用系统形成动态、准确的数据,为国家教育决策提供支持服务,为地方应用提供服务。
常桐善将传统的高校决策模式总结为“官僚主义”模式、“学院型”模式、“政治型”模式、“有组织的无政府型”模式四类,并认为这些模式都缺少有力的决策支持依据,从而提出了以数据系统为支撑的“知会理性”决策模式,这种模式可以为高校决策者提供和完善他们认知经验所缺乏的信息、知识和智慧,进一步提升决策的科学性。[22]在高校信息化建设过程中,无论是将信息化管理与商业智能技术相结合,[23]还是由数字校园升级到智慧校园,[24]其基础都是要运用云计算、物联网、移动互联、大数据等技术。整合校内各类数据形成信息集成系统,通过预警、预测、建模分析等功能,可获得更具价值的信息,为高校发展规划、教育决策的制定带来更科学的依据。
2.大数据可以为高校教与学的变革提供动力和技术支持
教育数据挖掘和学习分析是大数据在高校教育教学中的两大技术应用。教育数据挖掘是通过研究使学生学习行为模型化显示,探寻各变量之间的相互关系,预测学生未来学习发展趋势;学习分析则是通过测量、收集、分析和报告有关学生学习情境的数据集,以理解和优化学习及其发生情景。[16]12前者主要是侧重新的数据分析模型和方法;后者则是将已知预测模型应用到教学中,解决学生学习系统和组织学习系统的问题。[25]运用这两项技术可以进一步推动高校教学模式的变革,实现更加客观的教学评价,促进大学生个性化的学习,实现对大学生学业情况的有效预测。
教育大数据可以推动高校教学模式进行改革。在高校,课堂教学是最主要的教育方式,教师为教学主导。随着大规模开放式在线课程(慕课)进入正规的高等教育体系,使得在线学习日益成为广大学生获取知识的重要途径,国内以学堂在线、爱课程、智慧树为代表的慕课平台已经吸引了大量学生在线学习,这对传统教学模式的影响逐步显现。与传统教学模式相比,灵活的学习时间和空间、优质的课程资源、片段式的多媒体视频、交互式的学习模式,可有效帮助学生集中注意力、分解课程难点、提高学习效率。[26]学生在线学习过程中,个人的学习轨迹、学习效果等数据将被系统详细地记录,当数据量累积到一定程度时就形成了大数据,通过对数据的挖掘和分析,就可以发现潜在的规律,指导课程资源的调整与优化,向学生推送合适的学习资源,同时还可以运用这些数据帮助高校进行教学方法改革和教学质量提升。
教育大数据可以提高高校教学评估和教师课程评估的客观性和科学性。赵伶俐在探讨2013年教育部启动的对高校进行的第二轮教学评估中就指出,要以“教学基本状态数据”为主要依据进行评估,要建立保障教学数据无障碍流通的,一个支撑大数据思维、数据汇聚、数据分析、数据共享、数据人才等的制度体系。[27]高校对教师进行的课程评估,主要依据对教学过程的检查、教学督导听课、学生测评等方式。虽然学生评教的有效性在学术界一直存在争议,但马秀麟等就借助数据挖掘和学习分析的方法,对两所学校学生评教的数据展开分析,并检测了学生评教的有效性水平,研究结果表明绝大多数的学生评教数据是客观的,并能够真实地反映教师的教学状况。[28]这也在一定程度上表明依据大数据可提升教学评估的客观性。
教育大数据的应用使学生个性化的学习变为现实。学生在线学习过程中,学生的基本信息、学习行为、学习课程、学习成绩等交互数据将被采集,通过数据挖掘和分析,从而为学生提供学习反馈和建议;通过分析学生的学习规律,对具有相同学习特征的学生进行聚合划分,可以有的放矢地为学生创造个性化的学习环境;通过探索大量学生学习过程中产生的相关数据与不同学习结果之间的对应关系,并建立模型,就可以依据学生的基本情况以及当前行为模式预测其未来的学习趋势和学习结果。姜强等以《C语言程序设计》课程学习为例,从基于大数据个性化自适应的学习过程结构、学习过程可视化及学习效果实证等方面进行分析,研究结果表明对学生学习行为与知识掌握的数据分析,能够推荐合理的学习路径与恰当难度的学习资源,可对学生的学习效果做及时准确的反馈,提供个性化服务干预,进而促进教与学。[29]
3.大数据可以为高校学生教育管理提供新手段
移动互联、新媒体、大数据技术的兴起,给高校大学生日常教育管理带来了新的机遇和挑战,使社会、网络、高校的育人环境都发生了变化。[30]高校学生思想政治教育和日常管理工作就是要为青年学生创造良好的成长成才环境,引导学生树立正确的世界观、人生观、价值观,这就要与时俱进,在传统的工作方式、手段上进行丰富和创新,适应大数据时代高等教育发展的需要。
大数据的思维方式可以指导教育工作者更全面地整合学生信息。学生自入校后,学习、生活、实践的数据就源源不断地被学校记录,这既包括学生的基本信息、学业水平、素质测评、心里评价等静态或变化频率低的数据,也包括学生刷卡消费记录、上网时长、图书馆图书借阅、网络发帖留言等动态的或变化频率快的数据。过去由于学校各类业务系统往往是在不同历史时期规划和建设的,系统之间的数据难以共享,许多数据都形成了“数据孤岛”。而大数据技术的兴起,让我们开始有意识地打破藩篱,整合这些数据,从而让教师更全面的掌握学生信息。
大数据的预测功能可以帮助教育工作者及时发现学生问题并进行干预。当高校中海量的学生数据被汇聚、融合、加工、分析后,强大的预测功能将发挥重要作用。例如,当学生在校内长期都有消费记录或出入图书馆的记录,突然一段时间记录消失或者上网时长一段时间内明显增加,通过大数据技术,就可以发出预警,提醒辅导员及时关注学生状态。再例如,当学生学习压力大、情感受挫、人际交往不顺、家庭出现变故时,都会导致学生思想行为或心理状态产生较大波动,从而在网络发帖、微信朋友圈留言、学习成绩变化、活动规律变化等方面有所体现,同样通过大数据技术可及时发出预警,辅导员可有效地进行干预和引导。
大数据的“全样本理念”可以帮助教育工作者对学生进行更科学的评价。高校中学生的学习成绩、获得的奖学金和荣誉、各类竞赛成绩、科技创新的成果、参与的社团活动和社会实践活动等信息都可以转化为数据,[31]帮助我们了解学生的学习状态、实践能力、人际关系,对学生的综合素质和能力水平做出客观的评价。在学生毕业时可以根据这些基于数据的评价,让学生更清醒地认知自己,并为学生匹配适合的职业方向和工作岗位,提升大学生就业质量。
从高等教育领域来看,大数据在教育决策、教学改革和教育管理等方面引发的创新与变革日益显现,但要真正做到基于数据的决策与管理,实现数据的融合与流动,还有许多需要解决的问题,例如数据整合、技术支持、数据安全等。目前,各高校因重视程度、基础数据、研究能力、资金投入的不同,大数据的应用发展程度也千差万别。
要加强大数据在高等教育领域中的应用,充分发挥教育数据的巨大价值,笔者认为一是要强化大数据意识,做好顶层设计。各级教育主管部门和高校的决策者要逐步树立大数据意识,重视教育信息化的建设。建议教育主管部门依据国务院《促进大数据发展行动纲要》和教育部《教育信息化十年发展规划(2011-2020年)》等文件精神,出台教育大数据应用发展的指导意见;各高校也要依据国家、教育部和地区已出台的规划和纲要,谋划高校的长远规划和具体实施方案。二是加强数据整合,提升数据质量。在教育信息化推进过程中,许多高校早期缺乏统筹布局的意识,使得校内各职能部门相对独立地建立了信息管理系统,并不断地升级运行至今,要改变这种现状,就需要学校主导,各职能部门参与,探索把分散在各系统中的数据资源整合起来的现实途径,建立良好的数据管理机制,包括加强数据标准建设、重视历史数据积累、学习数据处理技术等,以求在数据准备阶段提高数据质量。[32]三是加强大数据研究,实现重点支持。高校要整合校内的科研力量,发挥技术优势,鼓励一线教师、业务人员和管理人员都参与到大数据的应用研究中来,可以从“小数据”做起,分析、研究、总结循环推进,学校从政策、机制、资金等方面给予支持与保障。四是促进校企联合,推动共同发展。在高校大数据应用方面,校企之间有巨大的合作空间,把高校的数据资源与存储在互联网公司、在线学习平台企业的数据结合起来,共同挖掘教育大数据的巨大潜力,推进高校教育教学改革和智慧校园的建设。五是注重数据监管,保护个人隐私。大数据环境下,高校师生的个人数据能够被广泛、详实地收集和分析,数据安全面临巨大挑战。我们在期待国家完善法律法规的同时,还要建立规范的大数据使用方法和流程,做好对数据库的日常监管;加强大数据信息安全系统建设,积极应对网络攻击,提升大数据安全保障与防范能力。
[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶著.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛,译.浙江:浙江人民出版社,2013.
[2]Nature.Big Data.[EB/OL].[2016-1-4].http:∥www.nature.com/news/specials/bigdata/index.html.
[3]James MANYIKA,Michael CHUI,Brad BROWN,Jacques BUGHIN,Richard DOBBS,Charles ROXBURGHh,Angela Hun BYERS.Big data:The next frontier for innovation, competition,and productivity[R/OL].[2015-12-30].http:∥www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation/.
[4]Big data[EB/OL].[2015-12-30].https:∥en.wikipedia.org/wiki/Big_data.
[5]Mark A.BEYER,Douglas LANEY.The Importance of ‘Big Data’:A Definition[EB/OL].[2016-1-4].https:∥www.gartner.com/doc/2057415/importance-big-data-definition.
[6]国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2015-12-31].http:∥www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[7]Christy PETTEY,Laurence GOASDUFF.Gartner says solving‘Big Data’challenge involves more than just managing volumes of data[EB/OL].[2015-12-31].http:∥www.gartner.com/newsroom/id/1731916.
[8]百度百科[EB/OL].[2016-1-4].http:∥baike.baidu.com/link?url=-nWmvQWPulsmsPT8IXNh4Tu-P81eTx1Xo EOTNhAEiz AOUTb6 DRZ2mJwmamONFdBXumA0E7RM_tKkThymY5-vJa.
[9]Michael SCHROECK,Rebecca SHOCKLEY,Janet SMART,Dolores ROMERO-MORALES,Peter TUFANO.分析:大数据在现实世界中的应用[R/OL].[2016-1-4].http:∥wenku.baidu.com/link?url=lhY910Colwmk3zMHlHI1zHXDgFOwt1NwLkLgge G_AA8QeZwljDEdBpJ882REOHhJ0jl3Ycx2Xke70sgU7rV3pxdz_i6iae7fxWvB7Bif8V7.
[10]Kevin C.DESOUZA.Realizing the Promise of Big Data:Implementing Big Data Projects[R/OL].[2016-1-4].http:∥www.businessofgovernment.org/sites/default/files/Realizing%20the%20Promise%20of%20Big%20Data.pdf.
[11]Rick WEISS.Big Data Research and Development Initiative[EB/OL].[2016-1-4].https:∥www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release_final_2.pdf.
[12]姜桂兴.美国智库建议政府支持数据驱动型创新[N].学习时报,2014-3-3(A7).
[13]浙江大学历史数据研究小组.美国白宫“大数据”白皮书[R/OL].[2016-1-6].http:∥www.36dsj.com/archives/8299.
[14]中共中央网络安全和信息化领导小组办公室.世界主要国家的大数据战略和行动[EB/OL].[2016-1-6].http:∥www.cac.gov.cn/2015-07/03/c_1115812491.htm.
[15]刘凤娟.大数据的教育应用研究综述[J].现代教育技术,2014(8):13-19.
[16]徐鹏,王以宁,刘艳华,张海.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6).
[17]教育部.2015年全国高等学校名单[EB/OL].[2016-1-6].http:∥www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[18]王左利.校园大数据规划先行[J].中国教育网络,2014(1):59-60.
[19]柳叶青.国外教育领域数据驱动决策研究述评[J].上海教育科研,2013(9):14-18.
[20]张鹏高,罗兰.基于大数据的教育决策支持[J].中国教育信息化,2014(19):3-5.
[21]郑燕林,柳海民.大数据在美国教育评价中的应用路径分析[J].中国电化教育,2015(342):25-31.
[22]常桐善.如何提高大学决策绩效——院校研究与“数据驱动决策”模式的视角[J].复旦教育论坛,2013(2):54-60.
[23]舒忠梅,屈琼婓.大数据时代高校信息管理与决策机制研究[J].华南理工大学学报(社会科学版),2013(6):96-101.
[24]蒋东兴,付小龙,等.大数据背景下的高校智慧校园建设探讨[J].华东师范大学学报(自然科学版),2015(S1):119-125.
[25]张羽,李越.基于MOOCs大数据的学习分析和教育测量介绍[J].清华大学教育研究,2013(4):22-26.
[26]朱建平,李秋雅.大数据对大学教学的影响[J].中国大学教学,2014(9):41-44.
[27]赵伶俐.以“教学基本状态数据”为据——《大数据时代》对第二次本科教学评估的启示与警示[J].现代大学教育,2015(2):95-102.
[28]马秀麟,衷克定,刘立超.从大数据挖掘的视角分析学生评教的有效性[J].中国电化教育,2014(333):78-84.
[29]姜强,赵蔚,等.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育,2015(336):85-92.
[30]王海建.大数据时代与高校思想政治教育的实效性[J].高校辅导员学刊,2014(8):37-40.
[31]万辉.大数据在高校学生管理工作中的应用[J].高校辅导员学刊,2014(8):48-51.
[32]赵玉洁.大数据在高校教育信息化中的应用探究[J].中国教育信息化,2015(10):39-41.
(责任编辑:魏 霄)
Application of Big-Data in the Domain of Higher Education
ZHANG Xinquan
(CollegeofInformationScience&Engineering,OceanUniversityofChina,Qingdao266071,China)
The nationwide implementation of big data strategy significantly promotes the application of big data in higher education.Since the birth of big data,it can be seen from its evolving connotations and development,along with its growing capacity in three major areas of higher education,that it is of increasing importance in optimizing governmental policy-making,advancing educational reforms and enhancing higher education management.However,there arise a few problems in the application of big data,such as data categorization,technique support and privacy security etc.The higher education in China needs to pay much more attention to big data,and take a few measures in data categorization,big data research,effective communications between universities and enterprises,and proper supervision on big data application.
Big Data; Higher Education; Application Study; Education policy-making; Education Reforms; Education Management
2016-03-18
教育部人文社会科学研究高校思想政治工作专项项目“大数据背景下高校学生学业支持路径的探析与实践”(15JDSZ2005)
张欣泉(1980—),男,山东青岛人,中国海洋大学信息科学与工程学院党委副书记、副院长,讲师.
G40-057
A
1008-7699(2016)06-0103-07