王榴卉,侯 悦,杨现民
大数据支持下的网络学习行为采集模型设计
王榴卉,侯悦,杨现民
网络学习行为采集是学习分析的重要步骤,是推进学习分析“落地”的重要抓手,对学习分析结果的有效性具有重要的意义。在网络学习行为采集过程中需要“明确分析目标、列举采集行为,结合研究目的、分类采集行为,分析行为特征、选择采集工具,利用采集工具、获取目标数据,整理采集数据、数据存储入库”等五个步骤对外显操作和内隐认知两个层面的数据进行采集。同时,针对采集过程中可能出现的问题做到以数据库作为采集基础、清晰定位显隐性行为、保持采集的针对性和规范性、合理应用采集数据等。
大数据;网络学习;行为采集;系统模型
随着网络技术的不断发展与成熟,信息正在以指数级的速度迅速增长。在这种爆炸式增长趋势的影响下,有市场研究机构预测,到2020年整个世界的数据总量将会增长44倍,达到35.2ZB。[1]海量庞杂的数据,将给人类社会各领域带来革命性的影响。在这个数据量剧增的时代,大数据概念应运而生,并且在医疗、电子商务、通信、教育等领域产生了革命性的影响。我国教育领域的发展与改革面临着前所未有的挑战,以教育大数据驱动教育向个性化、智能化方向发展已成为时代发展的必然趋势。
网络平台中所保留的各类行为记录作为在线教育领域中重要的教育数据,一直以来备受研究者的重视。在大数据理念的深入传播下,如何构建有效的行为数据采集模型,满足各类学习行为数据采集的需要,已成为大数据支持下的学习行为采集过程中亟待解决的一个现实问题。但是现有的学习行为数据采集模型的研究大部分关注于学习者的实际操作行为(即显性操作),却忽视了学习者的心理变化(即内隐认知层面的知识内化过程)。而学习效果的好坏,除了研究可见的操作行为,不可见的知识内化过程也是一个重要的研究方面。基于此,本文从在线学习的显性行为和隐性行为两个角度构建网络学习行为采集模型,并对采集模型构建中的关键问题进行初步探讨,以弥补当前采集模型中只关注显性学习行为忽视隐性学习行为作用的不足,为后续研究者提供参考。
1.国内研究现状
互联网的普遍应用给生活带来便利的同时也产生了庞大的数据,如何采集这些数据,并从中提炼出有价值的信息成为研究的热点问题。采集方法因情况而异,可以首先根据服务平台的运行模式设计采集分析模型,利用其中的采集原理监控用户行为实现对数据的采集。例如张计龙等人为研究图书馆电子资源的用户信息行为,架构ERU系统数据采集分析模型,利用ERU数据采集原理,捕捉网络传输底层电子资源数据包并重新封装建模,对用户访问页面实行页面仿真建模分析,采集用户IP、检索、浏览、下载等显性操作行为,实现对图书馆电子资源的使用统计分析和访问监控。[2]也可以利用合适的采集技术匹配相关行为数据,实现针对性采集。譬如张玉芳等人采取网络嗅探采集方法采集多用户、多站点访问环境下的用户浏览行为数据,在大量用户HTTP请求中抽取能够反映用户浏览行为的有效点击页面请求,再经过一系列筛选过程过滤清理采集到的数据。[3]夏天利用聚焦网络爬虫技术,以论坛中的公共网络舆情数据采集为例,通过限定爬虫爬行方向,构建用户数据深度定向采集模型。采集到的数据包括用户发布的话题、评论以及涉及的图片等。[4]网络学习行为数据采集在教育领域实施较少,并且采集范围主要集中某一方面行为。例如廖竞等人采用开源软件netmate工具和成熟算法设计出一种灵活的网络学习行为数据采集和分析系统,首先将获取到的数据流与学习行为样本库进行匹配,之后以指定文本形式流出,文本文档在经过格式处理后进入分类器接受分类,最后可视化显示分析结果。[5]可以看出,国内采集模型具有集统计与监控功能为一体、迁移应用、定向深入、灵活性强等优势。但在深入挖掘用户行为方面存在不足。例如张计龙、张玉芳等人提出的数据采集模型只能采集到用户的站点信息、点击请求等浅层次显性浏览等操作行为,没有深入用户内隐认知层面。夏天提出的深度定向采集技术虽然可以深入用户思维相关的行为中,即可以采集到用户隐性行为,但是研究采用的爬虫技术只适用于评论类行为,不能采集到总结反思等隐性行为。廖竞等人提出的数据采集系统将所有行为数据混合在一起采集多有不便。如果首先将学习行为分为外显操作和内隐认知两个层面,再根据数据类型的不同使用合适的采集工具,分析会更加全面具体。
2.国外研究现状
由于互联网最早起源于美国,因此国外在网络数据采集方面的研究与实践均早于国内。近年来,网络社交逐渐成为最主要的交流方式,通过采集社交应用程序中用户行为数据来研究用户行为得到一批学者的广泛关注。例如2012年,Fehmi Ben Abdesslem等人基于Facebook社交应用程序,在应用中部署程序与服务器数据库进行数据交换的网络接口来实现直接监视、采集用户在线分享内容,另外,文中也提到其他可以收集用户在社交网站分享内容的方法,例如通过HTTP请求和相应分析自动化脚本等方法。[6]这种采集方法主要依赖于应用程序,缺乏迁移性,应用程度不高。对于单一的网络数据采集技术研究,Eric Rice等人提出网络数据收集的混合方法,即结合自由回忆名称发生器采集到的网络信息反馈数据和半结构式定性访谈得到的网络关联编码数据,但是研究鲜有提到该方法涉及的技术工具。[7]网络学习行为数据采集方面,Karin Anna Hummel等人基于Web在线学习平台,提取数据库中的访问记录和服务器中的日志文件,来分析学习者的学习行为,不限时间和地点,具有良好的可移植性和应用性。[8]可以看出,国外的数据采集模型虽具有针对性、迁移应用性等优势,但也存在不足,例如只是采集表面的文字信息、简单操作行为等,没有深入采集用户的隐性认知行为等。
综上,网络学习行为种类繁多,涉及的数据也无比庞大,虽然国内外都有学者对网络学习行为数据的采集工具与技术进行探究与实践,但是这些研究大多只涉及对显性学习行为数据的采集和挖掘,鲜有学者对隐性认知层面的学习行为数据的采集方法进行研究。而隐性学习行为更能体现学习者对学习内容的掌握情况。所以本文将首先分类网络学习行为,再分别介绍显性学习行为数据和隐性学习行为数据的采集技术。
大数据时代的来临给教育带来的变革远远超乎了人们的想象。网络学习资源、网络学习行为、网络学习主体等要素的变化都在向着可记录、可分析的方向发展。[9]网络学习行为是一个多维度、多层次的结构体系。[10]在进行网络学习的过程中,学习者的学习行为形式多样,根据学习的有无意义,可分为有意义学习行为和无意义学习行为;根据学习的深浅层次,可以分为深度学习行为和浅层学习行为等。为了实现对网络学习行为的描述,彭文辉提出了学习行为的分类模型——OCCP模型,并给出了基于OCCP的行为形式化描述,又结合网络学习的特殊情景要素给出了一个S-F-T的网络学习行为的三维描述模型。[11]但是OCCP模型仅仅是对网络学习行为进行了层次的划分,并没有根据网络学习的特点进行具体化、实例化。而S-F-T模型主要偏向网络学习行为的外显行为,认为只有外显行为才能在网络学习行为记录中得以观察,外显行为就反映了个体学习心理。本研究认为,显性操作行为反映的是学习者的日常学习状况(如是否登录平台进行学习、学习时长等),由此来分析、判断学习者的学习情况过于片面。而隐性学习行为数据是通过分析学习者提交的相关文本内容,能更全面、更客观地反映学习者对学习内容的理解情况。因此,本研究在调研了十几个具有代表性的网络学习系统的基础上将网络学习行为分为外显操作层面和内隐认知层面。
1.外显操作层面
外显操作行为主要指学习者在学习平台发生的登录、浏览、查询等简单的点击性操作。学习者的外显操作是其进行学习时的外部直接表现,比如登录的时长和频率、讨论的次数等,这些简单的操作可以直接反映学习者在何时何地发生了哪些学习行为,进而可以客观地判断学习者的学习情况,为深层次挖掘学习者的学习成效奠定基础,根据各学习平台学习者的操作行为将外显操作行为分为:登录操作、查询操作、媒体操作、交互操作、记录操作和共享操作(见表1)。
表1 外显操作层面的网络学习行为分类
2.内隐认知层面
内隐认知行为主要指学习者在进行一系列显性操作行为后,汲取平台上提供的学习课程或资源,在头脑中加工并加入自己的理解,转化为自己所拥有的知识,即信息加工、知识内化的过程,在平台中发表自己的看法,发布学习成果,对学习进行总结反思等。如协作学习、提问答疑、提交作业等都是学习者将学习知识内化后的反应。该层面主要以学习者发布的文本信息为研究内容,通过挖掘文本信息的内涵来了解学习者学习的最终效果。经过对十几个具有代表性的网络学习平台进行系统的调研后,从讨论、提问答疑、协作学习、学习总结与反思、学习检测等五个方面进行深入研究(见表2)。
表2 内隐认知层面的网络学习行为分类
1.学习行为采集模型的构建
国内在学习行为采集模型研究领域方面,彭文辉等人构建了网络学习行为系统的概念模型;[12]胡运安团队以网络教学管理系统为背景,基于SCORM规范,提出了网络教学管理平台上的学习者模型及其学习行为采集分析、质量评估方案;[13]周岩借鉴理性行为理论(TRA)与技术接纳模型(TAM)构建了具有9个潜在变量的因果关系模型——“大学生网络学习行为模型”,并采用结构方程模型对理论模型与研究假设进行实证分析。[14]由于显性学习行为易于采集并且部分行为也能反映学习者的隐性学习情况,大多数学者以采集学习者的显性学习行为为主,对隐性学习行为的研究则一带而过,导致已有的学习行为模型研究大多针对于显性学习行为(即外显操作层面)进行采集,却忽视了对隐性学习行为的采集(即相关文本内容的提取)。在国外研究领域中,对学习行为分类和采集模型的研究甚少,多数为学习分析方面的研究,如:弗兰德斯为了对教师的课堂教学行为进行分析,提出“弗兰德斯互动分析系统(Flanders Interaction Analysis Categories,FIAC)”,将教师在课堂上的行为进行分类、编码、分析。[15]为了使学习行为数据采集得更全面,本文基于对网络学习行为数据的分类,从外显操作层面和内隐认知层面建立网络学习行为采集模型(见图1)。
图1 网络学习行为采集模型
网络学习行为数据来源十分广泛,该模型将学习行为分为显性行为数据和隐性行为数据并利用不同的方法进行采集,采用Google Analytics、Mixpanel、编程等方法获得学习者的IP地址、浏览次数、浏览时间等显性操作数据;采用档案袋评价、文本挖掘等技术获得相关的文本信息,最后将数据进行整合后分别存储到隐性行为数据库和显性行为数据库中便于后续的数据分析,数据分析后的结果为显隐性行为数据提供反馈。
2.学习行为数据的采集过程
学习行为数据的采集是进行学习行为数据分析的前提,也是整个采集方案的基础。[16]基于上述的网络学习行为采集模型将学习行为数据的采集分为:明确分析目标、列举采集行为,结合研究目的、分类采集行为,分析行为特征、找准采集工具,利用采集工具、获取目标数据,整理采集数据、数据存储入库等五个步骤(见图2)。这五个步骤之间紧密结合,层层递进,通过它们对数据进行筛选整合得到预定目标的学习行为数据便于后续的学习行为数据分析。
图2 学习行为数据采集过程
(1)明确分析目标,列举采集行为
在大数据时代,网络学习行为数据数量众多并且杂乱无章地分布在各个数据库中。面对如此庞大的数据,首先要明确研究目的。例如,分析学生学习风格需要采集“学习者登录平台操作、解题步骤、学习方式(视频、音频、图像)”等行为;分析学生对学习内容的掌握情况需要采集“提交作业、参加测验”等行为,并且在研究目的的基础上将涉及的所有行为列举、细化,如“提交作业的时间、次数、作业内容”等。
(2)结合研究目的,分类采集行为
在列举的行为中始终围绕研究目的将行为进行分类,分类的主要依据,见表1、表2,把操作层面的行为划分在显性行为类,认知层面的行为划分在隐性行为类。如“检索次数、学习频率”等能直接观察测量的行为为显性行为;“作业中表达的观点、见解”等不能直接量化只能通过分析文本的语法结构、表达方式、关键字等达到研究目的的行为为隐性行为。
(3)分析行为特征,找准采集工具
由于采集的行为众多,不同的采集工具的适用范围也各不相同,使用最恰当的工具进行采集不仅能减少工作量还能提高采集效率。如,利用Web日志挖掘技术采集学习者的注册信息和作业内容;利用档案袋评价技术跟踪、监控学习者的学习情况。当一种采集工具无法满足采集需求时可以使用多种工具来采集同一种行为数据,尽可能地使采集数据全面、客观。
(4)利用采集工具,获取目标数据
基于上述步骤进行的数据采集,当选取的采集工具不能满足研究数据的要求时要及时调整采集方案。如,学习者的评论内容十分有价值,但采集者没有进入学习平台数据库的权利,此时就要灵活调整采集策略,可以用逐条拷贝评论的方法来获取评论内容。由于采集到的数据过于冗杂,部分数据可能重复,因此在这一过程中需要对数据进行简单的筛选,最终获得目标数据。
(5)整理采集数据,数据存储入库
将显性学习行为数据和隐性学习行为数据运用不同的方法进行存储。若是先采集后存储可以采用RAM/DRAM组成RAM阵列,这种存储方法存储容量大且速度快,若为长时间高速采集可以将PC机作为存储库。[17]
3.学习行为数据的采集技术
采集较全面的数据需要采集技术的支持,结合网络学习行为的采集模型和采集过程,笔者介绍几种网络学习行为采集技术,帮助研究者获得有效的数据。运用表格的形式将显性行为数据采集工具和隐性学习行为数据采集工具直观的呈现(见表3)。
表3 网络学习行为采集技术/工具
(1)Google Analytics
Google Analytics(Google分析)是Google的一款免费的网站分析服务,用于跟踪学习者的访问频率、页面停留时间、运动轨迹、参与度等。只要在网页上加一段代码就能够显示丰富的图表式报告,直观地显示学习者学习的全过程。
(2)Mixpanel
Mixpanel是一家数据跟踪和分析公司,允许管理者跟踪各种学习者行为,并自动捕获和记录学习者的行为数据。管理者在学习平台网站中插入几行代码,学习者就可以访问Mixpanel的各种即时分析数据。该平台可以实时跟踪用户的评论数、订阅者数、like 次数、分享次数、页面浏览数量等。
(3)JavaScript
JavaScript是一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型,也是一种采用事件驱动的脚本语言,它不需要经过Web服务器就可以对用户的输入做出响应,在访问学习平台的某个网页时,鼠标在网页中进行点击、上移、下移、窗口移动等操作时,JavaScript都可以对这些事件给出相应的响应。Java抓取网页数据时可以简述为三个过程,一是抓取原网页的数据;二是解析数据;三是抓取网页JavaScript返回的数据。通过JavaScript可以检测访客的浏览器信息。
(4)百度统计工具
百度统计是百度推出的一款免费的专业网站流量分析工具,能够反映学习者是如何找到学习平台并浏览学习网站,在网站上做了些什么,可以帮助研究者改善学习者在学习平台上的使用体验,不断提高学习者的学习效率。主要可以用来分析学习平台页面和访客。
(5)Web客户端采集技术
客户端是用户用来访问Web站点所用的浏览器,可以精确全面地采集用户数据,并且可以避免采集过程中对用户的识别不准确的问题。主要有客户端脚本、客户端Agent、第三方软件等方法。
客户端脚本:是指使用脚本语言(JavaScript、VBScript)编写能够被浏览器解析的程序,通过对客户端时间的监控,可有选择收集用户行为信息。
客户端Agent:如基于Java的applet可让浏览器直接采集用户的数据,通过HTML代码中嵌入标记,当用户在浏览含有该标记的网页时可有选择性地将程序下载到本地运行。
第三方软件:在学习者的计算机上安装专用浏览器或视频监控器记录学习者的学习行为。
(6)Web日志挖掘技术
Web日志挖掘技术是把Internet、WWW和数据挖掘结合起来的一种新兴技术,该技术主要运用于采集学习者的显性操作层面的学习数据。当学习者访问网络学习平台或登录平台进行学习时,站点服务器和学习者的主机都会记录学习者的学习行为信息。服务器主要记录所有学习者访问站点的信息,这些信息是记录在Web日志中,而客户端主要记录的是本台计算机的使用者访问学习平台的信息。
Web日志挖掘技术主要是在海量的日志中迅速找到学习者的访问信息,如学习者频繁访问的路径、频繁访问的网页。该技术的主要数据来源是Web服务器日志、Web站点的拓扑结构和站点文件、学习者的注册信息、学习者的访问信息、cookies以及与网站服务相关的数据库中的数据(见图3)。
图3 Web日志挖掘过程
(7)档案袋评价技术
美国西北评价联合会(Northwest Evalnation Association)认为:档案袋是对学生作业的一种有目的的搜集,这些作品要能够展示学生在一个或多个领域中付出的努力,取得的进步或成就。[18]其中包括学生作品或对作品质量进行评价的文件夹,是用来描述学生成长,捕捉学生成长和进步轨迹的记录,是对学生的学习情况进行跟踪和监控的重要工具。
电子档案袋评价首先需要教师设计并建立每位学生的电子学习档案,教师布置任务后学生可以在档案袋中上传学习成果(如实验报告、学习计划等),及时反映学习状况,最后教师根据教学目标和学生的实际学习情况来评价学习效果。采集每位学生的电子档案中的内容也作为研究的数据之一。
(8)文本挖掘技术
文本挖掘技术主要用于采集隐性认知层面的学习数据,文本挖掘技术从散布在学习平台文本文件中抽取有效、有用、有价值的知识,可以反映一个学生的学习状况,文本挖掘技术结合文字处理技术分析蕴藏在学习平台中非结构化的文本源,如学生电子学档、电子表格、邮件、论坛讨论、问题查询等,从其中抽取或标记关键字概念和文字间的关系,按照相应的内容进行分类,获取有利于学习分析的有效数据(见图4)。
图4 文本挖掘过程
(9)WEKA
WEKA是一款免费的、非商业化的、基于Java环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理、分类、回归、聚类分析。
(10)SPSS
SPSS是用于分析运算、数据挖掘、预测分析和决策支持任务的软件。采用类似Excel表格的方式输入管理数据,数据接口较为通用,能方便地从其他数据库中读入数据。输出结果十分美观,存储时则是利用专用的SPO格式,可以转存为HTML格式和文本格式。具有操作简便、编程方便、功能强大、数据接口多样、模块组合便捷、针对性强等特点。
(11)网络爬虫软件
网络爬虫是一种按照一定的规则,自动抓取网络学习平台信息的程序或脚本,分为传统爬虫和聚焦爬虫。传统爬虫是通过源码解析来获得想要的内容;聚焦爬虫是根据一定的网页分析算法,过滤与主题无关的链接,保留有用的链接放入抓取的队列中。所有爬虫取得的信息将会被储存,进行一定的分析、过滤,并建立索引以便之后的查询和检索,还能为爬虫取得过程给出反馈和指导。
1.以数据库作为采集基础
数据库是网络学习行为数据的存储场所,同样,本研究也将数据库作为网络学习行为数据采集模型的起始点。对网络学习行为数据采集需要提前做好规划设计,首先就要根据研究范围选择合适的数据库。这里考虑的研究范围主要有两个:一是针对应用特定平台的一定学习者的网络学习行为的研究,比如教师或学校利用某一平台进行教学,对运用该平台学习的本班或本校学生的网络学习行为进行分析研究,这种情况只需深入该平台后台调用数据库,根据学生用户名选择数据并导出。二是研究广泛学习者的普遍学习行为,需要选择具有代表性的多个学习平台,针对各个平台的数据存储方式选择合适的采集工具对数据库中的数据进行采集。
2.对显性行为、隐性行为清晰定位
在网络学习行为采集研究中,显性学习行为数据是指能用相关采集技术采集到的学习者的操作行为,包括学习者的IP地址、登录次数、登录时间等固定、客观的数据。通过分析该数据可以大概了解学习者的学习情况,即是否有效利用网络学习平台进行学习以及参与学习活动等。隐性学习行为是相对于外显操作行为而言,不能直接通过采集数据反映的,是学习者知识内化后的体现。其主要通过深入挖掘学习者在学习平台上发布的文本信息,如表达观点、发表评论等,分析文本内容体现的学习者的学习情况。内隐认知是大脑思维的产物,外显操作是在思维驱使下产生的,二者既有联系又有区别。研究者要根据研究目标确定需要采集行为的类别归属,即显性或是隐性,并且对不同类别的行为采用相应的采集技术和分析方法。
3.采集应保持针对性和规范性
由于各类采集技术特点不同,适用范围不同,行为数据也有各有特征,所以一种采集技术不能采集到所有数据。显性学习行为和隐性学习行为分别体现学习者的外显操作和内隐认知情况,采用合适的技术分开采集不仅可以加快效率,也可以降低出错率,使采集过程具有针对性。采集模型规定了行为数据分类和相关采集方法,具有一定的严密性。在采集过程中,无论采集范围大小,都要依据采集模型,按照流程顺序依次进行,切不可随意颠倒和更改,要保证采集过程严格的规范性。
4.合理应用采集数据
数据采集成功后,要及时对数据进行整理、分析和存储。采集到的数据并非全部有效,因此要对其进行数据筛选。比如:在采集隐性学习行为时,利用在线平台导出数据库中所有的评论信息到Excel表格中,其中包括评论信息的编号、代码、评论时间、内容等,其中只需要评论的内容,因此就要删除其他无关数据。数据分析阶段选用分析方法尤为重要。可以结合编码框架对学习行为进行编码,再将数据导入学习分析软件GSEQ中生成残差表进行分析。编码框架的获得有三种:一是引用已有编码框架,如Gunawardena的知识建构模型,布鲁姆的认知层次模型等,引用时要注意研究主题与框架研究主题是否吻合;二是结合研究目的改编现有框架,根据自身需要作相应调整;三是自编编码框架,当没有适合自己研究主题的编码框架时需要自主设计编写,但要经过效度检验才能实际应用。数据存储是数据采集过程中的一个重要部分。由于显性学习行为数据和隐性学习行为数据采集方法不同,代表意义不同,笔者建议分开存储。另外也可以利用学习分析系统的多个子系统来存放不同类型的数据,如学生信息系统(SIS)、学习管理系统(LMS)和课程管理系统(CMS)等。系统采集到信息并将数据分类后,以一定格式存储到相应子系统中,例如学习者基本信息存储到SIS中,学习者测验情况存储到LMS中,日常表现情况存放到CMS中。[19]数据存储方式可以采用脱机存储,脱机存储是在读写数据时需要人为地将存储介质放入存储系统的一种存储方式,用于永久或长期保存数据,且不需要介质当前在线或连接到存储系统上,常用介质有磁带和移动硬盘。另外建议数据建立备份,防止丢失。
[1]吕佳宁,魏芳.大数据下网络视频类用户行为分析[J].新闻爱好者,2014(7):38-40.
[2]张计龙,殷沈琴,陈铁.基于ERU的图书馆用户信息行为数据采集方法研究——以复旦大学图书馆为例[J].图书馆杂志,2014(12):10-16.
[3]张玉芳,张艳华,熊忠阳.一种高效的用户浏览行为采集方法[J].计算机工程与应用,2013(3):126-129.
[4]夏天.Web数据的深度定向采集[J].山东大学学报(理学版),2011 (5):34-38.
[5]廖竞,张晖.一种灵活的网络学习行为数据采集与分析系统[J].信息与电脑(理论版),2011(1):85-86.
[6]Abdesslem F B,Parris I,Henderson T.Reliable Online Social Network Data Collection[M]∥Ding-Zhu Du,My T.Thai.Computational Social Networks.London:Springer-Verlag London,2012:183-210.
[7]Rice E,Holloway I W,Barman-Adhikari A,et al.A Mixed Methods Approach to Network Data Collection[J].Field Methods,2014,26(3):252-268.
[8]Hummel K A,Hlavacs H.Anytime,Anywhere Learning Behavior Using a Web-Based Platform for a University Lecture[C].L'Aquila,Italy:Proceedings of the SSGRR 2003 Winter Conference,2003.
[9]陈然,杨成.大学生绿色网络学习环境的构建研究[J].江苏开放大学学报,2014(3):27-32.
[10]孙利.基于CELTS和Web Services的学习行为采集分析模型设计与实现[D].天津:天津师范大学,2006.
[11]彭文辉.网络学习行为分析及建模[D].武汉:华中师范大学,2012.
[12]彭文辉,杨宗凯,刘清堂.网络学习行为系统概念模型构建研究[J].中国电化教育,2013(9):39-46.
[13]胡运安,吕智慧,吴杰,等.基于SCORM的学习行为采集模型的设计与实现[J].计算机工程与应用,2004(33):106-108,151.
[14]周岩.基于TRA和TAM的大学生网络学习行为模型构建[J].中国电化教育,2009(11):58-62.
[15]Aspy D N,Roebuck F N,Black B.The Relationship of Teacher-Offered Conditions of Respect to Behaviors Described by Flanders' Interaction Analysis[J].The Journal of Negro Education,1972,41(4):370-376.
[16]廖竞,张晖.一种灵活的网络学习行为数据采集与分析系统[J].信息与电脑(理论版),2011(1):85-86.
[17]庞晓晖,胡修林,张蕴玉.高速数据采集及存储技术研究[J].华中理工大学学报,1999 (3):69-71.
[18]肖志明.电子档案袋在远程教育中的应用研究[J].广西教育,2012(27):78-79.
[19]赵磊,朱泓.网络开放课程之学习分析模式探微[J].江苏开放大学学报,2014(4):38-43.
责任编辑张军涛
The Collection Model Design of Big Data-Supported Online Learning Behavior
WANG Liu-hui,HOU Yue,YANG Xian-min/
Jiangsu Normal University
Online learning behavior collection,a main step of learning analysis,is important to the implementation of learning analysis,and is significant to the efficiency of the learning analysis results.There are five steps of collecting online learning behaviors on levels of externally explicit operation and implicit cognition.They are determining the target of analysis and listing the collection behaviors,classifying the collection behaviors according to research objectives,analyzing behavior features and selecting collection tools,getting the target data by using the collection tools,systemizing and storing the collected data.Meanwhile,for the possible problems in the process of collection,it is necessary to keep the database as basis for collection,clearly position explicit and implicit behaviors,maintain the target and normalization and rationally apply the collected data into practice.
big data; online learning; behavior collection; system model
2016-04-08DOI:10.13425/j.cnki.jjou.2016.04.009
王榴卉,江苏师范大学智慧教育学院(18361350283@163.com);侯悦,江苏师范大学智慧教育学院(843980339@qq.com);杨现民,江苏师范大学智慧教育学院副教授,教育学博士,主要从事智慧教育、移动与泛在学习研究(yangxianmin8888@163.com)
国家级大学生实践创新训练计划项目“大数据支持的学习行为记录与发展性评价运用研究”(201410320029)