李春秋
(安徽商贸职业技术学院 信息与人工智能学院,安徽 芜湖 241002)
随着人工智能、物联网和云计算等技术的成熟,大规模开放网络课程(MOOC)的兴起和发展,网络在线课程数量不断增加,在线平台注册用户群越来越庞大,但根据《中国互联网教育发展趋势报告》可知在线平台用户使用率不到20%.这充分说明用户对在线教育学习效果、平台课程质量和平台使用体验不够满意.在商业领域,采集用户的需求、特征信息构建画像模型,可以对用户进行精准服务.目前画像工具已经应用于京东商场、淘宝及今日头条等多家企业的产品设计.在线学习中学生的行为表现可以预测学生的学习效果和课程完成率.因此,在线学习领域中可以收集学生在线学习行为数据用于构建在线学习者画像,为教师了解在线学习群体提供一个工具,有利于解决在线学习中相关问题.如何采集在线学习者行为数据,存储和管理这些数据是构建学习者画像的重要工作.2013年ADL项目组提出了基于SCORM标准建立的接口规范xAPI,基于该技术规范下,通过LRS(学习记录系统)可以实现在线学习者在任何平台的行为信息和学习经历的存储与检索.本文设计了基于xAPI规范的在线学习者画像框架,构建了在线学习者个体和群体画像模型.为在线学习者提供个性化服务,为教师合理组织课程提供依据.
用户画像用来描述用户群体的特征,进而了解用户群体的分布和需求等.用户画像目前已经广泛用于各领域,如单晓红等将通过用户评论构建用户画像判断用户需求进而实施精准营销[1];许鹏程等通过从自然维度、兴趣维度、社交维度,构建多维度、立体化的用户画像模型应用于数字图书馆,实现了图书馆的精准推荐、个性化检索等功能[2];王威娜采用模糊聚类和RFM模型对商场会员进行画像,以达到精细化管理会员,合理安排商场策划促销活动,从而促进实体零售行业更好地发展[3].在教育领域中,部分学者也开始了对学习者学习行为及用户画像模型进行研究和实践.白雪利用聚类分析法对网络学习行为分类,从而挖掘不同类型学习者在学习行为和学习效果间的关系,从而为提升学习效果提供了更加合理化的对策[4];张涛等通过网络浏览行为研究小众领域用户画像模型构建并实现了该领域的个性化推荐[5];操菊华通过构建用户画像助力思政教育,提高了思政教育的针对性和实效性[6];陈海健等从学习者属性、类型、学习风格、兴趣等维度构建用户画像,实现了对学习者的个性化推荐[7];唐烨伟等通过教育大数据中的学习者基本情况,学习过程和学习结果大数据构建了学习者画像模型,为学习者规划个性化学习路径,从而促进了学习者个性化学习[8].由此可见,学习者画像是用户画像在教育领域的应用.但是已有的研究主要针对应用研究或者模型构建,对学习者画像的构建流程尚未明确.
xAPI是一种采集和存储数据的标准,可以实时跟踪、记录学习者的在线行为数据,并对数据进行分析处理,且不依附于平台,具有扩展性.基于xAPI的交互技术,可以实现学习方法、教学内容的定制以及个性化推荐学习资源.Yee-King MJ,Grierson M等采用xAPI数据标准采集程序员非正式学习行为记录,对其学习行为分析[9].张斯亮采用xAPI行为数据化标准采集行为数据,建立行为分析模型对网络学习行为进行分析并反馈给学习者,从而提高学习者的学习效果[10].因此,xAPI标准可以在不同学习平台中应用,可以实时地、详细地记录和管理学习者的学习行为.对构建精准的在线学习者画像具有重要的意义.
学习者在网络平台中进行学习,他们的各种学习行为活动产生了一条学习经历(Experience),学习经历被学习记录提供者(LRP)跟踪并记录,然后LRP创建该学习者的学习记录并发送存储于学习记录系统(LRS)中,LRS授权学习记录消费者(LRC)查看和使用学习记录.基于xAPI的学习者在线学习经历追踪过程如图1所示.
图1 基于xAPI的学习者在线学习经历追踪过程
确认需要追踪基本属性和行为属性是实现整个追踪的必要条件,是构建画像的基础.这些属性必须能够全面地描述学习者的学习状态,才能对学习者需求进行深度挖掘,从而为学习者提供个性化服务,提高学习效率.
在xAPI技术规范中,Statement记录每一位学习者的学习经历,其结构主要为“Actor(操作者)+Verb(动作)+Object(对象)”,Statement除了这3个主要属性,还包含其他可选属性,见图2.针对教育领域xAPI标准没有设计具体的内容,本研究通过对在线学习者的基本属性和行为属性的追踪和总结,提出了基于xAPI的在线学习者特征模型,如图3所示.其中,Knowledge(知识特征)是学习者对某个专业领域的认知水平,通常是指对概念、步骤和事实等的掌握程度;Behavior(行为特征)是学习者学习过程中表现出来的,通常是指学习者学习过程中测试、留言、收藏、分享、下载等活动;Attitude(态度特征)是学习者于在线平台学习中对知识表现出的主动或被动的行为倾向.
图2 xAPI的学习行为数据Statement结构
图3 基于xAPI的在线学习者特征分析
从数据基础层(数据保存,数据采集)、数据处理层(数据分析,生成画像)、数据挖掘层(推荐应用)等3个层次5个方面构建用户画像,如图4所示.数据保存是学习者在不同的在线平台中学习时,遵循xAPI规范的在线平台采集模块就会形成一条统一格式的学习经历数据,并把数据存储于学习经历数据库中;数据采集是收集学习者相关数据,包括学习者基本信息、知识特征数据、行为特征数据、态度特征数据等各类信息.并把这些数据信息转换为xAPI语句格式,存储为“Statement活动流”的格式.采集到的数据通过LRS进行分析,分析引擎对xAPI格式的数据进行组合分类,从而形成画像标签,借助相关算法对画像标签进行深入分析,输出知识掌握程度、行为偏好、学习态度等3个维度的子模型的画像.最后基于协同过滤的推荐算法对在线学习者进行个性化学习资源推荐、差异化教学推荐等.从而有效地提高在线学习者的学习效率.
图4 基于xAPI规范的在线学习者画像的总体架构
3.2.1 基于xAPI的数据收集和分析
数据采集包含两方面内容,一是采集数据的类型,二是采集数据的方式,数据的采集直接影响最终结果的准确性和有效性,是下一步分析的基础,也是“Statement”作为描述跟踪学习体验的数据结构语句必须要明确的内容.学习者在线学习时,可以使用各种设备(如手机、iPad、PC等)获取线上学习资源,满足了碎片化、异地学习的需求,学习者能更多地有针对性地选择学习内容,个人学习需求得到了最大限度地满足.在xAPI规范下,Actor(主体)、Object(对象)以及Verb(动词)这3个属性必不可少,Object(对象)是与主体进行交互的对象,在线学习中主要是指学习者学习时需要操作的资源,如表1所示.基于xAPI规范的Object(对象)是本研究中的数字资源对象.Verb(动词)是记录和描述学习者的学习活动,帮助研究人员了解二者之间的交互情况.如“学生A完成了(Complete)一单元测验,学生B观看了(Watch)视频20 min,学生C分享了(Share)一篇技术文档等”.通过规范化的定义,可以追踪并量化学习者的学习行为,从而建立xAPI格式的学习记录数据.
表1 基于xAPI规范的Object(对象)
学习者在线平台的所有学习经历会被LRS(学习记录系统)以Statement的形式存储,并且可以根据Context(前后情景)加入相关的信息,以元数据、描述性信息以及补充数据的形式分解这些学习信息.如表2所示,设计了在线学习者基于xAPI的部分活动流.利用分析引擎对采集的学习经历数据进行分析,形成可视化数据.再通过统计分析、聚类分析等方法确定影响学习者学习的因素,从而对学习者进行提前干预,提高学习者学习效率.
表2 基于xAPI的部分活动流设计
3.2.2 精准画像模型构建
(1) 画像类型
A.个体画像
用户画像是描述用户的数据,是符合特定需求的对用户的形式化描述.因此,在本文中在线学习者个体画像是从知识、行为、态度3个维度对学习者个体形式化的描述.构建用户画像的核心就是给用户打标签,学习者标签从多个维度对学习者个体特征标识进行提炼,然后对标签进行分类.如学习者的姓名、性别、年龄、专业、学历等信息属于基本属性标签.还有一些需要通过对学习者标签进行分析、计算,通过一定的规则生成的新标签,如对学习者在线观看视频的时长、频率、测验结果、课后讨论和评价等信息进行综合分析,然后形成一个可视化的个体画像.从而为个体学习者在知识需求、学习效果、学习习惯等方面提供个性化的服务.
B.群体画像
通过关联规则、聚类分析、神经网络算法等对学习者的行为数据进行分析,可以构建不同的在线学习者群体.从知识、行为、态度3个维度构建学习者群体画像,并计算上述3个维度的特征或者相似度,把最相似的两个个体合并为一个群体,然后继续计算,直到把所有的学习者个体都分类到具体的群体中.需要主要的是,这个分类会随着学习者基数的增加及学习者行为数据的变化不断发生变化.群体画像把相同或者相似的个体在线学习者划为一个群体,可以帮助在线学习者之间相互交流、共享资源.同时,教师可以根据画像群体中成员学习情况推荐个性化学习路径和资源给新加入的成员,帮助平台管理者优化平台,提供决策依据.
(2)基于人工智能的在线学习者画像建模
构建画像的核心就是给在线学习者打标签,利用深度神经网络对在线学习者的线上学习行为和前后情景相关特征进行提取,并通过相关分析进行建模,抽取在线学习者标签.首先,通过抓取用户注册信息,提取学习者年龄、性别、学历、专业等事实标签.这些标签方便平台资源管理者和在线学习者与画像比照,进而推荐最适合学习者学习发展的资源.其次,利用人工智能技术和推荐算法,采集在线学习者知识特征、行为特征、态度特征数据,并提取基于上述3个维度的模型标签.然后,根据设计的xAPI活动流数据和标签库,对标签进行分类,最后形成在线学习者画像.在这里需要强调的是,数据收集是随时随地的,是不断增加的,并不只是针对某一个时间段和地点.数据的增加表示学习者的维度也逐渐增加,通过神经网络分布式的存储分析数据之间的关联规则.通过基本数据信息组合形成新的表示特征,更好地对学习者进行形式化描述,建模是逐层逐步进行的.新的标签可以对学习者的隐性学习需求及学习满意度进行预测.进一步更新和完善了标签库,从而让模型进行迭代,生成更加精准的在线学习者画像,如图5所示.
图5 精准在线学习者画像模型
传统的在线学习平台中,由于对学习者的需求分析不够充分,导致在线学习者流失率高、课程完成率低、学习效果不明显等现象.网络学习环境不同于传统校园学习环境,网络资源丰富、各种诱惑较多,是在线学习者学习遇到的最大问题,因此针对不同的在线学习者群体提供的资源要能满足该群体中大多数学习者的需求,同时可以为个体学习者提供精准的学习服务,精准在线学习者画像的构建能够满足上述需求.通过丰富的学习资源和先进技术可以实时地了解学生的学习进程和知识掌握程度,进而实时地评价学习者学习效果.通过机器学习了解学习者对某一类资源的使用频率(如观看频率、下载、转发、分享等)及对该类资源的评价,可以判断学习者对该类资源的情感取向,结合其他学习者对该类资源的情感取向,检索正向情感取向的学习者学习的资源对该学习者进行个性化推荐.通过推荐算法计算学习者的相似度,根据相似度推荐大多数学习者选择的学习资源给其他有共同需要的学习者.最终促进学习者之间共享学习经历,相互吸取优秀的学习经验.
通过大量的学习者样本构建群体画像,然后对输出结果进行比对、分析进而整合成学习者群体发展报告,可以分别为教师、学校或者教育管理者实时呈现教学活动实施的具体情况,教师可以根据学习者画像,及时调整授课资源和授课内容;同时,可以根据学习者画像发现各类群体学生,进而对不同群体的学生进行差异化教学.学习者画像能够全面客观地对学习者学习过程进行伴随性评价,因此,学校或教育管理者,可以根据画像提取潜在流失类及高风险流失类学生的发展轨迹,及时对该部分学生进行预警和针对性干预.
本研究通过访谈法和调查问卷的形式对输出的学习者画像进行评价.首先访谈的为我校智慧课堂相关教师,大部分教师认为基于xAPI的在线学习者画像作为一种新的学习分析工具,能够清晰地呈现出学习者的群体特征,很好地反映学生的学习状态(如学习意愿,学习成绩等),方便教师更加清晰地了解学生,进而关注易流失学生群体,节约了时间和精力.其次随机选取50位参与智慧课堂在线学习的学习者进行调查问卷,通过调查发现,基于xAPI的在线学习者画像能够让学习者实时掌握自己的学习状态和学习行为,并及时调整个人学习习惯从而达到了更好的学习效果.
研究了基于xAPI的在线学习者画像构建可行性和流程,利用xAPI规范对学习者学习经历进行追踪,通过知识特征、行为特征、态度特征3个维度构建了基于xAPI的在线学习者画像,并研究了通过建立标签进行精准画像建模的方法.以期在教育信息化2.0时代,为学习者提供个性化服务,为教师改进教学内容和教学方法提供依据.也希望更多的学者研究xAPI和用户画像在教育领域中的应用,以应对教育信息化带来的挑战.