陈苏娜 许新华 叶伊 陶胜阳 张若谷
湖北师范大学计算机与信息工程学院 湖北黄石 435002
个性化学习为世界各国提高国民素质,增强国家创新能力方面做出了巨大的贡献。早在2012年教育部发布的《教育信息化十年发展规划(2011-2020年)》中就提到,要为学习者提供方便、灵活、个性化的信息化学习环境。在2018年我国教育部发布的《教育信息化2.0行动计划》中同样表示了“未来要构建数字化、智能化、个性化的教育体系”。而在2020年新冠疫情防控期间,网络教学使得大量学习数据积累和爆发,为挖掘大数据、人工智能技术以及个性化学习提供了巨大机遇。
个性化学习推荐技术是指在“互联网+”信息时代背景下,在众多研究者通过实践探索在信息科学、教育管理等领域得到的重要理论以及个性化学习理论的基础上,对学习者的学习数据进行整理和分析,从而形成学习者画像模型,并使用相关算法参考学习者的需求给学习者们提供可能需要的个性化学习资源。尹婷婷[1]提出了一个个性化学习推荐流程,模型如图1所示。
图1 个性化学习策略推荐技术流程
随着在线教育和混合式教育的发展,教育数据大量积累,也让学习者画像技术的发展在不断成熟。个性化教学提倡以人为本、因材施教,而学习者画像能够对学习者的学习行为进行“数据化”,客观地展现出个体学习行为的整个过程,对跟踪、建模、个性化学习推荐的开展意义重大。学习者画像的本质是对学习者特征的描述、分析和呈现。借助学习者画像通过学习分析,可以将教育大数据进行标签化、可视化,从多个维度分析学习者特征,深入了解学习者,把握学习者的个性化学习偏好,为个性化学习推荐奠定基础。
学习者画像的研究主要集中在构建画像和应用画像这两个方面。构建画像方面,乔慧[2]、杨浩[3]等通过聚类分析、分类分析、回归分析、关联规则等方法,并在此基础上研究学习者画像模型的构建。而在画像应用方面,唐烨伟[4]、王峥[5]等利用学习者画像的预测能力对学习者进行个性化推荐以及成绩预警。
数据是学习者画像的核心部分,可以通过这些大量的数据对学习者进行学习者画像的刻画,为学习者的个性化需求提供数据支撑,动态数据和静态数据都是学习者画像数据的组成部分,只有动静结合才能保证学习者画像的精准程度。例如学生的姓名、专业和年龄等这些就是静态数据,动态数据则是指学习者学习时的评论、互动、资源选择等数据,它从一定程度上反映了学习者的学习风格、学习兴趣,这些数据会随着学习者自身的因素,比如学习兴趣改变等发生改变。莫尉[6]提出在收集学生数据的时候一般采用三种方法,分别是社会调查、感知技术采集和网络数据采集。
社会调查是通过访谈、问卷和观察等方法来了解学生。感知技术是通过智能终端或可穿戴设备来获取学习者行为数据,如通过脑电实验对学习者学习时的脑电波图形进行分析,从而获得学习者关注的学习内容和学生学习兴趣的图像。网络数据采集能够采集到大多数研究者构建画像所需要的数据,也是进行画像研究的时候最主要的数据来源。
数据收集到的主要是四类信息:学习者基本信息数据、内容偏好数据、学习风格数据以及社交互动数据。学习者的基本信息可以在在线平台上导出。内容偏好数据是表示学习者在学习的时候比较喜欢的领域,其中包括学习者对课程的选择和关注的课程类型、课程记录、上课时间等信息。学习风格数据主要是根据学习者选择的媒体类型和学习资源类型进行确定的,也就是学习者最常表现出来的比较稳定的兴趣和倾向。社交互动数据是学习者在学习过程中产生的互动内容,包括内容收藏、评论的次数以及讨论的话题和交互的伙伴。通过这些数据给学习者进行个性化学习推荐。这些采集来的数据需要经过无关数据的删除、缺失值和偏差值的填补校正、数据格式的转换处理等,之后才能用于分析和建立标签以及学习者画像。
学习者画像的框架是学习者画像的基础,学习者画像的构建框架通常会影响到个性化策略推荐的精准度。不同学者构建的画像框架略有不同,他们会将画像分成不同的维度。有学者把画像分为学习者的基本属性、行为特征、偏好特征三个维度[7]。陈海健将学习者画像分为了基本特征、知识点兴趣、学习者类型、学习风格偏好四个维度[8]。
参考以上学者学习者画像的维度划分方法,将收集到的四种数据类型根据笔者研究的需求和重点进行改进,划分为四个维度进行分析和建模从而去解学习者的多维度情况,分别是四个维度:基本信息维度、内容偏好维度、学习风格维度、社交互动维度。同时根据刘海鸥等[9]设计的学习者画像的个性化学习精准服务框架进行改进,运用大数据处理、聚类分析、关联挖掘、深度学习等相关技术,建立学习者画像个性化推荐框架。将这四维度划分在个性化策略推荐应用中给画像分成三个层次:数据获取与处理层、画像挖掘层、画像应用层,如图2所示。
图2 学习者画像个性化策略推荐框架
数据获取与处理层是学习者画像精准度的根本保证和必要前提。在这一层中主要是收集学习者基本的静态数据和个性化的动态数据,同时要注意保护信息的隐私,确保数据收集和应用的合法性,通过在线学习平台导出学习者的各类信息,然后进行数据清洗、数据转换、数据规约、数据聚类,将这些信息转化为可以被识别的结构化数据。
画像挖掘层是学习者画像提供精准个性化服务的核心。在这一层根据数据获取与处理层中处理好的数据形成学习者的标签,学习者标签能够将学习者的个性化特征更加的具体化,标签一一对应收集到的数据类型,学生信息数据用基本信息标签来表示,内容偏好数据用内容偏好标签来表示,学习风格数据用学习风格标签表示,社交互动数据用社交行为标签表示。接下来使用相关的算法,形成精准的学习者画像,然后使用相关算法实现个性化学习策略的推荐。
画像应用层是在前面两层的基础上,通过学习者画像的分析结果按照学习者的潜在学习要求以及个人需求的不同,给学习者提供个性化的学习策略,比如给学习者匹配风格相似或者风格互补的学习伙伴或者给学习者规划科学的个性化的学习路径,激发学习者的学习热情,再或者给学习者推荐不同的学习资源,提高学习者的学习效率,最后将这些策略通过在线平台推送给学习者,方便学习者使用。
在线学习可以让学习者在学习内容上的选择更加丰富,学习资源的获取方式更加多样、容易,但是学习者进行分散学习的时候容易产生自控力低下等情况,这样会导致学习者的学习效率低下,达不到预期的学习效果。通过学习者画像,可以将学习者画像分析出的不同学习者的学习行为和内容偏好形成学习者的学习风格,将学习风格相似或者学习行为互补的学习者作为学习的伙伴。
推荐学习风格相似的伙伴就是让学习行为和内容的选择偏好上更加相近的学习者进行搭配。这种推荐方式有利于学习者之间有共同话题,从而提高学习者探讨学习问题的积极性,让学习者更有学习动力,提高学习效率。推荐学习行为和偏好互补的学习者,可以让互补的学习者相互学习并产生相互督促学习的作用,能让不同学习者之间取长补短,相互协作,提高学习效率。
在线学习的学习资源丰富,学习者能够从成千上万的课程中进行选择,但是如何从这些课程中选择到符合自己学习需要和学习风格的课程从而完成学习任务是难题。学习者画像可以通过它的预测作用帮助学习者进行个性化学习路径推荐。根据学习者画像中的动态数据分析出学习者感兴趣的学习内容再结合学习者当前的学习需要,科学地帮助学习者进行学习路径的推荐。根据学习者画像挖掘学习者的学习行为和学习平台资源的偏好属性,同时对学习资源进行分类和归纳处理。对学习者画像和学习资源进行关联,生成学习者对学习资源需要的类似的合集。通过语义关联技术分析学习课程之间存在的内在关系,然后得出学习者已有旧知识和新的学习内容的关联,帮助学习者进行个性化学习路径的规划。但是因为在线学习者所处的教育环境和教育背景不同,以及不同学习者之间的学习能力也存在差异性,因此学习者在学习过程中的学习效果也大相径庭。这也就导致学习路径在推荐的过程中会呈现多样化、复杂化以及非连续性等特征。所以,在个性化路径推荐的过程上,需要充分考虑学习者的自身因素,对学习者画像进行动态修正,从而保证个性化路径的推荐始终能够满足学习者当前的需要。
个性化学习资源是通过不同学习者的个人需求和学习风格进行推荐的。根据学习者学习时自主选择的学习资源的种类和学习者画像分析出来的学习风格的不同,通过关联规则算法深入分析不同学习者的需求,有针对性地给不同的学习者推荐学习者感兴趣的以及符合学习者学习风格的纸质资料、视频、音频等多媒体学习资源。针对学习者的特点,在课程前后主要推荐纸质的资源和课件,帮助学习者理解和掌握知识。如果学习者对纸质资料的知识感觉难以吸收,需要有人能够协助进行加强记忆,那么就可以给学习者推荐相对应的视频资源,帮助学习者理解和吸收书本上的知识。
个性化学习资源的推荐,给学习者更多样化的选择机会,针对不同学习者的不同薄弱环节进行加固。同时这种差异性融入教学,可以为学习者提供差异性的考核和话题等测验方式,让学习者学习兴趣提升的同时,更好地检测不同学习者的学习效果。
个性化学习已经成为现代教育教学的一种趋势,本文通过探究学习者画像的构建方法以及画像在个性化学习方面的应用可以看到学习者画像对于促进个性化教学有着巨大的作用。目前学习者画像技术在个性化策略推荐的应用上仍然面临着许多挑战,学习者在学习过程中的数据和行为并不是单纯的一个静态的数据,而是一个变化的动态的过程,所以构建学习者画像的时候也应该充分考虑学习者的变化,对画像进行动态修正,从而保证学习者画像始终能够给学习者提供更加适合学习者需求的学习策略。通过本研究可以知道同一个人在不同课程中的画像也会因为外部因素不同而产生变化,今后的研究可以通过对比同一人在不同课程上的学习者画像,开展探究影响学习者画像因素的研究。