庄科君 贺宝勋
摘 要 学习者模型是网络学习个性化推荐系统的关键部分。本文在學习者信息模型规范的基础上构建了网络学习个性化推荐系统学习者模型框架,并论述了学习者特征信息的采集途径和分析技术。
关键词 学习者模型 建模 个性化推荐
中图分类号:G642文献标识码:A DOI:10.16400/j.cnki.kjdks.2015.10.018
The Modeling Research in Personalized Recommendation
System Based in Network Learning
ZHUANG Kejun, HE Baoxun
(China West Normal University, Nanchong, Sichuan 637009)
Abstract The learner model is the key part of web based personalized recommendation system. Based on the learner information model standard, this paper creates the learner model framework in the personalized recommendation system based in network learning, and discusses the way of collecting the characteristics of learner information and analysis technologies.
Key words learner model; modeling; personalized recommendation
网络学习个性化推荐系统的主要功能是能根据学习者的学习特征向学习者自动推送适合学习者的学习资源、学习活动和学习策略,是网络环境下实现个性化学习的支撑平台。学习者模型是对学习者特征的抽象和表示,是网络学习个性化推荐系统的核心和关键部分,其好坏直接关系到个性化推荐系统为学习者提供个性化服务的水平,因此,构建合理的学习者模型成为搭建网络学习个性化推荐系统平台的瓶颈问题。
学习者模型建模的关键主要是要解决以下三个问题:首先,需要确定学习者模型主要描述学习者的哪些特征信息以便为系统提供最可靠的推荐依据;其次需要考虑这些学习者特征信息如何获取和采集;第三,对采集到的信息如何处理才能准确表征出学习者的特征,以此为基础为学习者提供个性化的服务。本文将就学习者模型建模的这几个关键问题展开讨论。
1 学习者模型框架
学习者模型是系统建立的对学习者特征的描述,其主要功能是对学习者的基本信息、学习风格、学习活动过程中的学习行为、学习路径、学习的绩效表现等信息进行记录、存储、提取,以帮助系统更好地理解学习者在学习过程中的个性化需求,从而为学习者提供个性化的学习服务。CELTS-11学习者信息模型规范将学习者特征信息分为个人信息、学业信息、管理信息、关系信息、安全信息、偏好信息、绩效信息和作品集信息八类,但这八类信息对学习者特征信息的描述在粒度上较为粗糙,需要在此基础上做进一步的拓展。结合网络学习中学习者的个体差异,全面考虑学习过程中影响学习的学习者因素——包括智力因素和非智力因素,我们在CELTS-11的基础上对学习者特征信息进行扩展、归类合并,构建出网络学习个性化推荐系统学习者模型框架图(如图1所示)。网络学习个性化推荐系统学习者模型框架图由5种学习者特征信息组成,这5种学习者特征信息包含为学习者基本信息、偏好信息、学习目标、认知状态和知识水平。
图1 网络学习个性化推荐系统学习者模型框架图
2 学习者特征信息的采集
根据学习者特征信息在学习者模型中是否会随学习活动的开展而变化更新,我们将学习者特征信息分为静态信息和动态信息两类。静态信息主要指那些在学习活动过程中保持不变的信息,如学习者基本信息、偏好信息等,而动态信息则是那些会随学习活动的开展而变化更新的信息,如学习目标、认知状态、知识水平信息等。通过对学习者模型研究文献的梳理,我们发现,学习者特征信息的获取与采集方式主要包括两种方式,显性采集方式和隐性采集方式。显性采集方式是指系统在学习者知晓的情况下采集由学习者直接提供的信息的过程,隐性采集方式是指系统在学习者不知晓的情况下通过对学习过程中学习行为的监控而获取信息的过程。
2.1 学习者特征信息的显性采集法
学习者特征信息的显性采集法主要包括以下途径:搜集学习者第一次在系统注册时提供的注册信息以获取学习者的相关基本信息;通过调查问卷表获取学习者的学习风格、学习需求、学习目标、知识水平等的初始状态信息。通过显性采集法可以获取学习者模型中的绝大部分静态信息,如学习者的基本信息就是学习者注册时提供的,包括学号、姓名、性别、专业、毕业学校、民族、联系方式等;同时还能获取动态信息的初始数据,这些初始数据加上静态信息可以帮助系统建立起一个对学习者的初步认识,即对学习者模型的初始化。当学习者第一次进入系统学习时,系统可以依据初始学习者模型为学习者推送合适的学习资源、学习活动和学习路径,个性化地为学习者提供学习服务。
2.2 学习者特征信息的隐性采集法
隐性采集法主要通过实时跟踪并记录学习者的学习行为,分析学习者特征的方法。隐性采集法通常是在学习者不知晓的情况下进行的,因而不会像显性采集法那样会导致学习者在系统中的停留时间增加。隐性采集法采集到的信息是学习者在学习活动中的学习行为信息,会随学习活动的开展而变化更新,属于学习者模型中的动态信息,这些动态信息将是学习者模型更新的重要数据源。学习者模型将会对隐性采集法采集到的信息进行“学习”,从而修缮学习者模型,使学习者模型朝着越来越接近真实学习者特征的方向发展,使个性化推荐系统的个性化服务更趋于完善。
隐性采集法通常通过两种途径获取学习者特征的动态信息。第一种途径是系统跟踪和记录学习者在学习活动过程中的学习行为数据,如学习者对各种类型学习资源的访问次数可以反映出学习者对不同类型学习资源的偏好程度;学习者花费在某个知识点上的学习时间可以反映出学习者对该知识点的认知状态;学习者针对学习任务完成的作品集合数量以及练习测试的成绩数据可以反映出学习者的知识水平状态等。通过对这些学习过程中的学习行为数据进行跟踪、记录、挖掘,可以获取学习者特征中的动态信息,对静态信息进行补充和完善,使学习者模型对学习者特征的描述和刻画随学习活动的开展而更为准确全面。第二种途径是系统从与学习者相关联的网络学习伙伴、指導教师等的联系活动中搜集到的与学习者学习活动相关的数据,如学习伙伴对学习者在小组协作活动中的评价信息,指导教师在论坛、聊天室对学习者发言信息的评价等,这些信息都是判断学习者学习态度和学习能力的重要指标,这些信息对学习者模型中学习者特征的描述也是具有重要意义的。
3 学习者特征信息的分析步骤与技术
网络学习个性化推荐系统通过显性和隐性方式采集到的学习者特征信息往往是有噪音的,系统必须对这些数据进行分析、处理、归类和整合,才能获取能够表征学习者的特征值,作为系统个性化推荐的依据。
一般来讲,学习者在注册时向系统提供的显性信息,如学习者的姓名、年龄、专业、民族、出生日期、联系方式等信息可以直接被系统识别并作为学习者特征值存入学习者模型库。学习者在参与学习前或在学习过程中参与问卷调查的数据,如回答学习风格测量量表得到的数据列表等需要通过相应的规则进行计算,从而归纳总结出学习者的学习风格特征。除此之外,系统在学习者学习过程中通过监控学习者学习行为采集到的大部分动态信息如学习者的学习目标、学习路径、学习行为、学习状态、作品集合、学习交流协作等数据都无法直接作为学习者特征值存储在学习者模型中,需要对其做进一步的筛选、挖掘、整合、归类、重新描述之后,才能够作为学习者特征值存储于学习者模型中供系统实施个性化推荐使用,我们采用数据挖掘技术来对系统采集记录下的学习者学习活动的行为数据进行分析,挖掘出学习者的学习偏好、分析出学习者的学习状态和知识水平。对系统采集到的显性信息和隐性信息,使用数据挖掘技术分析学习者的特征需要经历两个步骤,数据预处理阶段和模式发现阶段。数据预处理阶段又包含四个步骤:首先,通过数据清洗对采集到的学习者特征信息进行筛选,将系统记录下的冗余信息和记录清除掉,筛选出那些能反映学习者特征的信息作为数据挖掘的数据源;其次,利用Cookies技术从服务器日志文件的记录中识别每一个用户;第三,识别会话,判断出用户对站点的访问;最后,对学习者的会话进行事件定义。通过数据预处理阶段得到的数据需存储起来作为模式发现阶段的数据源。模式发现阶段可以使用的技术主要包括决策树、规则归纳法、人工神经网络、贝叶斯网络、统计计算法和视频分析技术等。
4 结语
学习者模型的建立是网络学习个性化推荐系统的关键环节。本文在对学习者模型建模关键问题分析的基础下,构建了网络学习个性化推荐系统学习者模型框架,确定了学习者模型要刻画的学习者特征信息的类型,在此基础上,将学习者特征信息采集的方式分为显性采集法和隐性采集法,并对每种采集法的信息采集途径予以阐述,最后,论述了使用数据挖掘技术分析采集到的学习者特征信息的步骤及技术,对网络学习个性化推荐系统学习者模型建模的过程进行了有益探索。
基金项目:西华师范大学基本科研业务费专项资金资助项目“基于WEB的网络教学个性化推荐系统学习者模型构建研究”(项目编号:14D027)
参考文献
[1] 孙志伟.基于学习者特征分析的个性化学习支持系统的研究[D].天津:天津师范大学,2009:14-17.
[2] 李艳燕,马韶茜,黄荣怀.学习分析技术:服务学习过程设计和优化[J].开放教育研究,2012(5):18-24.