基于匹配有效性的教育资源推荐方案设计

2018-05-22 07:24韩颖铮黄儒雅
微型电脑应用 2018年5期
关键词:教育资源个性化维度

韩颖铮, 黄儒雅

(华南理工大学 信息网络工程研究中心,广州,510640)

0 引言

教育资源建设是《国家中长期教育改革与发展规划纲要(2010-2020年)》[1]的重要内容和核心任务,随着信息化技术的发展,互联网中的教育资源数量日益庞大,庞大的教育资源给用户带来了更多学习机会的同时,也使用户容易迷失在资源海洋中。无论是站在用户的角度还要资源利用的角度,对于教育资源系统来说,个性化推荐技术的应用是非常必要的。

资源推荐技术在新闻、娱乐、购物等方面得到了成熟的发展,比如淘宝购物、优酷视频等[2、3],但在教育资源个性化推荐方面还是差强人意。教育资源推荐具有其独特性,需要更精准的需求契合,并要满足一定的知识增进的目标。本文综合了资源与用户匹配度及资源对用户预测有效度的评估,设计了一个基于匹配有效性的教育资源精准推荐方案。

1 模型设计

教育资源个性化推荐系统根据用户情况及需求精准推荐教育资源,用户主要是学生,教育资源则由大量教材资料、辅导资料、讲义课件、图书刊物、授课音视频、习题册、考试试题等数字化资源组成,如图1所示。

图1 教育资源个性化推荐系统示意图

为实现个性化推荐,匹配推荐模块需要收集足够的用户信息、资源信息,为用户匹配并推荐合适的资源。通过自动化程序进行用户与资源的匹配计算,首先要进行用户模型建模、资源模型建模提取特征信息,再以二者的特征信息建立匹配模型。

1.1 用户模型建模

学生用户是教育资源系统的主要用户,学生在系统上根据自身学习背景、学习风格和学习能力来寻找适合自己的资源,所以学生模型必须能够表现出学生的学习背景、学习风格和学习能力。学习背景指学生所处的客观学习环境;学习风格指学生个体在其心理、生理特征基础上形成的、接受和加工信息过程的持久性偏好[4];学习能力指学生掌握新知识的能力。

(1) 学习背景

学习背景决定了学生所需要学习的内容,体现为:学校、年级、专业、课程。教育部及学校的教学计划是依据学生所处的学习阶段安排其所学习的课程。学校是学生学习的一个重要背景因素,并因学历层次越高学校因素影响越大。同一所学校、同专业教师在教学过程中引导学生学习的资源内容大体一致。

(2) 学习风格

学习风格是学生在长期学习的过程中形成的习惯,推荐系统识别跟踪学生的学习风格,并根据其学习风格选择与之相适应的学习策略与学习资源,对于提高学习质量、学习效率和学习效果都有着非常大的帮助[5]。信息加工理论和认知理论[6、7]表明,学习风格可以划分为生理维度和认知维度这两个维度,本文采用这两个维度来构建学习风格特征。

学生通过视觉、听觉、动觉3个生理感觉通道接收信息。在生理维度下,从生理感觉通道偏好角度测量远程学习者学习风格特征,学生学习风格分为3个基本类型:视觉型、听觉型、动觉型。

视觉型学习者更喜欢视觉方面的刺激,喜欢通过视觉的途径来接受学习信息,例如书籍、图片、图像、视频等等;听觉型学习者在听觉方面比较敏感,通过听觉途径更容易接受学习信息,因此更擅长对语言和音乐的理解;动觉型学习者对触觉的刺激更敏感,倾向于选择借助触觉工具、手持型物体等辅助教学工具来接受学习信息,通过自己动手、亲身参与、实践、调研等的学习方式能够提高他们的学习效率。

认知风格是个体在组织和表征信息的过程中所偏好的和一贯的方式,在认知维度下,依Witkin(1964)提出的观点,学生可以分为两个基本类型:场独立型和场依存型。

场独立型学习者受到外界干扰相对较少,倾向于以内在为标准进行信息加工,善于独立对事物做出判断,适合于开放的教学方式;场依存型学习者受外界的影响较大,倾向于以外在环境为标准来进行信息加工,更喜欢集体的学习方式,思维比较循规蹈矩,讲究条理,适合于严密的教学方式[8]。

(3) 学习能力

学习能力就是学习的方法与技巧,有了这样的方法与技巧,学习到知识后,就形成专业知识;学习到如何执行的方法与技巧,就形成执行能力。学习能力是所有能力的基础[9]。通过学生的设置及系统对其长期学习习惯的归纳,推荐系统可以对学生的学习能力做出判断。本文将学习能力分为四个段:很强、较强、较差、很差。

1.2 资源模型建模

教育资源是教育信息化的重要基础。资源模型以学生模型为参照,从资源背景信息、资源素材类型和资源难度3个方面进行建模。教育资源背景信息反映在资源的基本信息、基本属性,根据这些信息能够把资源区分开来。资源背景信息与学生者学习背景相一致,体现为:适合年级,适合学校类型,所属学科,所属专业。数字化的教育资源类型非常多元化,划分资源类型有很多种方法,综合媒体类型及认知角度来划分教育资源。由于资源针对同一个知识点讲解的深度、拓展的广度不同,造成难易程度的差异。将资源难易度分为四个段:很难、难、容易、很容易。

1.3 匹配推荐

教育资源推荐系统关注学生的个性化特征,在海量资源中为他们选择合适的资源能更有效地提高学生的学习效率、激发学生的兴趣和提高学生的学习愉悦度,使学生更享受学习的过程,如图2所示。

图2 学生用户与教育资源之间的关系

教育资源推荐系统中的匹配推荐模块将建模后的学生用户、教育资源特征数字化,经过匹配算法得到教育资源与用户之间的匹配程度,再通过综合同类用户学习资源的效果及用户对资源的有效性评价预测,评估资源对用户的匹配有效性,根据匹配有效性值系统向用户推荐资源。

2 算法设计

本文的资源推荐方案以资源对学生的匹配有效性作为依据,匹配有效性综合了基本信息匹配度和基于优势比的匹配度两个部分结果,本节将对匹配有效性计算算法作详细介绍。

2.1 基本信息匹配度计算

由1.1节可知,学生模型的学习背景特征、学习风格特征和学习能力特征分别可表示为:

学习背景特征:{学校,年级,专业,学科}

学习风格特征:{认知维度,生理维度}

学习能力特征:{学习能力}

把这三组特征组合起来表示学生的整体特征,用向量SI表示:

SI:{sch,grd,sbj,maj,congn,phy,abili}

由1.2节可知,资源模型的背景信息特征、素材类型特征和难易度分别可表示为:

背景信息特征:{适合学校,年级,专业,学科}

素材类型特征:{资源格式}

难易度:{资源难度}

把这三组特征组合起来表示资源的整体特征,用向量RI表示:

RI:{sch,grd,sbj,maj,format,diffic}

SI和RI两个向量每一维特征的取值都是字符型的,本文把向量各维度取值以新的二进制编码方式表示,即把取值为字符型的向量SI和RI分别转变为取值为二进制的向量SI′和RI′:

SI′={s0,s1,…,sn},si∈{0,1},i∈{0,1,…,n}

RI′={r0,r1,…,rn},ri∈{0,1},i∈{0,1,…,n}

在编码过程中编码距离要体现取值之间的差距。以grd维度为例,取值彼此之间差距有大小之分,若取值集合为{初一,初二,初三},为使差距越大的取值的编码距离越大,如表1所示。

表1 grd维度取值对应的编码

以congn维度为例,取值集合为{视觉型,听觉型,动觉型},取值之间是等距的,则如表2所示。

表2 congn维度取值对应的编码

通过计算两个向量之间的汉明距离来衡量相似性:

⊕ri

可见,当D(SI′,RI′)取值越大,则SI′和RI′之间的相似性就越小,而当D(SI′,RI′)的取值越小,则SI′和RI′之间的相似性就越大。为避免编码长度对计算结果的影响,定义基本信息匹配度BM的计算如式(1)。

(1)

2.2 基于优势比的匹配度计算

学生学习资源之后效果到底好不好,可以体现在考试成绩或学生对资源的评价。但考试成绩反馈的不仅仅是一次资源学习的效果,因此学生对资源的评价更有独立评估价值。以ED(i,j)表示学生i学习了资源j后给这个资源有效性的主观评价,取值范围为(0,1]。

为了找出一个学习群体中的学生学好某一资源与学好另一资源之间的关联,引入优势比的计算。优势比又叫比值比或者相对危险度,一开始是流行病学研究中衡量一种可疑因素是否与某病的致病有联系的统计指标[10]。

假设当有效度ED(i,j)大于0.7时候为资源j对学生i有效。在同时学习了资源j和资源k的群体中,两个资源同时有效的人数为A,资源j有效而资源k无效的人数为B,资源k有效而资源j无效的人数为C,学习了两个资源后同时无效的人数为D,如表3所示。

表3 同时学习了资源j和资源k的群体的资源有效分布情况

则优势比OR为式(2)。

(2)

OR的取值范围为(0,+∞),在3-5公式的基础上提出归一化的改进优势比,如式(3)。

(3)

R的取值范围为(0,1)。R越大说明在这个群体中学好资源j与学好资源k的联系越密切,即认为一个用户学好了资源j,则他很可能也会学好资源k;或者他学好了资源k,则他很可能也会学好资源j。得到改进优势比R(j,k)之后,用R(j,k)作为权值,乘以以资源k对用户i的有效度ED(i,k),求得学习了资源j的用户i学习资源k的有效度的预测值。

通过计算学好一个资源与学好另一个资源的改进优势比,可以得出资源的优势比矩阵,如表4所示:

表4 改进优势比矩阵

假设i用户对其学习过的各个资源有效性的评价向量为:

(ED(i,0),ED(i,1),ED(i,2),…,ED(i,m))

要计算出学生i与目标资源k之间的匹配度,可以利用资源k与学生学习过的资源l的优势比值来作为权值,乘以资源l对用户i的有效度,即ED(i,l)·R(k,l),以计算学习资源l的效果好坏对学习目标资源k的效果好坏的影响。通过把资源k与学生i学过的同类资源都作一次这样的计算,再求均值得出基于优势比的匹配度YD(i,k),即式(4)。

(4)

2.3 匹配有效性的计算

把基本信息匹配度的计算公式和基于优势比的匹配度的计算公式综合起来,得到资源j对用户i的匹配有效性Comp(i,j)的计算式。

Comp(i,j)=α*BM(i,j)+(1-α)*YD(i,j)

把式(1)、式(2)、式(3)和式(4)代入上式,即可计算得到匹配有效性值。计算资源对用户的匹配有效性,再根据匹配有效性的排名,把相应的资源推荐给用户。

3 推荐方案的实现

根据第二节设计的模型及算法,在基于MapReduce的Hadoop集群平台上实现本文教育资源个性化推荐方案。在刀片服务器上搭建了一个小型的Hadoop集群,在Ubuntu12.04.1系统上布署了JDK1.7.0之后,安装Apache Hadoop1.0.4版本的软件项目搭建起集群。由于学生的年级、成绩、课程等信息都是结构化类型数据,存储在关系型数据库中,所以在Hadoop集群的基础上,再在各节点上安装Mysql数据库。

方案实现总体流程如图3所示。

图3 教育资源个性化推荐方案的总体流程图

包括两个部分:(1)供用户访问的Web前端系统;(2)后台推荐计算程序,根据用户的信息和资源的信息对用户和资源进行匹配计算,并把计算结果记录下来,把排名靠前的资源推荐给用户。

后台推荐计算运行流程分为以下3个步骤:

(1) 预处理:将数据库中的原始数据处理按预定的编码方式转换成二进制编码形式;收集用户对资源有效性的评价;

(2) 教育资源对学生用户的有效性计算:计算出优势比矩阵,与用户对资源有效性的评价向量相乘,得到每个资源对用户的有效性值;

(3) 资源推荐:根据资源有效性预测值排名为用户推荐资源。

4 总结

教育资源推送系统建设充分激发了海量教育资源的运用价值,充分考虑了学生学习背景、自身学习个性差异以及资源对学生的有效性,满足了学生用户的个性化差异,实现高效的个性化推荐。学生在线学习同时存在客观目标要求及主观内在需求,如何充分契合学生能力水平、客观目标、主观内在需求,是一个复杂的系统工程,展望以后的研究工作,还需要继续优化学生模型和资源模型,引入学生的兴趣爱好、行为习惯等特征,考虑数据稀疏时对优势比矩阵计算的影响,对匹配有效性的计算公式进行修正,提高推荐的准确性。

参考文献

[1] 国家中长期教育改革与发展规划纲要(2010-2020年)[EB/OL]. http://www.moe.edu.cn/srcsite/A01/s7048/201007/t20100729_171904.html.

[2] 洪亮, 任秋圆, 梁树贤. 国内电子商务网站推荐系统信息服务质量比较研究术——以淘宝、京东、亚马逊为例[J]. 图书情报工作, 2016(23):97-110.

[3] 罗辉海. 基于协同过滤的个性化广告推荐系统的设计与实现[D]. 北京:中国科学院大学, 2015.

[4] 陈丽,张伟远,郝丹.中国远程学习者学习风格特征的三维模型[J].开发教育研究,2005, 11(2):48-52.

[5] McLoughl in.C.The implications of the research literature on learning styles for the design of instructional material[J].Australian Joural of Educational Technology,1999,15(3):222-241.

[6] 杨治良, 郭力平. 认知风格的研究进展[J]. 心理科学, 2001, 24(3):326-329.

[7] 李素珍. 基于网络学习行为分析的网络学习风格与学习偏好挖掘模型研究[D]. 武汉:华中师范大学, 2009.

[8] 李平. 高职会计专业毕业生就业能力培养的路径[J]. 科教导刊, 2011(10):232-233.

[9] 百度百科:学习能力[EB/OL].http://baike.baidu.com/view/948151.htm

[10] 张照寰.相对危险度与归属危险度[J].冶金劳动卫生,1981,7(4):244-248.

猜你喜欢
教育资源个性化维度
理解“第三次理论飞跃”的三个维度
认识党性的五个重要维度
坚持个性化的写作
整合校外教育资源 做好青少年道德教育
浅论诗中“史”识的四个维度
新闻的个性化写作
上汽大通:C2B个性化定制未来
面向数字化教育资源的Flash到HTML5转换研究
自主学习视角下的开放教育资源文献综述(上)
满足群众的个性化需求