基于开源软件Sakai平台开发的个性化在线学习系统解决方案探究

2018-04-22 01:31傅伟司

科教导刊·电子版 2018年34期

摘要本文在学习用户兴趣模型的基础上，利用遗传算法在学习资源模型中推荐比较适合学习用户的个性化学习资源，是基于遗传算法的个性化学习资源的生成。在线学习系统和移动互联网学习APP应运而生的“互联网+”时代中，对个性化在线学习系统进行了基于开源软件Sakai平台开发的解决方案探究，给出了该系统的初步结构设计。

关键词 Sakai平台个性化在线学习系统设计个性化学习资源生成

中图分类号：G642文献标识码：A

0引言

Sakai是由美国印地安那大学、密西根大学、斯坦福大学和麻省理工学院于2004年共同发起的一项开源CMS（课程管理系统）计划。目前Sakai的用户主要是一些大学的远程教育机构，中小学应用的还几乎没有。全球范围内超过160个教育机构在使用Sakai平台，在我国的高校中，华东师范大学、华中师范大学、北京邮电大学、西南大学、复旦大学、上海交通大学密西根学院在Sakai基础上开发满足不同需求的产品并投入使用。与Blackboard、Moodle等课程管理系统相比，Sakai采用先进的技术架构（JaveEE）、企业级的应用能力（支持Orcale数据库）、更加注重学生之间的协作学习和小组学习以及免费开源、更加适合教学和科研，Sakai在我国的网络教学将会越来越受到青睐。

1 Sakai运行环境

Sakai的协作和学习环境是一个免费、共享源代码的教育软件平台，它提供一组软件工具来帮助需要开发一个共同用于协作或学习环境的研究院校、商业组织和自主群体创建一个用于协作的网站。Sakai是基于Java的系统平台，利用Sakai进行二次开发，其运行环境如表1。

2分析设计

2.1基于Sakai开发的个性化在线学习系统整体架构

（1）Sakai与图书馆资源的集合，实现Sakai课程管理系统与图书馆资源的有效整合。

（2）Sakai与教务系统集成，把教务系统的选课关系映射到Sakai中的选课。

（3）Sakai与在线录播系统的整合。

（4）数字校园门户集成，统一身份认证。

（5）课程管理系统。

（6）学习活动管理系统。

（7）与自行开发的个性化在线学习系统集成。

（8）校际合作。

Sakai提供了一些核心工具，包括有课程大纲（Syllabus）、课程通知（Announcements）、日程表（Schedule）、资源（Resources）、术语表（Glossary）等，利用Sakai平台进行二次开发，其功能设计主要包括：

（1）教学信息发布：包括发布教学通知、课表等，所有内容均以题目列表的形式给出，用户可点击相应标题查看具体内容。

（2）教学资源共享：包括课件、视频、参考书目的上传、下载。

（3）教学讨论区：提供一个公共的课程讨论空间，所有人可以对当前所关心的问题进行自由发言，每个人均可看到其他人的发言。

（4）Wiki（创新功能）：设置问题解答区或书籍编辑区;所有与课程相关的人都可以将自己的问题发布在此处，并且可以对此区域中的所有问题进行解答或修改、补充已有的解答，以达到认知协作、共同提高学习水平的目的。

（5）Sakai平台里还有一个工具叫做练习与测验，在此工具下面有一个题库工具，教师可以建立一门课的题库。

（6）资源推荐：利用前面所研究的开发具备个性化资源推荐的功能模块，整合到Sakai平台。

（7）交互功能设计：内容交互与社会性交互。内容交互主要是指学习者与课程內容之间的交互。社会性交互使得学习者可以向教师或同伴学习，在一定程度上消除网络课程环境下学习者个体的孤独感。

2.2学习资源建模

个性化的在线学习系统模型，主要包括学习用户兴趣建模模块和学习资源建模模块。以下主要介绍学习资源模块。

2.2.1学习资源的组织结构模式

传统的学习资源组织的结构模式是按树状结构和课程的章节去划分的，每个学生的学习路径没有什么区别，如图4，学习者要学习一门学科的时候，从树结构的左边到右边遍历各个子节点。

这种结构虽然不会让学习者遗漏章节知识点的学习，但是对于学习过程中的难点和重点是没有很大的帮助的，考虑本文个性化学习资源的在线推荐问题，这里考虑另一种结构模式，这种模式是基于知识点和概念之间的关联度，如图5，例如学习者要学习Dn这个知识点，那么就要具备C1这个知识点的相关知识，而具备C1的相关知识基础则是要具备A1到An的基础知识，否则，就会产生重新学习这些知识点的个性化学习序列。

2.2.2学习资源难度系数确定

给学习者推荐的资源，要考虑到资源的难易程度有没有和学习者的水平相适应，因此学习资源模型的因素要把学习资源的难度系数考虑在内。computerized adaptive testing（CAT）理论有一种基于统计的方法，根据此方法，学习资源的难度参数通过细致的测试过程来决定。

学习资源模型里包括有测试项目数据库和资源数据库，测试项目数据库里包括有前测项目和学习资源测试项目以及后测项目，前测项目是用来提供给学习者在使用该资源前衡量学习者的水平，后测项目是给予学习者巩固学习以及衡量学习者在使用该资源以后的效果。测试项目是由多位经验丰富的专家组根据相应的学习概念进行设计。学习资源的测试项目里，每个测试项目与学习资源相对应。

学习者在进行前测项目后，测试项目里面的错误集合成相应的学习概念，通过数据采样来测试包含这些学习概念的测试项目，根据IRT，测试数据会有统计的编程BILOG进行分析，以确定测试项目的相应难度系数，此难度系数也就是测试项目相对应的学习资源的难度系数，本文中难度系数用Di表示。

2.2.3学习资源模型表示

资源数据库的资源遵循元数据模式的标准，元数据建模的过程就是用ECS逐个扫描，句子分离成词，过滤掉数字符号等非文本词和一个字术语，表示该资源特征词语的元数据记录在XML文件，相应的XML文件与相应的资源进行绑定。用TF-IDF统计方法，计算该资源元数据里的特征词在该资源的权重。

TF：Term Frequency，关键词频，特征词语在该资源出现的频率，例如在一个M个词的学习资源里含有N个特征词，则

TF=N/M

IDF：Inverse Document Frequency，逆向文本频率，以此来衡量特征词权重权重的指数。D为资源总数，DW为特征词出现过的资源数。

IDF=log（D/DW）

特征词k在资源i的权重Wik通过TF-IDF获得。

Wik=TF*IDF

采用向量空间模型来代表每一个学习资源模型。

Xi={（Ti1，Wi1）}，{（Ti2，Wi2）}，…，{（Tik，Wik）}

其中，Xi表示第i个学习资源，Tik为第i个学习资源里的第k个特征词，Wik为该特征词在该学习资源里的重要程度。

2.3个性化在线学习系统结构设计

整个模型分为Online部分和Offline部分。模型结构图如图6。

Offline管理：数据准备将Web服务器用户信息的log文件以及用戶访问操作路径信息等生成的相应文件，进行个性化特征提取，获取学习者兴趣模型，并借鉴其他用户的信息选择经验，利用遗传算法进行用户模型的动态更新。

Online管理：通过课程资源库初始化种群，进行遗传算法操作，进化后的种群与学习者兴趣模型中的个体进行适应度值计算，即利用向量夹角余弦距离公式计算个体间的相似度，按适应度值大小排序，适应度值大的前N个个体构成课程资源推荐模块，给学习者动态推荐相应的学习内容。

其中，资源推荐模块的资源序列生成过程如图7。

3基于遗传算法的个性化在线学习资源生成的遗传算子

学习用户模型和学习资源模型的匹配机制，实现个性化推荐。推荐系统推荐给学习者的资源，不能与学习者刚刚看过的课程资源不太相类似，或者完全不相关，也不能与学习者看过的资源完全重复，这就是模型过拟合问题或者是可扩展性问题。数据的不完全性是此问题的原因，主要方法是使用遗传算法引入的随机性，因此，该算法收敛到全局最优解或全局最优，从而向学习者提供一个令人满意的学习内容。

3.1个体串定义

学习资源库里的项目和资源用1到n定义序号，序号的整数代码用以代表一个个性化串，也就是一个遗传算法的潜在解。一个序号代表一个染色体的一个基因。染色体表示如图8。

3.2适应度函数

为了给学习用户生成一个高质量的学习资源序列，适应度函数作为一个性能评判指标，因此适应度函数要包括用户兴趣模型里的个性化特征项和资源的拟合程度，同时还要考虑资源的难度系数Di。

用户兴趣模型：

学习资源模型：

根据前面章节的用户兴趣模型和学习资源模型的表示，用户兴趣模型和学习资源模型拟合程度表达式：

由此，适应度函数的表达式：

3.3交叉操作

如果一个学习资源推荐序列里含有重复的资源序号或者是资源序号超过了资源的总数，则这个序列为非法路径，为了避免非法路径的产生，采用两个父节点生成子节点的交叉操作方式。交叉几率设置为0.9（如图9）。

3.4变异操作

此处的变异操作和用户兴趣模型进化的变异操作是同样的。在染色体上，根据u* W+v* G （W 为特征项权重，G 表示基因效能， u和v 表示调节的参数）形成的比例信息，通过轮盘赌的方式随机获取某个基因后，删除该基因，由此获得一个新的原始后代。通过一定的变异率Pm，变异算子在染色体上选择基因，把该基因的特征改变，种群的差异性得到了保持，适当地提高了GA的搜索效率。

每迭代一次得到一个最优个体，把进化代数范围内的所有最优个体进行排序，将评价函数值排在前十位的所对应的学习资源作为一组结果指定为遗传算法的最终结果，作为推荐。

4本章小结

本文是基于遗传算法的个性化学习资源的生成。在学习用户兴趣模型的基础上，利用遗传算法在学习资源模型中寻找比较适合学习用户的个性化学习资源，给出了该系统的初步结构设计，并给出了基于开源软件Sakai平台开发的个性化在线学习系统解决方案。

作者简介：傅伟司（1987—），女，广东罗定人，硕士，研究方向为系统理论信息系统工程。

参考文献

[1] Gershon.Computer Adaptive Testing[J].Journal of Applied Measurement，2005，6（01）：72-77.

[2] 吕琳，韩永国.多Agent的个性化学习路径推荐系统设计[J].电脑知识与技术，2013，9（26）：5981-5984.

[3] Bohl，O.The sharable content object reference model （SCORM） - a critical review[J].ompter in Education，2002（02）：67-75.

科教导刊·电子版2018年34期

科教导刊·电子版的其它文章: 习近平新时代思想政治教育价值的新方向及其实现路径探析; 弘扬奋斗幸福观，提升党的意识形态影响力; 工会组织服务于党建工作的有效途径; 习近平新时代中国特色社会主义思想的精神品质; 如何有效实现国企党建工作的创新; 高校推进学习型党组织建设理论与实践探析