基于协同过滤算法的个性化课程推荐服务

2019-09-10 13:10:35李星雨宋娜何锦儿胡雪婧刘小萌
现代信息科技 2019年24期

李星雨 宋娜 何锦儿 胡雪婧 刘小萌

摘  要:学分制背景下的选课制,更多的是以一种硬性的要求规定了学生必须以相对灵活的方式进行课程选择。虽然这种要求在一定程度上结合了作为选课主体的学生的意愿,但在发挥学生选课兴趣的主观能动性方面考虑不足。本文基于文献调查法,希望通过建立选课问答社区实现对用户偏好的分析,为广大学生提供个性化课程推荐的服务,以此建立一套更有效、更多元、更契合学生发展方向的选课系统。

关键词:选课系统;问答社区;协同过滤推荐系统;个性化课程推荐

中图分类号:TP391.3      文献标识码:A 文章编号:2096-4706(2019)24-0121-03

Abstract:The course selection system in the context of the credit system is more of a rigid requirement that students must choose courses in a relatively flexible manner. Although this requirement combines the will of the students who are the subject of the course selection to a certain extent,the subjective initiative of the students is insufficiently considered in course selection. Based on the literature survey method,this paper hopes to establish a course-based question-and-answer community to analyze the user’s preference and provide a personalized course recommendation service for the students to establish a more effective,more diverse and more suitable course selection system.

Keywords:course selection system;question-and-answer community;collaborative filtering recommendation system;personalized course recommendation

1  绪论

1.1  研究背景与意义

随着现代教育的不断进步,高校教育逐渐朝着多元化、自主化、个性化的方向发展,再加上学生规模扩大,新型教育模式涌现,高校的定位也从单纯传授知识的场所变成为学生良好未来打下基础、提供帮助、塑造人才的优良环境,为学生提供契合自身发展的课程成为高校的重要任务,这就要求当今高校拥有一套高水平、高性能、与学生成长计划高度贴合的选课系统。

然而,目前大部分学校的选课系统主要满足最基本的学分要求,学生在进行选课时只能了解到基础的任课教师、课时安排、学分分配等情况,反而对于课程内容,培养方向,是否适合自己等情况知之甚少,所以本文希望通过建立选课问答社区,对学生浏览数据,交流数据进行抓取、追踪,进而为广大学生提供个性化课程推荐的服务,以此建立一套更有效,更多元,更契合学生发展的选课系统。

1.2  国内外研究状况

近些年,国内外关于选课系统的研究受到越来越多的关注,王辉指出,如何依据学生的兴趣爱好和学习需求提高选课质量、避免选课盲目性,从而实现合理课程的主动推荐已成为当前教育领域所关注的内容。[1]

关于问答平台,王丽萍指出,问答社区方便用户基于自身需求与能力提出问题、解答问题,通过汇聚用户经验、知识与智慧,构建具有社会媒体属性的知识库。[2]

而针对本文着重探讨的个性化推荐服务也有不少研究,其中主要是通过协同过滤推荐算法抓取数据并进行推荐,推荐系统各有不同。施文丽指出,推荐系统主要分为基于关联规则的推荐算法、基于内容型的推荐算法、协同过滤推荐算法以及混合型的推荐算法四种。[3]

1.3  研究内容

本文以解决选课系统功能单一的问题,建立更有利于学生个性发展的选课系统为主要内容。在分析传统选课系统弊端的基础上,提出建立师生、同学间相互交流的问答平台的设想,并在此平台设想中引入协同过滤推荐算法,对学生的兴趣爱好、知识水平、未来打算等数据进行抓取分析,最后形成适合学生个人的一套或多套课程推荐。

2  以问答社区为主的信息集成平台

2.1  平台前期构建设置

平台将会构建课程信息与性质说明页面,此页面将包含课程类别、开课教师简介、课程内容及要求的描述等信息,学生在选课前可自主浏览相关信息,有助于充分了解课程情况,以选到真正适合自己的课程。

发掘用户兴趣主要有两种形式:显式获取和隐式获取。显式获取是指用户主动提供自己的兴趣偏好,进而获取用户的个性化向量,在该平台表现为:在用户进入平台之前,需自行注册一个账号用于登录平台。用户在初始界面可以挑选与课程相关的关键词并设为标签,如“艺术”“体育”“全英文授课”等等。隐式获取则是通过用户访问的相关信息来更新用户的个性化向量,即以问答社区抓取的浏览痕迹作为基础。

2.2  问答社区

2.2.1  问答社区概述

问答社区是一种为用户提供信息的网络社区,其充分体现了Web2.0时代下的互联网特点,通过营造知识交流环境,促进用户角色翻转——在问答社区中,用户既是知识的消费者:利用此类社区提出需要解决的问题,通过获取其他用户的回答,达到解決问题的目的;又是知识的生产者:在此类平台上回答问题、评价其他用户提供的问题或答案。

一方面,问答社区是依托Web2.0技术搭建的无物理边界的意见沟通平台,允许用户基于自身需求与能力提出问题、解答问题;另一方面,问答社区通过汇聚用户经验、知识与智慧,构建具有社区媒体属性的知识库。用户可以凭借语义关联与聚类检索等手段深度挖掘具有衍生性、共享性与非消耗性特质的目标知识,实现用户在问答虚拟社区的深度互动,形成以“问”“答”价值链为主导的知识服务场域。这两方面共同展现了用户在问答社区平台中的间接偏好。

2.2.2  问答社区目的

问答社区模式旨在形成共建共享的参与意识,以及构建深度交互的知识生态系统,同时十分重视服务内容的个性化和精准程度。通过为用户提供基于大数据的交互式信息服务和基于信息问答的个性化推荐服务,增强用户信息服务满意度,提高信息服务的靶向性与时效性。

2.2.3  问答社区优势及爬虫技术应用

提供靶向定制服务内容是问答社区模式的突出优势,通过话题分类、提问原则、投票机制等方式引导用户参与评价。此外还可通过爬虫技术抓取用户初始浏览痕迹,对用户偏好进行分析,进而为用户推送更多可能感兴趣的相关答案和同类型话题,为用户提供系统化的问题解决方案,从而进一步增加用户在平台的活动量。浏览痕迹的反复叠加使得系统对用户的偏好定位更加精准,从而为后续的个性化课程推荐打下坚实的基础。

3  个性化推荐课程

3.1  个性化推荐系统的概述

推荐系统即是一种用来解决大量数据信息的有效方案,基本原理就是根据每一个目标用户的代表特征,首先以目标用户对产品的偏好为中心,其次对目标用户留下的历史数据进行统计分析,预测出目标用户可能感兴趣的产品,再为其推荐符合需求的产品,从而形成个性化推荐服务。

区别于搜索引擎提供给用户的“一对多”的推荐服务,推荐系统的一大优势就是生成的结果更贴近于用户的个性化需求,更贴合用户的兴趣偏好,属于“一对一”式的信息推荐服务;另一优势就是推荐系统极大降低了用户用于搜索相关信息所耗费的成本和精力。

本文采用当下最普遍的协同过滤推荐系统作为理论依据。

3.2  基于物品的协同过滤推荐系统

协同过滤推荐系统的理论基础是,大部分具有相似三观、知识水平和兴趣爱好的用户所需求的信息或产品也是相似的。基于物品的协同过滤算法也同样是通过计算物品间的相似程度,自动为目标用户进行筛选。在操作过程中,先对每个待选产品定下特征标签,然后该系统自动爬取目标用户过去的历史浏览记录、点击或下载等潜在信息和行为,分析出目标用户的兴趣偏好,最后结合用户的偏好和待选产品的特征向目标用户推荐一系列其可能感兴趣的产品集合。

3.3  基于物品的协同过滤推荐系统在个性化选课系统中的应用

协同过滤系统的应用不需要通过学生填写调查问卷等繁琐的方式收集信息,该系统是通过自动抓取目标学生的历史选课记录、选课搜索记录、学校开设课程类型数量、课程信息、问答平台中获得的用户偏好以及学分,组合排列进行处理,系统通过对课程定下的特征标签,利用较少的信息反馈,有效解决原始搜索引擎难以分析的各个学生兴趣课程的难题,自动为学生用户筛选、推荐出其最大可能感兴趣的课程。

如图1所示,绝大部分学生用户在选课时不能清楚了解课程内容是否适合自己、是否对于课程内容感兴趣,以及选修课程是否能够提升自己的知识水平。协同过滤系统的自动化推荐过程有利于学生用户在选课的时候发现自己的隐藏兴趣课程,并在选课时快速找到适合自己的课程。同时,该算法将具有相同标签的课程作为一组,以课程标签为类别进行分类。通过学生的浏览历史记录等隐藏信息和具有参考价值的反馈数据,进行相似性度量,在学生用户选择一门课程后预测后续课程中拟合度最优的一门课程作为推荐。同样,当学生用户为某类课程类型的新用户,即之前并没有相关课程的历史选课记录时,协同过滤系统以学生的选课历史搜索记录、历史课程类型和反馈数据为基础进行相似性度量分析,自动推荐新的课程。

交流平台中课程的信息以及根据学生讨论区所形成的课程推荐为反馈数据。学生讨论区的反馈数据的一部分来源于问答社区用户提供的答案,因此对于答案的质量管理也十分必要。系统根据学生对这些数据信息的点赞数量以及综合评分筛选出高质量的回答予以反馈,因而交流平台中的信息结合了学校官方的反馈与学生的切身体会,使推荐课程的反馈数据部分质量提升。再运用协同过滤系统,将反馈数据与发掘学生潜在兴趣偏好的个性数据相结合,得出的课程推荐结果可同时考虑到学生的兴趣和选课需求。

4  结  论

通过此选课互动交流平台和个性化推荐服务,希望解决目前选课系统中存在的课程介绍不清晰、与学生发展贴合度低等问题,为学生提供更适合、更有效的选课手段。同时通过交流问答的形式实现信息的共享,使学生在选课之前对课程的基本情况有相对具体的了解,既为学生了解课程信息提供了便利,又丰富了课程选择的余地,希望能为每一个学生找到适合自己的课程,为学生的未来发展锦上添花。

同时,本文依然存在不足的地方,由于条件受限,本文主要提出观点与设想,而对其有效性与实践性的证明还需要后续更加深入的调查研究。

参考文献:

[1] 王辉.基于协同过滤及决策树的选课评教系统研究与实现 [D].镇江:江苏大学,2018.

[2] 王丽萍.智慧图书馆知识服务新思路:问答社区模式的启示与应用 [J].出版广角,2019(13):74-76.

[3] 施文丽.基于网易云音乐的协同过滤推荐系统研究及实现 [D].济南:山东师范大学,2019.

作者簡介:李星雨(1999-),女,汉族,上海人,本科在读,研究方向:创新管理。