蒋雨恬 陈思宇 吴冰 刘江岳
摘 要 以苏州大学为例,开发智能选课辅助系统,创新性提出利用学生的兴趣爱好、就职倾向、生活习惯等多维度信息作为枢纽,搭建高校本科生和通识选修课程之间的桥梁,系统获得通识选修课程对多维度的贡献值并辅助学生完成相关维度的量表测量,通过计算匹配,按照贡献度推荐学生适切的课程,旨在解决学生选课过程中的盲目问题。
关键词 高校;智能选课辅助系统;通识选修课程;机器学习
中图分类号:G647 文献标识码:B
文章编号:1671-489X(2020)12-0029-04
Abstract This article uses Suzhou University as an example to develop an intelligent course selection assistance system. Innovative use of the students raised interest hobby, inauguration tendencies, habits and other multi-dimensional information as a hub, to build relationship between universities and undergraduate general educa-tion electives. The system obtains the contribution of general electivecourses to multiple dimensions and assists students to complete the scale measurement of relevant dimensions. By calculating the matching, the students are recommended to the appropriate courses according to their contribution. It aims to solve the blind phenomenonin the course selection of students.Key words colleges and universities; intelligent elective assistance system; general elective courses; machine learning
1 國内外研究现状
2018年4月,教育部印发《高等学校人工智能创新行动计划》,强调将“人工智能”“大数据”和“互联网+”融入高校本科教学管理,弥补人工智能技术在教学管理领域的缺失。搭建高校智能选课辅助系统,帮助本科生选择适切的通识选修课程,不仅能更好地服务于学生,也能够减轻学校教务管理工作负担。
通识教育经历了从无到有、从抽象到具体的发展过程,已成为高校本科教育的核心组成部分。早在20世纪70年代末,美国就组建了NSFNET(国家科学基金网),学生通过互联网接入网络教学管理系统,进行入学报名、选课、考试及毕业论文提交等学习生活。可见,国外的教学管理软件起步早、更成熟。
众多研究者指出国内当代高校选课过程的不合理性。学生选课存在盲目现象,学生为修满学分或取得高分,不了解课程间相关性,不清楚专业的方向性,选课随意性大。
目前,国内绝大多数高校的选课系统没有通识选修课程的信息,学生只能单凭课程名称进行选择。至于提供课程信息的高校,课程众多且系统中课程的信息不能及时更新,学生选课前需花费大量时间了解课程信息,使得选课成为学生业余时间里一项繁杂的任务。以苏州大学为例,选课系统中共有179门通识选修课程的信息,粗略估计15分钟浏览一门课程信息,则看完所有信息至少需要44个小时。考虑到系统支持在线操作的用户数量,学校提供给学生的抢课时间仅有10分钟,且选课系统需在校园网下访问。
为更好了解苏州大学通识选修课的情况,做了相关调查,调查对象为苏州大学在校本科生,问卷有效回收率为99%。被调查对象中男生占44.5%,女生占55.5%;文科生占35.00%,理科生占58.89%;2015级、2016级、2017级、2018级学生分别占10.5%、39%、28.5%、12%。据调查,在选课前有高达74.5%的学生对课程略有了解,而很了解的不到20%;学生选课的依据,39%来自专业的关联性,71%来自兴趣爱好,52.5%源自对未来职业生涯规划的贡献,而46.5%考虑是否容易通过;在课程结束之后,有多达一半的学生出现后悔,其中53.76%的学生认为选择与当初标准不同,55.91%的学生表示没有选择到心仪的课程,51.61%的学生认为课程内容枯燥无聊;在上课期间有少量学生基本没有上过课,多半以上的学生没有认真听讲;且60%的学生认为通识选修课程效果一般,没有太多的帮助。
出于对通识选修课程了解的缺乏,学生选择了不感兴趣、不适合的课程,上课缺乏积极性,导致出现旷课、缺课等现象。且学生对课程的满意度也不高,教育资源大有浪费之嫌。学校教务对于这一现象的管理也毫无突破。基于大数据的智能选课辅助系统的开发,不仅能更好地服务于学生,也能够减轻学校教务管理工作的负担。
2 系统概述
基于大数据的智能选课辅助系统利用兴趣爱好、生活习惯、就职倾向等信息作为枢纽,将高校在校学生与学校通识选修课程联系起来,通过计算匹配,给学生推荐适合他们个人特质的选修课程。
首先,开发智能辅助系统,将通识选修课程的多维度信息特征参数与兴趣爱好、生活习惯、就职倾向匹配,获取匹配的数值,即课程对兴趣爱好、生活习惯、就职倾向等多维度的贡献度。前期采用机器自动读取选修课程关键信息与人工训练相结合的方式得到选修课程贡献度的数值,后期改善为机器学习计算得出。
其次,在学生选课前,系统辅助学生填写关于兴趣爱好、生活习惯、就职倾向等自然维度与兴趣维度的量表。学生在填写量表、提交数据后,系统反馈学生用户自画像并生成推荐对各维度贡献值高的课程;对于未填写量表的学生,系统还提供一系列多层次的课程信息关键词,通过关键词渐进式遴选课程,最终推荐与该生需求相符或相近的课程。
在项目后期完善中,改善智能选课容易支配学生的缺陷。对于一些贡献度低、容易被忽视的课程,利用推送的方式介绍其价值意义,提示学生给予关注。
3 系统设计及实现
选课辅助系统采用B/S结构,由客户层、逻辑层和数据层组成。数据层采用Microsoft SQL Server关系型数据库管理系统,逻辑层采用ASP.NET,而客户层是支持HTML、CSS、JavaScript的浏览器。具体结构如下:
客户层:浏览器(支持HTML、CSS、JavaScript)
逻辑层:ASP.NET
数据层:数据库(SQL Server)
ASP.NET是基于.NET13框架的Web开发平台。ASP.NET的重要新特性之一是多语言支持。除此之外,还有高性能、可管理高效性等显著特点。在ASP.NET中采用C#语言,它是一种由C和C++衍生出来面向对象的高级程序设计语言。无论是对于简单应用的编写,还是大型商业软件的编写,都是最合适的选择,对于系统后期的完善与改进也极其便利。且ASP.NET可通过Ado.net访问Microsoft SQL Server关系型数据库管理系统。SQL Server是一种客户机/服务器系统,采用T-SQL语句,能帮助系统开发者更好地管理操作数据库。
系统物理结构设计 选课辅助系统需实现基本的数据存储。下面是选课辅助系统中各数据表结构和数据用途,做以解释说明。
1)用户表(表1),存储用户登录的账户、密码及权限类型,其中0代表学生、1代表教师、2代表管理员。
2)学生基本信息表(表2),存储学生的信息资料,如学号、姓名、专业、兴趣爱好等。
3)教师基本信息表(表3),存储教师的信息资料。
4)课程信息表(表4),存储苏州大学通识选修课程的信息。
5)维度分类表(表5),存储各维度关键词。
6)机器自动比对贡献度表(表6),存储机器自动比对的贡献值。
7)人工训练贡献度信息表(表7),人工训练得到的课程贡献值。
8)课程贡献度表(表8),课程最终贡献值参考自动比对的贡献度、人工训练的课程贡献度计算。
9)课程匹配信息表(表9),记录每一位学生在不同维度的匹配课程。
系统算法设计
1)通识选修课程特征参数设置。每门课程可以看作由g个维度、n个课程描述参数(取值范围为大于等于0且小于等于10的实数)组成的二维数组向量,因此,每个课程表示为一个二维数组向量,称为课程贡献向量,用C表示:
专业、兴趣爱好、职业、生活习惯等这g个参数是描述学生对通识选修课程的需求,称为学生需求向量,用S表示:
课程贡献向量和学生需求向量的对应分量须设为同一门课程描述的参数,确保后续计算算法和计算结果有意义。
2)课程推荐机制。
①余弦相似度。计算课程和学生之间的相似度——余弦相似度(CosineSimilarity)。余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0°,两个向量越相似。
余弦相似度计算公式为:
②加权余弦相似度。在实际应用中,对于不同学生来说,维度的参数所占贡献值是不一致的。为解决参数贡献值不均匀的问题,引入权重的概念。某一指标的权重指该指标在整体评价中相对重要程度。权重向量W:
学生需求向量S、待比较的课程贡献向量C及其权重向量W:
③课程推荐机制。教务系统中的所有共m门可选通识选修课程c1,c2,…,cm,组成一个课程集合C={c1,c2,…,
cm},教务系统中的所有共n名在册学生s1,s2,…,sn组成一个学生集合S={s1,s2,…,sn}。对于S中的学生s1,遍历一次整个课程集合C,以该学生对应的多个维度的学生需求向量对每一个课程描述向量进行一次相似度的计算,最终得到g×m×n条记录。
在每组内按相似度降序对所有记录进行排序,序数值越小的记录的课程,就和该学生的需求越一致。
3)机器学习。机器学习需生成训练模型,在生成模型的过程中加载数据并对数据处理以训练模型;若有评估数据,还可对数据模型进行评估,生成各种指标。
采用ML.NET准备加载用于训练数据的模型时,需将数据转化成CSV文件进行加载,再建立模型。训练模型采用矩阵分解(matrix factorization)的机器学习任务。设有一个评分矩阵Rui,其中u代表学生个数,i代表课程个数,学生u对课程i评级为Rui。矩阵分解可将R分解为两个矩阵乘积,即Rui=Puf*Qfi,其中f为隐因子个数,P中一行表示一个学生对各因子喜欢程度,Q中一列表示一门课程隐因子分布概率。两者相乘,最終得出学生对课程的评分:
训练模型的任务是使所有Rui≠0时,rui与最大程度上靠近,即:
同时,为防止Puf与Qfi太极端,需要加一个正则项:
求解上述无约束最优化问题时,用到梯度下降法,在第t+1次时:
系统发布 选课辅助系统的发布利用IIS Web服务器。其通过超文本传输协议(HTTP)传输信息,且提供文件传输协议(FTP)等其他服务,是最广泛使用的服务器之一。被试通过网络终端设备即可访问选课辅助系统,完成相关维度的量表测量后,获得系统推荐的贡献值高的通识选修课程。
4 系统测试
系统测试是系统开发过程中最重要的一环,能确保系统的健壮性和实用性。在测试过程中分别从系统的两类用户使用进行测试。其中管理员子系统通过维护用户信息和数据进行测试,包括添加、删除、查询和修改功能;学生子系统通过更新学生修改的信息和推荐给学生合适选修课程的匹配时长来进行测试。在系统测试结束后,与参与系统测试的学生访谈,获得对系统的改进建议,并在进一步的测试过程中改进系统中的错误和不足。
5 结语
学生利用选课辅助系统选择适切性的通识选修课程,有利于提升学习兴趣和热情,更积极地参加课堂学习,达到更好的学习效果。学生选择到适合的通识选修课程,课堂活跃度被大幅度提升,课堂积极性被充分调动,对通识选修课程的满意度也会大有提升,选修课的质量也会相应提升。学校教务部可以根据系统内部记录的数据进行供给课改革,加大选择量多的通识选修课程的开设,满足学生的需求,也能够更好地管理通识选修课程。
基于大数据的人工智能选课辅助系统的特色在于将大数据技术、人工智能技术运用到高校本科学生选修通识选修课程过程中,利用兴趣爱好、生活方式、就职倾向等维度作为枢纽,搭建起学生与选修课程之间的桥梁,开拓了大数据技术、人工智能技术在教学管理领域的应用。
参考文献
[1]张欢,邹冲.高校选课系统的课程推荐机制研究[J].电子世界,2018(20):91-92.
[2]胡彩.哈佛大学与复旦大学通识教育课程的比较与分析[J].科教文汇,2018(4):34-37.
[3]骆金维,曾德生,潘志宏,等.基于大数据平台的课程教学资源推荐系统应用研究[J].大数据时代,2018(3):44-48.
[4]陶琳.高校通识课程现状与反思:以南开大学为例[J].教育评论,2018(4):38-41.