大数据分析技术在学分银行信息系统中的应用

2018-12-18 10:16邵文莎
电脑知识与技术 2018年26期
关键词:个性化推荐

邵文莎

摘要:该文将大数据分析技术的常用算法SVD分解的特例UV分解用在了学分银行系统的个性化推荐中,该方法可利用统计上的数据关联查找数据关系,获取有用的信息从而进行精准推荐。

关键词:大数据分析技术;UV分解;个性化推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)26-0245-02

1 概述

在终身学习理念的推动下,许多国家和国际组织都在积极探索在不同类型教育间建立以学习成果认证为主要内容的新型学习管理制度,且已经形成了比较完善的体系,只是各国(地区)对于制度模式的选择不尽相同,在实践上也表现出不同的侧重点。例如,澳大利亚、英国等国家通过建立国家资历框架制度,使正规教育证书与非正规教育证书、学历证书与职业资格证书能够相互承认和沟通;加拿大、美国等国家通过签订校际学分互认协议的方式,建立学分认证制度;韩国则建立了学习成果累积与认证的“学分银行”制度,以鼓励更多非正规高等教育体制的学习者取得大学文凭[1]。近年来,国内关于学习成果认证体系的理论研究在概念梳理、制度设计及模式选择上,取得了一定的成果,各省市也纷纷开始依托开放大学或广播电视大学以区域性学分银行试点模式进行学习成果认证体系的研究与探索,此外,包括开放大学在内的很多高校也在其校内进行学习成果认证体系的探索,学分银行实践也进入重点探索期。

在信息化社会,学分银行信息系统是学习成果信息化管理的重要载体,是进行学习成果认证制度探索的必备要件,而在学分银行平台建立个性化推荐系统,可以有效的向学习者提供学习信息,帮助学习者更好的选择合适的课程,最终推动学习成果认证制度的建立和发展。

2 大数据分析技术与学分银行信息系统

学分银行获取的关于学习者的数据是海量的,因此,我们需要一种有效的方法对于学习者相关的数据进行处理与分析,以正确预测出学习者的需求,并向学习者进行相关课程推荐。而大数据分析技术正是这样一种满足我们需求的技术,它可以对海量数据进行处理,例如分类关联等。分类关联技术不管因果关系,而是直接利用统计上的数据关联查找数据关系,从而提取出有用的信息。

通常情况下,我们很难知道一个学习者希望学习什么课程。这时我们就需要对该学习者的学习信息以及其他学习者的学习信息进行分析,以向该学习者进行合理的课程推荐。该过程与淘宝等网站的商品推荐过程十分相似。

大数据分析技术可以使用数据挖掘技术或是数理统计分析。数据挖掘是一个特定的数据分析技术,专注于建模和知识发现,它以预测为目的而不是纯粹的描述。数理统计分析是运用数理统计学的知识来分析数据,专注于描述数据的特性。

数据挖掘常用算法主要有:ID3算法,k-means,逻辑回归,决策树,SVD分解,随机森林,大规模矩阵运算,以及最近的深度学习技术等。本文正是使用SVD分解中的UV分解算法,对数据进行处理与分析,以提取出所需要的数据。该技术执行简单,对数据需求量不是很高,而且可以进行有效的推荐。因此我们采用该技术应用于我们的学分银行的个性化推荐平台中。

3 SVD分解

SVD分解[2]即奇异值分解,它在很多领域得到了应用,在数据挖掘中主要用来对数据库文件进行归类,该方法主要用于降低数据的维度。

SVD分解的原理如下:

若[小四] 矩阵对角线上的元素均为1,则为SVD分解的一个特例,即为UV分解。本文使用的即是UV分解。

4 UV分解应用于学分银行信息系统的个性化推荐

对于一个学习者来说,感兴趣的课程往往是有关联的。因此我们可以对于学习者以往学过的课程进行分析,以判断学习者可能需要选择的课程,并进行进一步的推荐。

比如,我们可以按照语文、英语、数学、计算机等课程类别对于学分银行平台中的课程进行分类,然后根据学习者的选修情况与调查反馈和满意度评价某类课程的价值。在我们的推荐系统中,我们将课程的价值分为1-5档(数值越大,代表该课程的价值越大,也越可能被学习者选修)。如表1所示, 其中A、B、C、D代表不同的学习者,空白则为未被选修或者已被选修未进行满意度评价的课程。

我们可用一个存在空白项的 n×m的矩阵M对n个学习者的m种不同的选修课程的价值进行描述。例如表1,我们可用一个[4×6] 的矩阵进行描述,我们只需求出空白项的值,即可判定出未被选修课程对于学习者的价值。根据未被选修课程的价值,就能决定优先向选修者推荐哪一类课程。

我们采取UV分解的方式估计矩阵M的空白项的值。

该算法如下所示:

对于一个[n×m] 的矩阵M,我们可假设U为[n×d]的矩阵,V为[d×m]的矩阵(d可取任意的正整数),并对U、V矩阵中的各个元素赋初值(一般情况下,初值均赋为1),令P=UV。然后通过多次调整U、V中各元素的方式,以尽可能使P接近M,我们可用M与P的非空元素的差的平方和作为度量标准,并把该平方和记为均方根误差,即均方根误差越小,则P越接近M。当U、V中所有元素均被且只被调整一次时,可记为一次迭代过程。通过迭代的方式不断更改U、V中的所有元素值,当某一次迭代过程的均方根误差与前一次迭代过程的均方根误差的绝对值小于某一阈值时,则终止迭代过程,确定UV。在这种情况下,该均方根误差可达到一个局部最小值,但局部最小值未必是全局最小值,我们可通过对UV赋以不同的初始值的方式,获得不同的局部最小值,用所有局部最小值中的最小值估计全局最小值,并将此情况下UV的值保存,通过P=UV求出P值,M空白的值就由此时的P值的对应元素估计。这样,就可决定优先选取哪一类数据。

通过反复迭代,我们可以得出UV的数值,进而可以计算出M的数值,包括M空白处的位置的数值。也就是说,我们可以估计出学习者未选择课程的价值,进而决定向学习者推荐的课程。

5 结束语

本文将UV分解用在学分银行信息系统的个性化推荐中,可以为学习者个性化学习需求提供智能化、精准化推荐,可以对学习者的学习方向进行引导,可以提升学习者满意度。

参考文献:

[1] 郝克明.学分认证、转换制度与终身学习——在2016构建终身学习立交桥和学分银行系统学术论坛(南京)上的发言[J].终身教育研究,2017(2):6-10.

[2] Rajaraman A, Ullman J D. Mining of massive datasets[M]. Cambridge University Press, 2012.

[3] 何亮亮.SVD在文本分类中的应用[D].广州:华南理工大學,2012.

[4] 余燕芳,韩世梅.学分银行平台的知识汇聚与个性化推荐系统应用研究[J].中国远程教育,2017(3):45-51.

[5] 汤书波,陈梅艳,李志平.开放教育学分银行系统设计方案探讨[J].电化教育研究,2011(8):78-87. [通联编辑:代影]

猜你喜欢
个性化推荐
基于远程教育的个性化知识服务研究