协同过滤推荐算法原理对大学生互联网阅读的指导

2019-05-14 09:27王希胡玉娇
河南教育·高教 2019年4期
关键词:媒介素养

王希 胡玉娇

摘要:协同过滤推荐算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法原理在大学生阅读中的作用就是通过该算法对大学生阅读的历史数据进行筛选与分析,了解大学生的需求与兴趣,从而将大学生感兴趣的阅读信息主动推荐给大学生。我们可以在协同过滤推荐算法的指导下,通过提高大学生媒介素养、引导大学生主动破除信息“茧房”、平衡广泛涉猎与深度阅读、控制好纸质阅读与互联网阅读的比例等措施,提高大学生互联网阅读的质量。

关键词:协同过滤推荐算法;大学生互联网阅读;媒介素养

大数据信息高速发展的背景下,大学生逐渐成为网络阅读的重要受众。但是在海量的互联网阅读信息中,大学生如何快速找到自己感兴趣的内容,成为当前需要解决的一大问题。协同过滤推荐算法可以通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法原理对大学生阅读的历史数据进行筛选与分析,了解大学生的需求与兴趣,从而将大学生感兴趣的阅读信息主动推荐给大学生,使大学生快速找到自己感兴趣的内容,从而提高阅读的数量与质量。

一、大学生互联网阅读信息推荐系统现状

由于网络信息较为繁杂,在海量的阅读信息面前,大学生群体经常会面临一些问题,如在阅读的时候并不能准确地找到自己感兴趣的内容等。在没有明确的阅读目标时,搜索引擎也难以对大学生的阅读信息进行有效地筛选。

为了使用户在互联网的海量信息中更有效率地找到自己感兴趣的信息,推荐系统便应运而生。推荐系统是一种自动联系用户和项目的工具。与搜索引擎不同的是,推荐系统是通过研究用户的兴趣来实现个性化计算的。推荐系统可以从海量信息中发现用户的兴趣点,帮助用户发现潜在需求。

主流推荐算法主要有基于关联规则的推荐算法、基于内容的推荐算法、协同过滤推荐算法以及混合推荐算法。关于大学生阅读的推荐算法主要是协同过滤算法。本研究以大学生阅读中的信息推荐为例,介绍协同过滤推荐算法原理,及其对大学生互联网阅读的指导。

二、协同过滤推荐算法中的两种推荐算法

协同过滤推荐算法主要包括基于用户的协同过滤算法和基于物品的协同过滤算法两种推荐算法。

(一)基于用户的协同过滤算法

基于用户的协同过滤算法是推荐系统中历史最久远的算法,是推荐系统诞生的里程碑。在大学生互联网阅读中,基于用户的协同过滤算法可以由两个步骤来说明:一是找到和该目标大学生阅读信息兴趣相似的大学生集合;二是找到这个相似集合中大多数大学生都喜欢,且目标大学生没有阅读过的信息内容。

步骤一的关键就在于计算大学生阅读兴趣相似度,给定大学生u和用户v,令N(u)表示大学生u曾经有过正反馈的阅读信息集合,令N(v)为用户v曾经有过正反馈的阅读信息集合。那么,我们可以通过如下的余弦公式简单地计算大学生u和用户v的兴趣相似度:

计算完大学生u和用户V的阅读相似度后,基于用户的协同过滤算法会给大学生u推荐和他阅读信息兴趣最相似的几个信息,以下公式计算了大学生u对阅读信息i的感兴趣程度:

其中,S(u,K)包含和大学生u阅读信息兴趣最接近的K个用户,是对阅读信息i有过正反馈行为的用户集合,Wuv是大学生u和用户v的阅读信息兴趣相似度,代表用户v对阅读信息i的兴趣。如果用户u对物品i有过正反馈行为,即可令rui=1。

根据式2——算出大学生u对阅读信息i的兴趣程度,得到阅读信息推荐列表,根据阅读信息集合中u的兴趣程度进行倒序排序,取前N个阅读信息形成推荐列表,还可以设定兴趣度阈值α,取目标用户兴趣度不小于α的阅读信息组成阅读信息推荐列表R(u)。

(二)基于物品的协同过滤算法

基于物品的协同过滤算法是推荐算法的基础,该算法的原理是向大学生推荐和他们之前阅读过的信息相似度很高的信息。比如,该目标大学生阅读过探索火星的相关科普文章,该算法会推荐NASA的最近研究成果信息。该算法也可以用两个步骤来说明:一是计算各个阅读信息间的相似度;二是对其相似度从高到低进行排序,然后挑选一定数量的相似度较高的阅读信息进行推荐。

这个公式加大了j项的权重,从而降低了流行阅读信息与许多阅读信息相似的可能性。在得到物品之间的相似度后,基于物品的协同过滤算法再使用如下公式来度量大学生u对阅读信息i的兴趣程度Pui

其中N(u)是用户喜欢的阅读信息的集合,S(j,K)是和阅读信息j最相似的K个阅读信息的集合,Wji表示的是阅读信息j和i的相似度,rui表示的是大学生u对阅读信息i的兴趣(如果大学生u对物品i有过正反馈行为,即可令rui=1)。這个公式的含义是,用户对历史感兴趣的项目越相似,就越有可能在用户的推荐列表中获得更高的排名。

根据式4——算出大学生u对阅读信息i的兴趣程度后,得到阅读信息推荐列表,根据阅读信息集合中u的兴趣程度进行倒序排序,取前N个阅读信息形成推荐列表,还可以设定兴趣度阈值α,取目标用户兴趣度不小于α的阅读信息组成阅读信息推荐列表R(u)。

三、对大学生阅读的指导意见

推荐系统虽然为大学生提供了便利,实现了对大学生阅读兴趣精准化、个性化的推荐,但是由于其相似性与闭塞性使大学生的信息接受面较为狭窄。研究者姜小凌、马佳仪曾提出,算法推荐可能引起三大问题:一是信息“茧房”导致视野窄化,二是信息同质导致阅读疲劳,二是信息碎片化导致浅阅读。当然,在改进推荐算法方面,我们可以做些技术革新,以提高推荐能力、完善推荐页面,不只推荐大学生感兴趣的阅读信息,也增加时事热点与朋友感兴趣的阅读信息,逐渐缩小大学生感兴趣的阅读信息比例,从推荐系统算法的角度来尽量避免信息“茧房”的发生。针对以上基于推荐算法可能导致的问题,笔者认为大学生互联网阅读应从以下几个方面进行应对。

(一)破除信息“茧房”,开拓视野

当代大学生面临学习专业性过强的问题,在升入大学选择自己的专业后,多数人只涉猎本专业相关领域的信息。网络阅读本是大学生拓展知识面的重要途径之一,是丰富自身文化素养的有益补充,但是若推荐系统仅采用兴趣相似度作为计算标准,那么将会使大学生的阅读囿于某一方面或某一领域,容易造成视野狭窄。大学生应该提高自身文化素养,接受多方面信息,提高自己阅讀多方面信息的能力,不能故步自封。

(二)缓解阅读疲劳,提升阅读感受

大量高相似度的信息会产生同质化,而阅读者面对大量同质化信息的时候,会产生阅读的审美疲劳,进而导致阅读兴致降低。阅读兴致降低会影响阅读者的阅读信息总量。所以大学生在阅读中要避免产生审美疲劳,避免大量同质化信息的重复性刺激。大学生应该丰富阅读信息的类型,多角度进行阅读刺激,提高阅读感受。

(三)平衡广泛涉猎与深度阅读

破除信息“茧房”和避免信息同质化都需要拓宽信息的入口宽度,扩大知识信息的范围,这样有助于拓展阅读视野和提升阅读感受。但是,在同等阅读量的情况下,广泛涉猎会稀释单种类信息的量,伴随而来的一个问题就是信息的浅阅读。浅阅读往往获得的是碎片化、表面化的信息,无法建构形成全面的、系统的信息体系。所以大学生在广泛涉猎的同时,也要有目的性、指向性、集中性,要设定好广泛阅读与深度阅读的比例,使二者达到平衡,这样既能增加知识的宽度,又能拓展知识的深度。

(四)控制好纸质阅读与互联网阅读比例大学生应拓展多方面信息获取范围,

提高纸质阅读比例。近年,纸质阅读受到了网络阅读的严重冲击,大学生更喜欢在手机、电脑上进行阅读。虽然网络阅读为大学生带来了便捷,但也限制了大学生阅读的全面性。为了实现短时间、大阅读量的目的,大学生通常会选择自己感兴趣的内容来阅读,从而造成了大学生视野窄化,也造成了阅读疲劳。大学生应该加大线下阅读的量,尤其要提高纸质阅读的质与量,多阅读学术性强的专著,接受更多、更全面的信息,以便形成坚实的知识结构。

(五)提高大学生媒介素养,普及推荐算法原理

学校可通过开设相关讲座,不断提高大学生媒介素养。比如,举办网络阅读体验活动等,在大学生中普及推荐算法原理知识,让其认识到协同过滤推荐算法原理对大学生互联网阅读造成的弊端,以及由此带来的视野窄化、阅读疲劳、浅阅读过多等问题。这样他们就能主动跳出局限、广开思路,经常变换阅读角度,降低协同过滤推荐算法原理对大学生网络阅读的影响度。

参考文献:

[1]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.

[2]姜小凌,马佳仪.阅读的“暴力”:对新闻客户端算法推荐的再思考[J].中国出版,2018,(24).

猜你喜欢
媒介素养
“互联网+”背景下大学生媒体素养现状观察与培养对策
城乡初中生媒介素养状况调查
学习型社会视野中的媒介素养教育之思考
新形势下高校网络文化建设管理机制研究
领导干部如何提高媒介素养
基于受众媒介素养的广播新闻节目创新策略探讨
新媒体时代新闻编辑应具备的媒介素养之研究
新媒体背景下中学生媒介素养现状与应对
网络负面热点事件对大学生社会心态的影响
“互联网+”时代高职学生媒介素养的培育路径研究