基于协同过滤算法的农业信息服务个性化推荐研究

2016-03-03 09:30王培培
新教育时代电子杂志(学生版) 2016年24期
关键词:个性化协同目标

王培培

(河北大学管理学院 河北保定 071002)

基于协同过滤算法的农业信息服务个性化推荐研究

王培培

(河北大学管理学院 河北保定 071002)

为解决农业信息服务中农户查找所需信息困难,信息服务平台实用性信息缺乏等问题,文章提出了农业信息个性化推荐的必要性,并且以农业信息服务系统中的地域分块推荐为例引入个性化推荐算法中的协同过滤推荐算法,以期能够在农业信息服务系统中实现个性化推荐,解决农业信息服务中存在的问题。

农业信息服务 个性化推荐 协同过滤算法

我国的农业信息服务基础设施建设已经取得很大进展,农业科技成果也不少,但真正用于生产,产生实际农业经济效益的科技成果应用却不多,特别是在信息利用方面还存在不少制约着农业收益的问题。比如农民实际应用信息不多,信息供给不能满足当地农民实际生产需求等。主要原因就是面对海量的农业信息供给,用户找不到针对自己种植作物的相关方面信息,而且农业生产有明显的地域性,季节性特征,这就使得农业信息服务的水平有待提高。个性化推荐是主动型信息推送服务,能够根据用户需求推荐用户感兴趣的相关信息,使得农业信息服务这一环节做的更加到位,从而加强用户信息利用的效用,增加农业收益[1]。

一、农业信息个性化推荐的必要性

1.服务对象复杂

农业信息服务的受众文化水平参差不齐,一般农民的知识水平都比较低,个性化农业信息推送技术不要求农业从业人员具备专业的背景知识和检索技能,易于被用户接受,使得广大农民朋友足不出户就能享受到优质的农业信息服务。

2.信息传播渠道单一

个性化推荐是实行信息推送的主动信息服务,可以有效缓解文化素质较低的农民用户获取信息方式单一的问题,这也要求推送服务要构建出传播方式灵活的多种传播渠道。

3.针对性不足

农业生产门类众多,地域性,季节性特征明显,一般的农业信息服务系统的针对性较差,满足个性化程度不高,这就要求我们加强农业信息的个性化推荐服务应用[2]。

二、个性化推荐方法

1.地域分块推荐

依据农业地域性特点,中国种植业区可划分为:(1)东北大豆、玉米、甜菜区;(2)北部高原小杂粮、甜菜区;(3)黄淮海棉、油、烟、果区等10个一级区[3]。各个种植区由于作物结构不同,对信息的需求类型也将有所不同,如图所示,农业信息服务个性化推荐可以依据用户所在位置确定用户属于哪个种植区,从而推断用户对哪几种作物的种植信息比较感兴趣,从而缩小备选推荐信息的范围,提高针对性,在此基础上,再根据同一种植区域内的用户兴趣大致相似特点,在备选推荐信息基础上进一步缩小推荐信息范围,把推荐信息限定在用户感兴趣的信息范围内,这一过程可以通过协同过滤推荐算法实现。

2.协同过滤推荐算法

协同过滤推荐与传统的基于内容过滤的推荐不同,它是在用户群中寻找目标用户的最近邻居,然后根据最近邻居对某一信息的评价或浏览记录,来预测目标用户对某一信息的喜好程度,从而为目标用户推荐信息[4]。协同过滤算法分为基于用户的协同过滤、基于项目的协同过滤、基于模型的协同过滤。

在农业信息按地域分块推送的情况下,事先系统就已经把用户分成了很多兴趣不同的模型, 所以只要在模型的基础上进一步缩小推荐信息的范围, 把推荐给用户的信息准确地限定在用户感兴趣的信息范围内就可以了, 所以本文在这里主要介绍的是基于用户的协同过滤推荐算法。基于用户的协同过滤推荐算法是通过比较目标用户的一系列行为选择和其他用户之间的相似性,来识别出一组相互具有相似兴趣偏好的用户——最近邻居,一旦系统识别出目标用户的最近邻居,就将最近邻居感兴趣的信息推荐给当前目标用户,在信息服务推荐系统中应用的基本思想就是:使用与新用户a相似的用户a”对一个对象s的评价来预测s对新用户a的效用,进而判断是否推荐s给a。主要有三个步骤:

一是建立用户-项目评分矩阵,将用户对项目的评分表示成m*n的矩阵r,m代表用户数量,n代表项目数量,rij代表第i个用户对第j个项目的评分值。

二是寻找目标用户的最近邻集合,每个用户u都有一个最近邻集合,通过计算目标用户与其他用户之间的相似度来寻找最近邻,常见的相似度计算方法有余弦相似性、pearson相关系数等。用户之间的相似值计算出来后,就根据用户间的相似值得出目标用户的最近邻集合,确定最近邻居的方法有两种:一种被称作“阈值”策略,即把与目标用户的相似值大于阈值的用户当作最近邻居集合;另一种被称作“Top-N”策略,即将最近邻居与目标用户之间的相似值按从大到小排序,最近邻集合为排在前N位的最相似用户。

三是产生推荐,使用公式计算目标用户对某项目的兴趣度预测值,选取N个最高的预测值项目推送给用户。

通过基于协同过滤算法的个性化推荐,可以把农户所需要的信息及时推送给农户,满足用户对信息的需求。

三、协同过滤算法存在的问题

基于用户的协同过滤也有局限性,计算用户相似度时,是把目标用户的历史行为记录与其他每一个用户的记录进行比较得出的,若一个网站有上百万个用户,且用户数量逐渐增多,每计算一个目标用户都将涉及到上百万次比较,所以扩展性难将成为非常严重的问题。基于项目的协同过滤推荐算法和基于模型的协同过滤推荐算法也会存在数据稀疏性,冷启动等问题。因此,如何克服协同过滤算法中存在的各种问题也是协同过滤推荐算法研究的一个重要课题。

结语

本文只是在农业信息服务系统中的地域分块方法基础上对协同过滤推荐算法的一个小型案例分析,协同过滤算法虽然有一些缺点,但也有一定的优势,例如简单易于理解,能为用户推荐新的感兴趣的信息等,我们也可以把它与其它算法结合起来,取长补短,更好的应用到农业信息服务个性化推荐中,以加强所提供信息的针对性,使得信息能够被更有效的利用。

[1]乔波,聂笑一.基于本体的农业信息服务个性化推送研究[J].安徽农业科学,2013,41(27).

[2]张新香.情境感知和兴趣适应的农业信息推荐模型[J].计算机应用研究,2015,33.

[3]陈诚,廖桂平,史晓慧.农业农村信息服务个性化推送技术[N].中国农学通报, 2011,27(29):151-156.

[4]徐稳.湖南农业信息区域推送关键技术研究[D].湖南农业大学,2013,6.

王培培(1992),女,汉族,河北廊坊人,河北大学情报学硕士研究生,研究方向:信息服务,大数据。

猜你喜欢
个性化协同目标
家校社协同育人 共赢美好未来
蜀道难:车与路的协同进化
坚持个性化的写作
“四化”协同才有出路
新闻的个性化写作
上汽大通:C2B个性化定制未来
三医联动 协同创新
满足群众的个性化需求
新目标七年级(下)Unit 3练习(一)
新目标七年级(下)Unit 4练习(一)