裘进 李秋霞
摘 要 农业信息的获取对用户农业生产来说至关重要,其直接影响了农民的收入。由于农业具有地域性、季节性等情境特点,再加上用户具有个人偏好上的动态变化,使农业信息推荐的时效性尤为重要。基于此,将农业情境特点、用户搜索浏览行为、用户特征、信息偏好、时间变化等综合考虑,构建面向涉农用户的农业信息个性化推荐服务框架和算法模型。
关键词 农业信息资源;用户兴趣偏好;个性化推荐
中图分类号:TP391.3 文献标志码:B DOI:10.19415/j.cnki.1673-890x.2018.15.109
在信息技术不断发展的今天,农业领域对信息资源的需求也随之增强,掌握农业信息对涉农用户的生产、市场活动有着密切的关系,如何在农业领域相关活动中推进信息化技术的应用,如何利用信息化技术使农业信息需求用户及时获知农业方面的政策法规、前沿技术、市场信息,并提供具有针对性的个性化咨询服务成为了农业信息化推进过程中的一大难题。一方面,农业信息涉及因素较多,结构关系复杂;另一方面,用户快速获取信息的时效性和针对性不强。
目前,信息推荐系统大多是根据用户网络浏览行为进行相关推荐,对用户具体特征、用户偏好及情境因素等考虑较少[1]。事实上,用户对信息的需求是不断变化的,但已有的推荐算法大多停留在静态层面,并未考虑到时间差异对用户偏好的动态改变,用户对信息偏好的兴趣会随着时间推移出现动态漂移,从而在一定程度上引起最终推荐效果的偏差[2]。因此,为解决涉农用户农业信息过载、信息不对称、信息获取效率低等问题,应结合用户情境特点和信息兴趣的偏好变化,建立农业信息个性化推荐的基本流程和算法。
1 农业信息服务的关联因素
1.1 农业信息情境
农业信息推荐服务是以用户为服务对象,信息资源为基础数据,为用户提供个性化信息推荐服务为目标。由于农业信息服务会受到农业领域中相关情境因素的影响,如地域、季节、温度、土壤、光照、市场、种植技术水平等因素,所以农业信息推荐服务具有情境因素的特点。
情境因素的获取是指根据用户所处的具体农业环境和农业生产因素,一方面需获取用户农业信息资源的地理特性、周期性的特点,另一方面通过物联网传感器技术对所处农业领域温度、湿度、土壤等农业生产信息资源进行获取。以上两方面情境因素的获取是对用户不断变化的周围环境信息进行获取处理的过程。
1.2 用户兴趣偏好信息的获取
在农业信息资源推荐中,即使用户在相同的地域、时节、气候、土壤等情景条件下,其信息需求也会有一定差异。因此,如何构建用户对信息需求偏好与已有信息资源之间的关系,是农业信息个性化推荐服务中的重要环节。
本研究主要从用户显式行为信息和隐式信息两方面构建用户对农业信息的兴趣偏好计算模型。显式信息的获取是通过用户主动提供的一些个人基本情况、信息内容偏好、获取信息的方式等多方面来构建用户的兴趣偏好模型。隐式信息的获取是在用户没有主动参与的情况下,通网页信息浏览、网页点击、网页保存、网页打印、服务器端日志数据等操作提取用户兴趣偏好。
1.3 信息个性化推荐技术
在生产应用的各领域中,信息资源数量呈指数式增长,这使得用户无法在最短的时间内快速获取高需求信息,从而导致信息过载、使用效率低下、信息获取成本高等多种问题。本研究采用个性化信息推荐技术以提高农业信息领域信息资源利用率,针对用户个性化的特点和需求,构建以用户为中心的信息推荐服务,从而解决信息过载、搜寻信息针对性较差的问题。基于此,构建的个性化农业信息推荐服务模型主要包含三大模块:农业信息资源数据库、用户兴趣偏好计算、农业信息个性化推荐三个模块,如图1所示。
2 个性化推荐平台总体架构
基于数据获取渠道、数据信息、信息偏好匹配构建了农业信息个性化推荐的服务框架,以为农业信息用户提供信息资源服务,如图2所示。
3 农业信息个性化推荐模型
3.1 用户偏好模型的构建
用户对农业信息的偏好程度可从用户在网页搜索浏览行为上体现,主要包括农业信息网页的点击浏览、访问时长、页面保存、页面打印等行为,农业信息推荐服务模块如图3所示。通过以上行为,可构建用户偏好行为的静态度量模型,故用户对网页信息浏览偏好函数可表示为:
I(m)=φ(f(m),t(m),s(m),p)
f(m)为用户对网页m点击情况函数,t(m)是在网页m上的访问时长,s(m)是对网页保存情况的函数,p(m)是对网页打印情况的函数。上述用户偏好函数模型并未将用户访问农业信息网的时间信息变化考虑在内,基于此,根据实际应用中用户对农业信息的需求与时间推移变化的关系,构建农业信息个性化推荐来契合用户的真实需求。研究发现,用户的兴趣偏好会随着时间而减弱,一般来说,用户对最近的网页浏览兴趣度较高,而对先前的搜索浏览行为兴趣偏好弱化,因此,农户信息偏好的网页信息应该与最近时间搜索浏览的网页相似,于是将用户网页搜索浏览的时间信息融入到偏好度模型中,修正的用户偏好度模型可表示为:
w(u,m)表示基于时间的权重因子,已访问农业信息网页m对用戶u的权重。
进一步利用显式获取和隐式获取的方法,将用户主动提供的兴趣偏好、跟踪用户搜索浏览网页的行为推理出用户偏好,从而获取用户信息需求。此外,将用户情境因素融入模型构建中,得到用户综合兴趣偏好模型:
3.2 推荐算法的实现
通过获取用户相关的情境因素,以及用户在搜索浏览信息过程中显式、隐式信息,利用网页信息偏好度计算得到用户对网页信息的偏好程度,并结合用户偏好推荐公式计算得到的前N篇农业信息网页,并返回给农户,为涉农用户提供农业信息方面的相关推荐。具体算法描述如下。
输入:目标用户u的情境数据,用户u访问过的农业信息资源数据、访问时间。
输出:向目标用户u推荐的N篇兴趣偏好度最高的网页信息。
过程:1)通过传感器、GPRS等互联网终端设备采集用户相关情境信息,形成向量U;2)利用相似度公式计算用户情境因素与待推荐网页信息的相似值,从而获得所需推荐的农业信息,转入f;3)对Web用户日志信息进行挖掘,获取用户大量的网页搜索、浏览行为数据,并对数据进行清洗、去噪、提取等相关处理,再通过熵权计算法,得到目标用户u的行为权重;4)读取目标用户u访问的每个信息资源i的行为数据和访问时间数据,得到基于最近信息浏览的集合C;5)对集合C中用户偏好度值进行标准化处理,计算得出待推荐农业信息与用户情境、浏览行为相匹配的相似度I(A);6)将排序最前、最相关的N篇网页信息推荐给用户。
4 结语
农业信息的个性化推荐系统对于用户和农业信息服务网站来说至关重要,它不仅能够提升用户信息搜索浏览的时间效率,也可帮助农业信息服务网站根据用户群里的需求充分挖掘用户的消费潜力。为了满足用户对农业信息个性化、准确性、高效性的需求,将涉农用户情境因素、网页搜索浏览行为、访问时间、兴趣偏好综合考虑,构建了一个多信息构成的综合推荐模型,并设计个性化农业信息推荐算法,使推荐结果更加符合用户的真实需求。
参考文献:
[1] 王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):66-76.
[2] 邢春晓,高凤荣,战思南,等.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-300.
(责任编辑:赵中正)