倪 凌
(河海大学公共管理学院,江苏 南京 210000)
2016年国务院发改委联合多部门印发《关于大力发展农村农业旅游的指导意见》,指出我国未来的方向将大力扶持农业经济和乡村旅游,发展新型农村产业,拓宽农民收入来源[1]。近年来农业旅游的发展给一些地区农民带来了先富路子,提升了城市居民消费者的旅游积极性,为促进城市居民的身心健康发展提供了新思路,是一个双赢的局面。随着移动互联网和5G深入生活的方方面面,互联网思维是新世纪推动经济发展的重要引擎,与互联网信息技术结合是未来社会经济的重要形式和发展方向,农村农业旅游同样需要迎合这一变化[2-3]。目前农村农业旅游项目正在稳步推进中,但是由于农村地区互联网基础设施不够发达,农业旅游从业者互联网信息思维和技术手段落后,对于农业旅游的推广和推荐存在一定困难[4-6]。因此,建立完善的三农服务体系,以互联网+思维贯穿农业电商和旅游资源,解决城市居民选择农业旅游服务方面的难点,具有十分重要的意义。
目前关于农村旅游服务的网络平台虽然已经开始逐步探索和研究,但是大多数平台对于潜在消费者和农业用户的吸引力不够,无法与新兴的电商网络平台相竞争,消费者普遍反映在农业旅游服务过程中无法获取感兴趣的项目和农产品等。针对这一问题,基于网络文本分析,建立了一套深度预测农业服务推荐模型,并将其融入系统开发功能中,为农业旅游服务提供了更加智能化和个性化的推荐方式,提高了用户粘性,能够有效改善当前的农业旅游服务推荐思路和平台设计。
大数据时代对于掌握消费者的消费动机和倾向具有十分明显的优势。对于农业旅游服务项目,通过对其潜在消费群体的分析研究发现,影响农业旅游偏好的两个主要因素分别为农业旅游消费者的倾向决策和选择决策,如果能够对这两个决策规律进行剖析就会获得深层次的农业旅游预测模型[7]。
旅游消费者在游玩期间存在不同的可行性决策行为,主要包括影响旅游决策的因素,如果影响旅游决策的因素越少,那么消费者主动消费的动机越强烈,就会充分提高旅游者的消费欲望和动机。因此基于深度预测的农业旅游服务推荐系统首先应了解农业旅游者的消费动机,适配最心仪的旅游选项。分析旅游倾向问题发现,旅游初期的重要影响因素为旅游时间选择和旅游群体选择。通过收集互联网旅游相关信息的浏览数量,进行统计分析(图1)。
从图1可以发现,农业旅游高峰期主要体现在5月。由分析可知5月是最为繁茂的春季,农业旅游群体主要目的是体验乡村风貌,春季万物复苏是农业旅游和其他旅游最为差异性的优势,在这段时间内选择信息浏览的游客大多倾向于去自然风光较好的地方旅游。另一个较为热门的为10月,10月综合国庆小长假和秋收季节,农业旅游者除了体验农村的秋日风光,更多的是可以购买应季的果实。其他月份例如夏季和冬季选择进行农业旅游的群体相对不活跃,因此在这个时间段进行农业旅游推荐效果不甚显著。从旅游群体来看,农业旅游人群大多集中在家庭和城市中老年,家庭出游主要目的是增进亲子关系,中老年出游主要是放松身心。
图1 不同月份农业旅游相关讯息统计
1)旅游类型
农业旅游类型主要分为农业生活参与型、农业生活体验型、农业生活科普教育型和农业观光采摘型。通过对农业旅游过程中旅游者的目的地进行统计和分析发现,农业旅游类型和目的地主要体现在农家菜、农家乐、农业文化小镇、农村山庄度假村以及农村景点等类型中。
2)出行工具
对农业旅游者的出行方式进行词谱特征分析,筛选出农业旅游者最为青睐的出行方式。对农业旅游过程中的周边游、地域特征游等进行表达分析发现,农业旅游者更倾向于自驾出游、旅行社跟团以及单位集体活动3种模式。其中,团体组织游玩多依赖单位组织的党建、团建活动,活动选择性较小,游玩方式单一,消费意愿不强。
通过对农业旅游者的消费倾向和选择决策进行分析后,建立基于深度预测的农业旅游模型。将农业旅游分为萌芽期、倾向期、选择期、消费期和评价期5个阶段,对每个时期游客可能的选项进行罗列并挑选出更为倾向性的推荐方案,进行信息集成后反馈和获取旅游最为可能的个性化推荐方案(图2)。
图2 农业旅游深度预测模型
前端功能需求主要面向用户,能实现景区浏览、个人信息管理、订单查询、购物车管理、商品浏览、景点咨询和客房预订等功能,并能在平台进行登录注册、付款和订单查询等操作。由于前端功能面向对象是消费者用户,其主要的功能需求集中在购物车管理、游客信息维护、搜索界面推荐以及订单管理等。
后端功能需求主要集中于管理员角色的维护和操作等。根据农业旅游推荐信息化平台的具体特点,本文设计的后端功能应该包括管理员管理、会员管理、商品信息录入、商品订单管理、旅游产品留言、景点信息管理和住宿管理等,每个二级模块均需要实现角色分配、权限修改、编辑更新和删除等基本功能。
1)兼容性
互联网信息技术日新月异,农业旅游系统在今年会集成更多功能,因此系统需要对用户的需求进行不断更新完善,系统兼容性和拓展性需要保证一定的时间迭代优势。企业在对系统进行改进过程中耗费更少的成本,拓展出更为人性化的功能,同时降低对系统改造过程中的影响。
2)效率性
系统应同时能够承受短时间大量用户访问需求,提升用户浏览和操作便捷程度和效率,做到界面简洁直观,系统定位准确,反应迅速,合理优化缓存,满足不同层级客户的使用需求。
3)维护性
系统运行过程中技术人员能够对系统的运行情况进行实时监控和维护,维护操作手册清晰,系统架构简明,建议采用MVC设计模式进行平台开发,不同层面代码尽量减少冲突,功能模块界限明确,便于后期发现问题和针对性维修。
1)用户信息登录方面,需要进行校验码验证,并且需要用户注册,后台用户管理只限于管理员进行修改和添加。
2)重要信息尤其是游客个人信息和金融信息需要进行加密保护,使用MD5信息摘要算法进行计算,将密码摘要存储于数据库中,防止数据库被攻击泄露。
3)用户权限和数据库备份。用户权限需要在Shiro框架内完成管理员信息认证,不同权限用户只显示对应的功能模块,重要信息的修改需要进行短信验证码验证。数据库备份应考虑异地容灾,在本地数据库遭遇破坏时应可以同时调用异地数据库确保系统运行,同时还能够弥补本地数据库的损失并进行同步和维护。
用户推荐系统设计过程中,主要考虑用户、景点和推荐算法三者之间的相互作用机制。个性化推荐算法中目前较为主流的是通过分析用户历史偏好数据,将数据整合后导入兴趣特征模型,从而构建推荐成果,为用户推荐其感兴趣的商品,其主要的实现流程见图3。
图3 推荐算法结构流程
目前较为流行的数据处理方式为协同过滤算法,即寻找用户和对象之间的潜在联系,发掘类似用户群体,从而将感兴趣的群体进行扩散和推荐[8-9]。
1)对用户的历史评价数据进行收集和整合,形成一个用户—对象的评分矩阵。
2)基于皮尔逊相似度模型,对不同用户之间的相似度进行匹配。
3)基于匹配后的相似度计算成果,进行推荐程度排列。
4)基于某一个用户的评分成果,搜索其未评分项目,选择与其相似最为临近的对象进行加权分析获取被推荐用户的预测评分,其算法公式如下:
(1)
式中:M为某一用户对对象的评分值;S为用户对对象的相识度;R为权重值;u和v分别为矩阵的不同象限。
作为农业旅游推荐系统,协同推荐算法应兼顾农业旅游的特征和准确度,同时防止在推荐过程中发生数据空洞和冷启动。因此,本文设计的平台利用农业旅游深度预测模型进行概率分布计算,将其与系统过滤算法结合构成用户历史数据和用户偏好评分矩阵。该算法能够解决用户历史数据不充分和推荐精度较差的问题,还可以解决系统运行初期用户无历史数据从而无法合理进行预测的问题。
1)用户农业旅游偏好因素分析
借助深度预测模型,将用户萌芽期、倾向期、决策期、消费期和评价等5个阶段的旅游因素进行划分,总结出群里、季节、类型、距离、活动等5个类型的标签,构造偏好矩阵。
2)文本处理
利用Python中的jieba分词,将农业旅游景点中的数据添加到list表格中,删除重复字段,采用analsye和TFI函数对关键字进行抓取并生成标签矩阵V。
3)用户偏好概率计算
采用Gibbs抽样方法对景点的偏好标签进行计算和抽样分析,获取景点的主题分布概率和标签分布概率:
(2)
(3)
利用获取用户对景点和标签的偏好概率值,应用贝叶斯定理计算法则进行排序:
(4)
式中:pz为用户对景点偏好的主题分布概率;pw为用户的标签偏好概率;P(z/w)为用户偏好相似度集合;C为集合矩阵总量;α和β分别为抽样点的权重系数。当构造生成用户偏好集合后,便可生成推荐列表。
由于篇幅限制,本文主要对用户操作界面和个性化推荐系统进行展示。当游客进入系统后,首次进入用户可填写注册表单向服务器发送指令,服务器请求接受UserController类,调取UseRserver进行逻辑处理,验证通过后使用MD5算法对用户信息进行加密并保存,其界面如图4所示。
图4 用户登录注册界面
用户进入系统后,系统对用户注册信息和偏好信息进行识别,发现用户注册地是北京,比较偏向亲子游,并且更喜欢的农业旅游景点是农村生活体验,那么系统给用户推荐算法中首先考虑距离北京较近的延庆南湾村、大兴区魏庄村和顺义区河北村的民俗风貌景点,并且给用户推荐了适合亲子游玩的金福艺农番茄联合国以及山水画廊一日游等。系统推荐相识度基本吻合用户兴趣(图5)。
图5 用户个性化推荐景点
将该农业旅游推荐服务平台在某旅游公司中投入试运行,截至2020年12月共运行6个月,接待用户访问量23 444次的系统频率测试,测试基本信息见表1。
表1 系统测试基本信息
本文选取1 080名注册用户进行问卷调查,问卷共发放1 080份,回收1 076份,回收率99%,问卷调查主要内容集中于对该农业旅游系统的推荐满意程度上,统计成果见图6。
图6 用户满意度问卷结果统计
对用户的访问结果分析发现,初期注册用户对系统的满意程度多集中在“满意”和“一般”两个层级,占比约65.2%,非常满意用户占比为14%,对系统不满意的用户占比为12%;注册15 d以后,用户非常满意占比提升至35%,非常不满意的用户数占比依然为12%;注册30 d以后,用户满意程度占比大幅度提升至50%,对系统满意用户占比提升至33%,非常不满意用户占比仅为5%。通过调查分析认为,该系统在游客进行使用过程中逐渐能分析出用户感兴趣的景点并进行精准预测。
为提高农业旅游服务推荐系统的准确性,本文提出基于网络文本分析法的深度预测模型,对系统需求和推荐模块设计进行了详细分析和实践验证。
1)影响农业旅游偏好的两个主要因素分别为农业旅游消费者的倾向决策和选择决策,对这两个决策规律进行剖析能获得深层次的农业旅游预测模型。
2)农业旅游深度预测模型与协同过滤算法结合构成用户历史数据和用户偏好评分矩阵,该算法能够解决用户历史数据不充分和推荐精度较差的问题。
3)通过对系统测试和实践应用发现,初期注册用户对系统体验一般,随着系统使用时间延长,该系统在游客进行使用过程中逐渐能分析出用户感兴趣的景点并进行精准预测。